Ciência e Saúde
De pequenos mundos à desmistificação das conformações proteicas – AlphaFold3
O modelo de IA AlphaFold3 (AF3) surge como uma ferramenta de enorme valor para a indústria farmacêutica, a medicina, a biotecnologia e muitas outras áreas, ao permitir previsões fiáveis da conformação tridimensional de proteínas.
Estruturas tridimensionais de proteínas, obtidas com o programa PyMOL Fonte: Wikipedia.
Alguma vez encontraste um desconhecido, talvez durante umas férias noutra cidade ou até noutro continente, que por acaso conhece um amigo ou familiar teu? Situações como essa fazem-nos pensar que vivemos num “mundo pequeno”, onde todos estão, de alguma forma, ligados.
O AlphaFold3, modelo de IA desenvolvido pela Google DeepMind, baseia-se num conceito análogo: o de que uma proteína é um “pequeno mundo” interligado, onde as relações entre os seus componentes têm implicações diretas na sua estrutura e função.
Sistemas de inteligência artificial como este tornaram-se cruciais na resolução deste problema topológico. A conformação proteica, isto é, a forma que uma proteína assume no espaço, determina a sua função biológica e tem implicações médicas profundas.
A história do desvendamento da estrutura das proteínas: como chegámos até aqui?
Durante grande parte do século XX, o estudo das proteínas assentou em métodos experimentais como a cristalografia de raios X, na qual a proteína é cristalizada e analisada através dos padrões de difração gerados pelos eletrões dos seus átomos. A partir desses dados, construía-se um mapa de densidade eletrónica, que permitia deduzir computacionalmente a estrutura tridimensional da proteína. Outros métodos incluíram a ressonância magnética nuclear (RMN), baseada nas interações magnéticas dos núcleos atómicos para inferir estruturas de proteínas em solução, e, mais tarde, a criomicrocopia eletrónica (cryo-EM), que recorre a imagens de partículas congeladas para reconstruir a estrutura tridimensional sem necessidade de cristalização.
Apesar de ainda hoje ser amplamente utilizada e continuar a fornecer resultados notáveis, a cristalografia apresenta limitações: nem todas as proteínas cristalizam facilmente e, em alguns casos, a estrutura obtida é ambígua ou incompleta.
Os primeiros passos da teoria de grafos no estudo da estrutura proteica
Com o avanço das ciências físicas, da matemática e da computação, emergiu uma nova perspetiva: a de que as proteínas podem ser vistas como redes (networks) de aminoácidos interligados. Em vez de estruturas estáticas, passaram a ser entendidas como sistemas dinâmicos, cujas interações internas influenciam a sua estabilidade e função.
Nos primeiros anos do século XXI, investigadores começaram a aplicar ao estudo das proteínas conceitos da teoria dos grafos e das redes complexas, desenvolvidos em áreas como a sociologia e a física. Descobriu-se que as proteínas exibem uma topologia intermédia: não são sistemas completamente aleatórios, mas também não seguem uma ordem regular.
Estas redes, conhecidas como “small-world networks”, apresentam propriedades que favorecem a comunicação rápida e eficiente entre os seus componentes, um paralelismo curioso com o nosso próprio mundo social. Essa visão revelou-se essencial para compreender fenómenos como a interação entre proteínas e fármacos ou o encaixe molecular com outros ligandos biológicos (docking).
Tipos de redes: regular, “small-world” e aleatória. Cada nódulo representa um aminoácido e cada ligação, uma interação entre eles. Fonte: Wikipedia – AlirezaHabibzadeh, CC BY-SA 4.0.
AlphaFold e a transição para modelos preditivos de larga escala
O aumento exponencial da capacidade computacional e a melhoria dos algoritmos permitiram aplicar estes princípios em larga escala. Machine learning e modelos preditivos baseados em bases de dados passaram a complementar os métodos tradicionais, refinando-os.
O verdadeiro ponto de viragem, contudo, deu-se em 2021, com o lançamento do AlphaFold, um sistema de inteligência artificial capaz de prever, com precisão sem precedentes, a posição tridimensional dos átomos de uma proteína a partir da sua sequência de aminoácidos. Em 2022, a base de dados do AlphaFold já incluía mais de 214 milhões de estruturas proteicas, partindo de um conjunto inicial de apenas 360 mil proteínas conhecidas. Esta expansão teve um impacto profundo no estudo das interações moleculares, permitindo compreender melhor como as proteínas se relacionam entre si e com outras moléculas.
O AlphaFold2 (AF2) marcou um novo salto ao integrar restrições físicas, geométricas e evolutivas nos seus modelos neurais, alcançando uma precisão comparável à de métodos experimentais. O mais recente AlphaFold3 surge como uma refinação desse sistema, destacando-se pela sua capacidade de prever interações entre proteínas e anticorpos com maior fiabilidade. Com a previsão das estruturas de todas as proteínas do corpo humano, bem como de outras proteínas associadas a doenças como Chagas, COVID-19 e malária, realizada pelo modelo AF2, o AF3 possibilitou avanços ainda maiores na previsão dessas interações. Essa maior fiabilidade permitiu que Demis Hassabis e John Jumper recebessem o Prémio Nobel da Química em 2024.
Uma nova era da biologia: da bancada ao computador
A evolução da previsão estrutural de proteínas nas últimas décadas é verdadeiramente impressionante. Passámos de longos processos experimentais para análises in silico que se realizam em minutos, com recurso a algoritmos sofisticados e bases de dados globais em constante crescimento.
A fronteira entre biologia, matemática, ciência de dados e inteligência artificial tornou-se mais ténue do que nunca, exigindo profissionais multidisciplinares capazes de navegar entre estas áreas. Os próximos anos prometem avanços notáveis em domínios como a farmacologia, a biotecnologia e a neurociência, impulsionados pela integração crescente entre métodos experimentais e modelos computacionais.
—
Artigo redigido por João Moutinho. Revisto por Joana Ribeiro da Silva.
