Recentemente, o Arc Institute, em colaboração com a NVIDIA e pesquisadores das universidades de Stanford, Berkeley e da Califórnia em São Francisco, lançou o Evo2, o maior modelo de inteligência artificial biológica do mundo. Treinado com dados de mais de 128.000 genomas, abrangendo 9,3 trilhões de nucleotídeos, sua escala se compara aos modelos de linguagem de IA generativa mais poderosos.
A capacidade de aprendizado profundo do Evo2 permite a rápida identificação de padrões em sequências genéticas de diferentes organismos, eliminando a necessidade de anos de trabalho por parte dos pesquisadores. O modelo consegue identificar com precisão mutações que causam doenças humanas e tem a capacidade de projetar novos genomas com tamanho comparável ao de genomas de bactérias simples. A equipe de desenvolvimento do Evo2 anunciou a publicação de detalhes completos do modelo e o lançamento de uma interface amigável chamada Evo Designer em 19 de fevereiro de 2025. O código do Evo2 já está disponível publicamente no GitHub do Arc e integrado à estrutura BioNeMo da NVIDIA para acelerar o progresso da pesquisa científica.
Em comparação com seu predecessor, o Evo1, o Evo2 expandiu o escopo dos dados, incluindo dados de bactérias, arqueias, vírus e eucariotos, como humanos e plantas. Os pesquisadores afirmam que o desenvolvimento do Evo2 marca um momento importante no campo da biologia generativa, permitindo que as máquinas "leiam, escrevam e pensem" na linguagem dos nucleotídeos.
Do ponto de vista técnico, o Evo2 foi treinado na plataforma de IA NVIDIA DGX Cloud usando mais de 2.000 GPUs NVIDIA H100. O modelo consegue processar sequências genéticas de até 1 milhão de nucleotídeos de uma só vez, permitindo a compreensão das relações entre partes distantes do genoma. A nova arquitetura de IA "StripedHyena2" permite que o Evo2 processe 30 vezes mais dados do que o Evo1.
O Evo2 apresenta amplas perspectivas de aplicação, mostrando-se excelente na análise de variações genéticas relacionadas à função de proteínas e à adaptação de organismos. Em testes com variantes do gene BRCA1, relacionado ao câncer de mama, o Evo2 previu mutações com mais de 90% de precisão. Essas descobertas podem reduzir significativamente o tempo e os custos de laboratório, impulsionando o desenvolvimento de novos medicamentos.
Além disso, o Evo2 pode auxiliar no projeto de novas ferramentas biológicas ou tratamentos. Por exemplo, cientistas podem projetar terapias gênicas direcionadas a células específicas, minimizando os efeitos colaterais. A equipe de pesquisa acredita que, no futuro, modelos de IA mais específicos podem ser construídos com base no Evo2, oferecendo ainda mais possibilidades para a pesquisa genômica e a bioengenharia.
Em relação aos riscos éticos e de segurança, os pesquisadores garantiram que o conjunto de dados do Evo2 não inclui patógenos nocivos para humanos e outros organismos complexos, assegurando o desenvolvimento e a implantação responsáveis dessa tecnologia.
Detalhes do Evo2: https://arcinstitute.org/news/blog/evo2
Destaques:
🌱 O Evo2 é o maior modelo de IA biológica do mundo, treinado com dados de 128.000 genomas.
🔍 O modelo consegue identificar rapidamente mutações causadoras de doenças e projetar novos genomas, aumentando significativamente a eficiência da pesquisa.
💡 O Evo2 oferece novas possibilidades para a bioengenharia e o projeto de terapias gênicas futuras.