Meta recentemente lançou seu maior conjunto de dados químicos impulsionado por IA, chamado OMol25, e também apresentou o modelo de inteligência artificial universal UMA (Universal Atom Model), usado para prever propriedades químicas de moléculas e materiais. Esses avanços visam acelerar áreas-chave como pesquisa de medicamentos, desenvolvimento de baterias e estudo de catalisadores.

De acordo com a Meta, o conjunto de dados OMol25 contém mais de 100 milhões de dados computacionais moleculares de alta precisão, sendo muito maior do que qualquer outro conjunto de dados público anterior. Para criar este recurso gigantesco, a Meta utilizou mais de 6 bilhões de horas de tempo de cálculo. O OMol25 abrange uma ampla variedade de tipos moleculares, incluindo compostos orgânicos pequenos, biomoléculas (como proteínas e fragmentos de DNA), compostos metálicos e eletrólitos. Além disso, o conjunto de dados inclui estados carregados, estados de spin, várias arranjos espaciais (conformações) e informações relacionadas a reações químicas, fornecendo dados detalhados sobre propriedades químicas como energia, forças, distribuição de cargas e orbitais. Atualmente, o conjunto de dados OMol25 está disponível na plataforma Hugging Face.

chipes tecnologia (1)

O modelo UMA, lançado em conjunto com o OMol25, é um novo modelo de IA treinado pela Meta com base no OMol25 e em outros conjuntos de dados. A principal característica do UMA é sua capacidade de prever propriedades químicas no nível atômico, com uma velocidade muito superior aos métodos computacionais tradicionais. Ao contrário dos modelos especializados específicos para tarefas anteriores, o UMA possui generalidade, permitindo lidar com uma variedade de aplicações, desde simulações moleculares (usadas para descobrir fármacos) até pesquisas em materiais e catalisadores. O UMA foi construído com redes neurais gráficas avançadas e utiliza uma arquitetura "mistura de especialistas lineares", equilibrando bem a velocidade de processamento e a precisão das previsões. Em testes de benchmark, o desempenho do UMA já alcançou o nível de modelos dedicados ajustados com cuidado.

A Meta enfatiza que, com o UMA, simulações e cálculos moleculares que antes levavam dias agora podem ser concluídos em segundos. Isso permitirá que os pesquisadores avaliem rapidamente milhares de novas moléculas potenciais antes da síntese laboratorial, tornando o processo de avaliação como fármacos ou materiais de bateria muito mais eficiente. O modelo UMA também está disponível para acesso público na Hugging Face.

Outra inovação apresentada pela Meta é o método de simulação molecular chamado "amostragem acompanhante". Ao contrário dos modelos de IA tradicionais, que geralmente exigem grandes quantidades de dados reais para gerar novas estruturas moleculares, a "amostragem acompanhante" pode aprender e propor novas estruturas mesmo na falta de amostras reais. Essa técnica se inspira em teorias de controle aleatório e processos de difusão, e a equipe da Meta acredita que os processos de difusão são especialmente adequados para simular moléculas. Experimentos mostraram que a "amostragem acompanhante" pode explorar rapidamente uma variedade de variantes de estruturas moleculares com pouca computação e, ao mesmo tempo, as conformações geradas não apenas correspondem aos resultados de software tradicionais, mas ainda superam esses softwares quando lidando com moléculas com componentes flexíveis múltiplos. Os modelos, código e mais informações relacionadas estão disponíveis na Hugging Face e no GitHub.

Embora tenhamos obtido avanços significativos, a Meta também reconhece alguns desafios. Por exemplo, a cobertura de dados ainda não é completa para polímeros, certos metais ou estados de protonação complexos. Além disso, os modelos de IA ainda têm espaço para melhorar suas previsões de propriedades como carga, spin e interações a longo alcance.