Meta apresenta OMol25 e UMA, novas ferramentas de IA abertas para pesquisa molecular

Meta lançou OMol25, o maior conjunto de dados abertos até o momento para química impulsionada por IA, e apresentou a UMA, um modelo de IA universal concebido para prever propriedades químicas de moléculas e materiais.

OMol25 contém dados de mais de 100 milhões de cálculos moleculares de alta precisão – superando em muito o tamanho de qualquer conjunto de dados abertos anterior na área. Segundo a Meta, a criação desse conjunto exigiu mais de 6 bilhões de horas de supercomputação. O conjunto abrange uma ampla variedade de moléculas, desde compostos orgânicos simples e biomoléculas (como fragmentos de proteínas e segmentos de DNA) até complexos metálicos e eletrólitos. Ele inclui estados carregados e de spin, múltiplas conformações (arranjos espaciais) e reações químicas.

O objetivo é ajudar os modelos de IA a aprender como as moléculas se comportam em diferentes cenários. OMol25 está disponível para aplicações como descoberta de fármacos, desenvolvimento de materiais para baterias e pesquisas em catalisadores. Além dos valores de energia e força, o conjunto oferece detalhes adicionais como distribuições de carga, orbitais e outras propriedades químicas.

Disponível em Hugging Face.

UMA: Um Modelo de IA Universal para Moléculas e Materiais

Junto com o OMol25, a Meta está lançando a UMA (Universal Model for Atoms), um novo modelo de IA treinado com o OMol25 e outros conjuntos de dados. A UMA é capaz de prever propriedades químicas em nível atômico e, segundo a Meta, realiza essas previsões com uma velocidade muito superior aos métodos tradicionais.

Ao contrário dos métodos anteriores que exigiam um modelo especializado para cada tarefa, a UMA abrange uma ampla gama de aplicações – desde simulações moleculares (como para a descoberta de fármacos) até pesquisas em materiais e catalisadores. O modelo é construído com redes neurais de grafos modernas e utiliza uma arquitetura de “Mistura de Especialistas Lineares” que combina velocidade com alta precisão. Em testes comparativos, a UMA alcançou resultados que, até então, só eram possíveis com modelos especializados e ajustados.

Com a UMA, simulações e cálculos que antes levavam dias agora podem ser concluídos em segundos. A Meta afirma que isso pode permitir que pesquisadores façam a triagem de milhares de novas moléculas quanto ao seu potencial como fármacos ou materiais para baterias, antes mesmo que seja necessária a síntese em laboratório.

Os modelos da UMA estão disponíveis em Hugging Face.

Novos Métodos para Simulações Rápidas com IA

Os modelos tradicionais de IA geralmente precisavam de grandes quantidades de dados para gerar novas estruturas moleculares. A Meta agora apresenta o método “Adjoint Sampling”, que permite que os modelos de IA aprendam e proponham estruturas inéditas mesmo na ausência de exemplos do mundo real.

Essa técnica baseia-se em conceitos da teoria de controle estocástico e utiliza processos de difusão, os quais a equipe da Meta afirma serem especialmente adequados para a simulação de moléculas. O Adjoint Sampling possibilita a rápida exploração de diversas variantes estruturais com apenas alguns cálculos.

Em testes iniciais, o método foi capaz de gerar conformações moleculares que não apenas corresponderam, mas muitas vezes superaram o desempenho dos softwares tradicionais – especialmente para moléculas com múltiplos componentes flexíveis.

O modelo, o código e mais informações estão disponíveis em Hugging Face e GitHub.

Desafios Abertos

Apesar desses avanços, a Meta ressalta que ainda existem desafios a serem superados. Algumas áreas da química – como polímeros, certos metais ou estados complexos de protonação – ainda não estão completamente abrangidas. Além disso, os modelos de IA precisam aprimorar sua capacidade de prever cargas, spins e interações de longo alcance.