A inteligência artificial decodifica dados digitais armazenados em DNA em minutos, e não dias
A inteligência artificial pode ler dados armazenados em fitas de DNA em apenas 10 minutos, ao contrário dos dias necessários com métodos anteriores, aproximando o armazenamento em DNA de uma aplicação prática na computação.
“O DNA pode armazenar grandes quantidades de dados de forma extremamente compacta e permanecer intacto por milhares de anos”, diz Daniella Bar-Lev, da Universidade da Califórnia, San Diego. “Além disso, o DNA é naturalmente replicável, oferecendo uma vantagem única para a preservação a longo prazo dos dados.”
No entanto, recuperar as informações codificadas no DNA é um desafio monumental, pois as fitas ficam misturadas e embaralhadas durante o armazenamento. Durante o processo de codificação, as fitas individuais podem ser replicadas de forma imperfeita e alguns fragmentos podem se perder completamente. Assim, a leitura dos dados armazenados em DNA assemelha-se a reconstruir um livro a partir de uma caixa cheia de páginas destruídas e repletas de erros.
“Os métodos tradicionais lutam com esse caos, exigindo dias de processamento”, explica Bar-Lev. “A nova abordagem otimiza esse processo com uma IA treinada para identificar padrões no ruído.”
Bar-Lev e sua equipe desenvolveram um método baseado em IA, chamado DNAformer, capaz de decodificar rapidamente e com precisão sequências de DNA embaralhadas. O sistema conta com um modelo de aprendizado profundo treinado para reconstruir as sequências, um algoritmo adicional que identifica e corrige erros e um terceiro algoritmo de decodificação que converte tudo de volta em dados digitais, corrigindo eventuais falhas remanescentes.
Em experimentos, o DNAformer leu 100 megabytes de dados armazenados em DNA quase 90 vezes mais rápido do que o método mais ágil anterior – desenvolvido com algoritmos baseados em regras tradicionais –, mantendo uma precisão melhor ou comparável. Entre os dados decodificados estavam uma imagem colorida de tubos de ensaio, um clipe de áudio de 24 segundos com o famoso discurso de aterrissagem lunar do astronauta Neil Armstrong e um texto detalhando por que o DNA é um meio promissor para armazenamento de dados.
A equipe planeja desenvolver versões do DNAformer adaptadas às novas técnicas de codificação de dados em DNA, conforme destaca Omer Sabary, do Instituto de Tecnologia Israelense (Technion). “Crucialmente, como nossa abordagem não depende de métodos específicos de síntese ou sequenciamento de DNA, ela pode ser adaptada a tecnologias futuras, ainda não desenvolvidas, que possam ser mais comercialmente viáveis.”
Publicação: 21 de fevereiro de 2025
Referência: Nature Machine Intelligence DOI: 10.1038/s42256-025-01003-z