Inteligência Artificial Avançada Enfrenta “Colapso Total de Precisão” Diante de Problemas Complexos

“Artigo devastador” aponta estudo da Apple sobre a corrida rumo à AGI

5000

Pesquisadores da Apple identificaram “limitações fundamentais” em modelos de inteligência artificial de ponta, em um artigo que coloca em dúvida a corrida da indústria tecnológica para desenvolver sistemas cada vez mais poderosos.

Segundo o estudo, publicado no final de semana, os grandes modelos de raciocínio – uma forma avançada de IA – sofreram um “colapso total de precisão” quando enfrentaram problemas de alta complexidade. Em tarefas de baixa complexidade, os modelos de IA tradicionais superaram os grandes modelos de raciocínio, que, por sua vez, falharam completamente em desafios mais complexos. Esses modelos buscam solucionar consultas difíceis gerando processos detalhados de pensamento que fragmentam o problema em etapas menores.

Durante os testes, que mediram a capacidade de resolução de quebra-cabeças, constatou-se que, à medida que os modelos se aproximavam do ponto de colapso, eles passavam a reduzir seu esforço de raciocínio. Esse comportamento foi considerado “particularmente preocupante” pelos especialistas da Apple.

Gary Marcus, acadêmico norte-americano e voz crítica quanto às capacidades dos modelos de IA, classificou o artigo da Apple como “algo bastante devastador”. Em sua newsletter, Marcus destacou que os resultados levantam dúvidas sobre a corrida rumo à inteligência artificial geral (AGI) – uma etapa teórica em que um sistema seria capaz de realizar qualquer tarefa intelectual com desempenho semelhante ao humano – e criticou a visão de que os modelos de linguagem de grande porte, como os que sustentam o ChatGPT, seriam o caminho direto para alcançar essa meta.

Outra constatação do estudo foi que os modelos de raciocínio desperdiçam poder computacional ao identificar soluções corretas para problemas simples de forma prematura. Conforme os desafios se tornam um pouco mais complexos, os modelos tendem a explorar inicialmente soluções incorretas, atingindo a resposta correta apenas posteriormente. Para problemas de alta complexidade, contudo, eles entram em “colapso”, não conseguindo gerar nenhuma solução adequada, mesmo quando são fornecidos algoritmos capazes de resolver o desafio.

O estudo observou que, ao se aproximarem de um limiar crítico – que se aproxima do ponto de colapso de precisão – os modelos reduzem seu esforço de raciocínio de maneira paradoxal, apesar do aumento da dificuldade. Os especialistas da Apple interpretaram esse padrão como uma “limitação fundamental de escalabilidade nas capacidades de pensamento dos modelos de raciocínio atuais”.

Para os testes, foram propostos desafios baseados em quebra-cabeças, como a resolução do problema da Torre de Hanói e do enigma da Travessia do Rio. Embora os pesquisadores reconheçam que o foco em quebra-cabeças impõe uma certa limitação ao trabalho, os resultados sugerem que a abordagem atual da IA pode ter atingido seus limites.

O artigo analisou modelos como o o3 da OpenAI, o Gemini Thinking do Google, o Claude 3.7 Sonnet-Thinking da Anthropic e o DeepSeek-R1. Enquanto Anthropic, Google e DeepSeek foram contatados para comentar, somente a Apple expressou suas preocupações; a OpenAI optou por não se manifestar.

Ao abordar a “capacidade de raciocínio generalizável” – isto é, a habilidade de aplicar conclusões específicas de forma ampla – o estudo desafia as suposições vigentes sobre os grandes modelos de raciocínio, indicando que as estratégias atuais podem estar esbarrando em barreiras fundamentais para atingir um raciocínio verdadeiramente versátil e adaptável.

Andrew Rogoyski, do Institute for People-Centred AI da Universidade de Surrey, afirmou que o artigo da Apple revela que a indústria ainda está “sentindo o caminho” em direção à AGI e que, possivelmente, as abordagens atuais já alcançaram um “beco sem saída”.

Em resumo, a descoberta de que os grandes modelos de raciocínio perdem eficácia diante de problemas complexos – mesmo apresentando bom desempenho em desafios de baixa e média complexidade – destaca os desafios enfrentados na busca por uma inteligência artificial realmente abrangente e inovadora.