
Novo benchmark ARC-AGI-3 mostra que os humanos ainda superam os LLMs em raciocínio básico.
O novo benchmark ARC-AGI-3 foi criado para testar a capacidade dos sistemas de IA em resolver problemas totalmente inéditos. Enquanto os humanos conseguem superar esses







