
Novo benchmark mostra que os LLMs ainda não conseguem fazer pesquisas científicas reais.
Novo benchmark mostra que LLMs ainda não conseguem conduzir pesquisas científicas de verdade Os pesquisadores apontam que essa lacuna de desempenho se deve a uma



