
LLMs têm dificuldade em igualar pesquisadores humanos em teste de replicação de artigos
Os LLMs ainda não se equiparam aos pesquisadores humanos na replicação de artigos científicos O novo benchmark PaperBench da OpenAI revela as limitações atuais da






