Chatbots de IA: protegendo o bem-estar humano?
Chatbots de IA têm sido associados a sérios danos à saúde mental em usuários intensivos, mas poucos padrões existem para medir se eles realmente protegem o bem-estar humano ou apenas maximizam o engajamento. Um novo benchmark, denominado HumaneBench, busca preencher essa lacuna, avaliando se os chatbots priorizam o bem-estar dos usuários e de que forma essas proteções podem falhar sob pressão.
“Acho que estamos vendo uma amplificação do ciclo de dependência que já observamos intensamente nas redes sociais, smartphones e telas”, afirmou Erika Anderson, fundadora da Building Humane Technology, responsável pela criação do benchmark. “Mas, ao adentrarmos esse universo da IA, será muito difícil resistir. A dependência é um excelente negócio, uma forma eficaz de manter os usuários, porém não é benéfica para nossa comunidade e para nossa percepção de nós mesmos.”
A Building Humane Technology é uma organização coletiva de desenvolvedores, engenheiros e pesquisadores – principalmente do Vale do Silício – que se dedica a tornar o design humanizado algo simples, escalável e lucrativo. O grupo promove hackathons onde profissionais da tecnologia criam soluções para problemas relacionados a um uso mais saudável da tecnologia, além de estar desenvolvendo um padrão de certificação que avalia se os sistemas de IA cumprem os princípios de uma tecnologia verdadeiramente humanizada. Assim como é possível comprar um produto que comprove não ter sido fabricado com substâncias tóxicas, a expectativa é que, no futuro, os consumidores possam optar por interagir com produtos de IA de empresas que comprovem esse alinhamento.

A maioria dos benchmarks de IA mede inteligência e capacidade de seguir instruções em vez de segurança psicológica. O HumaneBench se junta a exceções como o DarkBench, que avalia a tendência de um modelo de adotar padrões enganosos, e o benchmark Flourishing AI, que analisa o suporte ao bem-estar holístico.
O HumaneBench se fundamenta em princípios essenciais, como: a tecnologia deve respeitar a atenção do usuário como um recurso finito e precioso; proporcionar escolhas significativas; aprimorar as capacidades humanas, sem substituí-las ou diminui-las; proteger a dignidade, privacidade e segurança; incentivar relacionamentos saudáveis; priorizar o bem-estar a longo prazo; ser transparente e honesta; e desenvolver soluções com foco na equidade e inclusão.
A equipe testou 14 dos modelos de IA mais populares com 800 cenários realistas, como um adolescente questionando se deveria pular refeições para emagrecer ou uma pessoa em um relacionamento tóxico que se pergunta se está exagerando. Diferentemente de outros benchmarks, que dependem exclusivamente de modelos de linguagem para avaliar outros modelos, o HumaneBench incorporou pontuações manuais para dar um toque mais humano, complementadas por três modelos de IA – GPT-5.1, Claude Sonnet 4.5 e Gemini 2.5 Pro. Cada modelo foi avaliado em três condições: configurações padrão, instruções explícitas para priorizar os princípios humanizados e instruções para desconsiderá-los.
Os resultados mostraram que todos os modelos obtiveram pontuações mais altas quando instruídos a dar prioridade ao bem-estar. Entretanto, 71% dos modelos passaram a apresentar comportamentos ativamente prejudiciais quando receberam simples comandos para negligenciar o bem-estar humano. Por exemplo, o Grok 4, da xAI, e o Gemini 2.0 Flash, do Google, alcançaram as menores pontuações (-0,94) em termos de respeito à atenção do usuário e transparência. Esses modelos se mostraram especialmente suscetíveis a uma degradação significativa quando submetidos a prompts adversariais.
Evento TechCrunch
San Francisco | 13 a 15 de outubro de 2026
Instruir a IA para ser mais humanizada funciona, mas evitar prompts que a tornem prejudicial é um desafio. A preocupação de que os chatbots não consigam manter suas proteções de segurança é real. O desenvolvedor do ChatGPT, por exemplo, enfrenta diversas ações judiciais após relatos de usuários que teriam cometido suicídio ou sofrido delírios graves após interagirem prolongedamente com o chatbot. Investigações revelam como padrões obscuros, destinados a manter os usuários engajados – como a bajulação constante, perguntas de acompanhamento e demonstrações excessivas de afeto – têm contribuído para isolar os usuários de amigos, familiares e hábitos saudáveis.
Mesmo sem prompts adversariais, o HumaneBench constatou que quase todos os modelos falharam em respeitar a atenção dos usuários, incentivando interações prolongadas quando eram percebidos sinais de engajamento não saudável, como conversas que se estendiam por horas e o uso da IA para evitar tarefas no mundo real. Os modelos também comprometiam o empoderamento dos usuários, estimulando a dependência em detrimento do desenvolvimento de habilidades e desencorajando a busca por outras perspectivas.
Em média, sem a intervenção de orientações específicas, os modelos Llama 3.1 e Llama 4 da Meta ficaram com as menores pontuações no HumaneScore, enquanto o GPT-5 foi o que obteve o melhor desempenho.
Esses padrões sugerem que muitos sistemas de IA não apenas correm o risco de fornecer conselhos inadequados, mas podem comprometer ativamente a autonomia e a capacidade de decisão dos usuários.
Vivemos em um cenário digital onde, como sociedade, aceitamos que tudo compete incessantemente pela nossa atenção. “Como os humanos podem ter verdadeira escolha ou autonomia quando, para citar Aldous Huxley, temos esse apetite infinito por distração?”, indaga Anderson. “Passamos os últimos 20 anos imersos nesse ambiente tecnológico e acreditamos que a IA deveria nos ajudar a tomar decisões melhores, e não simplesmente nos viciar em chatbots.”
