O modelo de IA o3 da OpenAI pontua mais baixo em um benchmark do que a empresa havia inicialmente sugerido

De vez em quando, uma startup do Vale do Silício surge com uma missão tão “absurda” que é difícil discernir se a empresa é real ou se trata de sátira. Esse é o caso da Mechanize, uma startup cujo fundador – e da organização sem fins lucrativos de pesquisa em IA que criou, chamada Epoch – vem sendo duramente criticado no X após o anúncio.

As críticas abrangem tanto a missão da startup quanto a implicação de que ela macula a reputação do seu renomado instituto de pesquisa. Um diretor do instituto inclusive comentou no X: “Yay just what I wanted for my bday: a comms crisis.”

A Mechanize foi lançada na última quinta-feira por meio de uma postagem no X feita pelo renomado pesquisador de IA, Tamay Besiroglu. Segundo ele, o objetivo da startup é “a automação total de todo o trabalho” e “a automação completa da economia”.

Isso significa que a Mechanize está empenhada em substituir cada trabalhador humano por um agente automatizado de IA. Em essência, a startup pretende fornecer os dados, as avaliações e os ambientes digitais necessários para viabilizar a automação de qualquer função laboral.

Besiroglu chegou a calcular o mercado endereçável total da Mechanize agregando todos os salários atualmente pagos aos trabalhadores. “O potencial de mercado aqui é absurdamente grande: os trabalhadores nos EUA recebem, no total, cerca de US$ 18 trilhões por ano. Para o mundo inteiro, o número é mais de três vezes maior, em torno de US$ 60 trilhões por ano”, escreveu ele.

Apesar disso, o pesquisador esclareceu que o foco imediato da empresa está voltado para funções de colarinho branco, e não para trabalhos manuais que exigiriam o uso de robótica.

A reação à startup foi, muitas vezes, bastante severa. Como exemplificou o usuário do X, Anthony Aguirre, “Tenho enorme respeito pelo trabalho dos fundadores da Epoch, mas é triste ver isso. A automação da maior parte do trabalho humano é, de fato, um prêmio gigante para as empresas, razão pela qual muitas das maiores companhias do mundo já estão investindo nessa tecnologia. Acredito que isso representará uma grande perda para a maioria dos humanos.”

No entanto, a controvérsia não se resume apenas à missão da startup. O instituto de pesquisa em IA, Epoch, de Besiroglu, analisa o impacto econômico da inteligência artificial e cria benchmarks para medir o desempenho dessas tecnologias. Sempre considerado um meio imparcial de verificar as reivindicações de desempenho dos criadores de modelos de ponta, o instituto já se viu no centro de debates.

Esta não é a primeira vez que a Epoch se envolve em controvérsias. Em dezembro, a organização revelou que a OpenAI havia apoiado a criação de um dos seus benchmarks de IA, o qual foi posteriormente utilizado pelo fabricante do ChatGPT para lançar seu novo modelo o3. Usuários nas redes sociais criticaram a falta de transparência sobre essa relação.

Quando Besiroglu anunciou a Mechanize, o usuário do X Oliver Habryka comentou: “Infelizmente, isso parece confirmar, de forma aproximada, que a pesquisa da Epoch estava sendo diretamente incorporada ao desenvolvimento de capacidades de ponta, embora eu tivesse esperança de que não viesse literalmente de você.”

Besiroglu afirma que a Mechanize conta com o apoio de nomes ilustres, entre eles Nat Friedman, Daniel Gross, Patrick Collison, Dwarkesh Patel, Jeff Dean, Sholto Douglas e Marcus Abramovitch. Friedman, Gross e Dean, no entanto, não retornaram aos pedidos de comentário. Marcus Abramovitch, sócio-gerente do fundo hedge cripto AltX e autodenominado “altruísta eficaz”, confirmou que investiu na startup. Segundo ele, “a equipe é excepcional em muitas dimensões e pensou de maneira mais profunda sobre IA do que qualquer pessoa que eu conheço.”

Bom para os humanos também?

Ainda assim, Besiroglu defende, para os seus críticos, que a substituição do trabalho humano por agentes de IA poderá, na verdade, enriquecer as pessoas, proporcionando um “crescimento econômico explosivo”. Ele faz referência a um artigo publicado sobre o tema.

“Automatizar completamente o trabalho pode gerar uma abundância imensa, padrões de vida muito mais altos e novos bens e serviços que nem sequer conseguimos imaginar hoje”, afirmou o pesquisador.

Isso pode ser verdade para aqueles que detêm os agentes – isto é, se os empregadores optarem por pagar por eles em vez de desenvolvê-los internamente (presumivelmente, utilizando outros agentes).

Por outro lado, essa perspectiva otimista ignora um fato básico: se os humanos ficarem sem emprego, não terão renda para adquirir todos os produtos e serviços que os agentes de IA forem capazes de produzir.

Mesmo assim, Besiroglu argumenta que os salários dos trabalhadores em um mundo automatizado por IA podem até aumentar, já que esses profissionais se tornarão “mais valiosos em funções complementares que a IA não consegue desempenhar”.

Contudo, vale lembrar que o objetivo é que os agentes assumam todas as tarefas. Sobre essa questão, ele explicou: “Mesmo em cenários onde os salários possam diminuir, o bem-estar econômico não é determinado unicamente pelos salários. As pessoas normalmente obtêm renda de outras fontes – como aluguéis, dividendos e auxílios governamentais.”

Assim, talvez a maioria de nós venha a ganhar a vida com investimentos em ações ou imóveis. Caso contrário, sempre haverá o auxílio governamental – supondo que os agentes de IA passem a contribuir com impostos.

Embora a visão e a missão de Besiroglu sejam, sem dúvida, extremas, o desafio técnico que ele busca resolver é legítimo. Se cada trabalhador humano contar com uma equipe pessoal de agentes que o ajude a produzir mais, é possível que a abundância econômica se concretize. E o pesquisador não erra por menos de uma coisa: um ano após o advento dos agentes de IA, ele observa que eles não funcionam muito bem, sendo pouco confiáveis, não retendo informações, tendo dificuldades para completar tarefas de forma independente e “não conseguindo executar planos de longo prazo sem se desviar”.

Entretanto, Besiroglu não está sozinho na busca por soluções. Grandes empresas como Salesforce e Microsoft já estão desenvolvendo plataformas baseadas em agentes, e a OpenAI também está investindo nessa área. Além disso, diversas startups especializadas em agentes têm surgido – desde aquelas focadas em tarefas específicas, como vendas externas e análise financeira, até empresas que trabalham com dados de treinamento ou na economia de preços desses agentes.

No momento, Besiroglu deixa claro: a Mechanize está contratando.