Enquanto muitos temem um futuro em que a mídia gerada por IA se torne indistinguível da mídia tradicional, destruindo a sociedade e/ou a civilização no processo, ainda não chegamos lá. A exposição A vem na forma de um comercial surreal de cerveja gerado por IA que se tornou viral no fim de semana.

Intitulado “Synthetic Summer” (verão sintético), o vídeo de 30 segundos apareceu pela primeira vez no Instagram há cerca de uma semana, criado por Helen Power e Chris Boyle, de uma empresa de produção sediada em Londres chamada Privateisland.tv. O par não estava disponível para comentários antes desta história ser publicada, mas a julgar pela aparência do vídeo, parece que eles provavelmente o criaram usando o novo modelo de IA Gen-2 da Runway, que pode criar clipes de vídeo curtos com base em instruções escritas semelhantes a como a Stable Diffusion pode criar imagens estáticas.

Comercial de cerveja gerado com inteligência artificial

No vídeo, definido para uma multidão estridente e “All Star” do Smash Mouth, vemos simulacros de pessoas festejando em um churrasco estereotipado de quintal americano, ocasionalmente se fundindo fisicamente com vasos de cerveja impressionistas. As mulheres riem, mandíbulas ardendo. Copos de cerveja se transformam em latas de cerveja. Grelhas flamejantes alcançam o status de tornado de fogo colunar e arco em todo o quintal. É uma visão do inferno surrealista que é ao mesmo tempo familiar e impressionantemente estranha.

Por que é tão estranho? Atualmente, os geradores de vídeo com IA ainda são primitivos. À medida que seus criadores treinam os modelos, eles estão trabalhando a partir de um conjunto muito menor de material de origem do que os modelos de síntese de IA de imagem estática, e os modelos são dramaticamente mais caros computacionalmente para executar. A visão impressionista dos comerciais de cerveja provavelmente vem da absorção da essência dos comerciais de cerveja reais no conjunto de dados da Gen-2. A Runway não divulgou o conjunto de dados usado para treinar a Gen-2, mas no artigo para a Gen-1 (um modelo anterior), citou “um conjunto de dados interno de 240 MILHÕES de imagens e um conjunto de dados personalizado de 6,4 milhões de videoclipes”.

Nós experimentamos com Gen-2 (que está atualmente em uma fase de testes fechada), e gerar até mesmo estranhamente clipes alienígenas como estes ainda exigem persistência humana, correndo e descartando muitas gerações para obter até mesmo um resultado OK. Mesmo assim, o clipe resultante tem apenas alguns segundos de duração. No caso do verão sintético, Privateisland.tv gerou os clipes, selecionou os melhores e juntou os segmentos em uma sequência, adicionando música e efeitos sonoros.

Mas espere, a cerveja não é o único produto que está sendo anunciado ficcionalmente pela IA para fins meméticos. Em 24 de abril, alguém chamado “Pizza Later” twittou um vídeo em grande parte gerado por IA para um restaurante fictício chamado “Pepperoni Hug Spot“, que inclui vídeos distorcidos de pessoas comendo pizza gerada pelo Gen-2 da Runway. Além disso, seu criador supostamente gerou o script com GPT-4, usou Midjourney para imagens estáticas e uma narração da Eleven Labs. Eles montaram tudo usando o Adobe After Effects.

Ambas as peças, iniciadas por humanos e montadas por humanos, mostram que a IA geradora ainda tem um longo caminho a percorrer antes de poder deslumbrar autonomamente as massas com memes que alteram a sociedade. As pessoas ainda estão ao volante dessas obras alienígenas e, a partir disso, podemos potencialmente ter alguma aparência de conforto.

Ainda assim, nenhum vídeo pode igualar a pureza e majestade de Will Smith gerado por IA comendo espaguete, que viverá para sempre em nossos corações como nosso primeiro pesadelo de meme de vídeo gerado por IA.