No videoclipe de seu último single “DTDTGMGN”, os membros da banda sul-coreana Eternity dançam em tempo perfeito com uma batida pop chiclete em uma sala rosa neon decorada com uniformes escolares e pôsteres de celebridades. Os movimentos de câmera vertiginosos e as mudanças de cena rápidas são típicos do gênero K-pop que se tornou um fenômeno global nos últimos anos.

“Me segura com força, encosta no meu ombro”, canta um integrante.

Mas os fãs do grupo não podem fazer nenhuma dessas coisas, fisicamente falando – porque nenhum dos 11 colegas de banda do Eternity é real.

Construído usando tecnologia de IA, o Eternity é um dos mais recentes atos sul-coreanos que ultrapassam a fronteira entre entretenimento real e virtual. E a criadora e empresa de gerenciamento do grupo, Pulse9, acredita que as estrelas geradas por computador têm uma vantagem significativa sobre suas contrapartes da vida real.

Tal como acontece com a maioria dos grupos populares de K-pop, os membros do Eternity incluem um líder de grupo, vocalistas, rappers e dançarinos. Mas um membro em particular, Zae-in, pode fazer tudo. “Zae-in tem (uma combinação de) características que a maioria dos artistas humanos teria dificuldade em realizar”, disse o CEO da empresa, Park Ji-eun. “Ela sabe cantar muito bem, fazer rap muito bem e pode ser criativa como designer (de moda). E ela é uma atriz nata.”

Com a ajuda da tecnologia de troca de rostos em tempo real e uma voz gerada por IA, Zae-in é interpretada por 10 pessoas diferentes, incluindo atores, cantores e dançarinos, que emprestam seus talentos para seu avatar conforme necessário. Em um vídeo postado na conta de Zae-in no Instagram, por exemplo, ela monta habilmente um longboard ao lado do rio Han, em Seul. Para o vídeo, seus criadores filmaram a façanha com um stand-in cujo rosto foi posteriormente trocado por Zae-in.

“Há a música pop Zae-in, a atriz Zae-in, a repórter Zae-in”, disse a estrela virtual à CNN em uma entrevista por Zoom, durante a qual foi interpretada por um ator (embora o Pulse9 tenha dito que seu software de IA pode recriar a voz de Zae-in e gerar fala sem a entrada humana). “Existem vários Zae-ins, então nossa vantagem única é que podemos fazer o que uma pessoa não pode.”

“A única coisa que não podemos fazer é dar um autógrafo”, acrescentou, com os olhos sorridentes.

A troca de rostos em tempo real e as primeiras formas de tecnologia “deepfake” existem há quase uma década. Nesse período, influenciadores virtuais como Lil Miquela e o próprio sul-coreano Rozy ganharam grandes seguidores online nos espaços de moda e música.

Mas os últimos avanços em vídeo e áudio gerados por IA estão tornando mais fácil para empresas como a Pulse9 criar personagens virtuais convincentes, enquanto os avanços em programas de IA generativa como o ChatGPT estão eliminando a necessidade de estrelas como Zae-in serem “jogadas” por qualquer pessoa.

Como foram feitas

A equipe da Pulse9 começou o processo de dar “vida” à eternidade projetando a aparência de seus membros. A equipe de Park gerou 101 rostos digitais únicos, inspirados em celebridades coreanas existentes, antes de dividi-los em quatro categorias – apelidados de “sexy”, “bonito”, “inteligente” e “inocente” – e reduzir a seleção para 11 por meio de uma enquete online.

Usando tecnologia deepfake e captura de movimento, o Pulse9 produziu o primeiro videoclipe da banda (para acompanhar a faixa ironicamente intitulada “I'm Real”) em 2021. A reação ao vídeo foi mista. Muitos usuários de mídia social sentiram que as expressões faciais dos membros da banda pareciam antinaturais e divorciadas de seus corpos, enquanto outros citaram o efeito “uncanny valley”, pelo qual os espectadores ficam desconfortáveis com coisas que se assemelham a humanos, mas não são.

Mas cinco meses depois, quando o Pulse9 lançou o próximo videoclipe do Eternity, “No Filter”, os seguidores notaram que o grupo era quase indistinguível da coisa real. “Estou surpreso como eles soam realistas, e os visuais parecem mais realistas do que a música de estreia”, diz o comentário mais curtido no YouTube.

O grupo de 11 membros Eternity foi criado pela empresa sul-coreana de gerenciamento de música, Pulse9.

“DTDTGMGN”, que saiu em outubro passado, representou outro grande salto de qualidade. “Até o ano passado, o rosto era a única parte virtual do artista, mas hoje podemos fazer (imagens) de corpo inteiro com base na tecnologia de IA”, disse Park, acrescentando que “No Filter” também foi composta usando IA (embora os humanos tenham editado a música e escrito a letra).

A SM Entertainment, agência por trás de megaestrelas do K-pop como Super Junior, Girls' Generation e Exo, entre outras, também vem experimentando IA. Em 2020, a empresa estreou o Aespa, grupo formado por quatro artistas humanos e seus pares virtuais. Após o lançamento da banda, o fundador da SM, Lee Soo-man, declarou que o futuro do entretenimento é “celebridade e robô”.

Em outro lugar, a empresa de gerenciamento do BTS, Hybe, usou IA para ajustar a pronúncia e o tom de seu cantor, antes de lançar uma de suas músicas em seis idiomas – coreano, inglês, espanhol, chinês, japonês e vietnamita.

E no início deste ano, a Metaverse Entertainment, uma agência formada pela editora de videogames Netmarble e a empresa-mãe da SM Entertainment, Kakao Entertainment, estreou um grupo feminino virtual, o MAVE. Ao contrário de Eternity, que se baseia em trocas de rosto diretas, os quatro membros do MAVE foram gerados do zero usando CGI.

Os membros do quarteto de K-pop MAVE podem cantar, dançar e falar vários idiomas - tudo com a ajuda da IA.

A Metaverse Entertainment usou tecnologia de IA para gerar rostos, mesclando os recursos e penteados considerados mais desejáveis em quatro personagens finais. A empresa empregou tecnologia de captura de movimento para gravar performances de K-pop da vida real que um programa de aprendizado profundo usou para animar videoclipes. Os vocais do grupo são parte humanos e parte gerados por IA, disse o diretor técnico da Metaverse Entertainment, Kang Sung-ku.

“Nosso objetivo é criar humanos virtuais totalmente orientados por IA (que sejam) realmente críveis”, disse ele à CNN.

O videoclipe do primeiro single do MAVE, “Pandora”, já acumula 25 milhões de visualizações no YouTube desde seu lançamento em janeiro.

O futuro do K-pop?

Os popstars virtuais podem desfrutar de uma vantagem sobre os humanos quando se trata de se envolver com suas bases de fãs. Os avanços nos programas de linguagem de IA podem tornar possível que os fãs “falem” com – e até mesmo construam seu próprio relacionamento pessoal com – seus ídolos, disse Kang.

“Eles vão se lembrar do que falamos ontem e podem continuar falando sobre coisas de (conversas anteriores)”, disse ele, fazendo uma comparação entre as criações de IA de sua empresa e a assistente virtual do iPhone, a Siri. “Eles vão se lembrar de você e saber sobre você – e eles vão conversar (com você) com base nessas informações.”

A Metaverse Entertainment já está experimentando essa ideia por meio de aplicativos que permitem que os usuários interajam diretamente com o MAVE. Os membros da banda atualmente falam coreano, inglês, francês e indonésio – indicativo de bases de fãs importantes e mercados-alvo – embora eles pudessem teoricamente falar qualquer número de idiomas.

“Há algumas coisas que não posso dizer (até mesmo meus melhores amigos), mas talvez eu pudesse dizer uma IA personalizada, que pode me confortar e se importar comigo”, disse Kang. “Acho que vai ser bom para todo mundo.”

Zae-in, da Eternity, disse à CNN que a "vantagem única" das estrelas virtuais é que elas "podem fazer o que uma pessoa não pode".

Zae-in, da Eternity, disse à CNN que a “vantagem única” das estrelas virtuais é que elas “podem fazer o que uma pessoa não pode”.

O desenvolvimento certamente pode ser bom para empresas como a de Kang. A indústria do K-pop é sustentada por um sistema de trainee trabalhoso, no qual os aspirantes são moldados desde jovens, muitas vezes passando por anos de aulas caras de dança e música antes de estrear. (De acordo com o Wall Street Journal, a SM Entertainment gastou aproximadamente US$ 3 milhões levando Girls Generation ao mercado em 2007.) As agências devem investir em aulas, espaço de estúdio, styling e, às vezes, até procedimentos estéticos para potenciais membros da banda – custos não exigidos para talentos virtuais.

Além disso, estrelas pop geradas por computador nunca adoecerão, envelhecerão ou se envolverão em disputas contratuais ou escândalos de tabloides. Mas há pouca chance de grandes agências substituírem suas bandas da vida real tão cedo, disse Kang, reconhecendo que alguns setores do fandom do K-pop reagiram mal a grupos de IA.

“A crítica era sobre substituir ídolos atuais por ídolos virtuais – eles pensavam que os ídolos atuais poderiam perder seus empregos”, disse Kang, acrescentando que alguns fãs sempre preferirão artistas humanos.

O criador do Eternity, Park, concordou, comparando o surgimento da IA à invenção da fotografia no século 19: “Muitos pintores tinham medo da (nova) tecnologia, mas hoje ainda temos pintores. Acho que o BTS nunca terá medo de ídolos virtuais – eles são apenas conteúdo novo.”