En el vídeo musical de su último sencillo «DTDTGMGN», los miembros del grupo surcoreano Eternity bailan al ritmo perfecto de un bubblegum pop en una habitación rosa neón decorada con uniformes escolares y carteles de famosos. Los vertiginosos movimientos de cámara y los rápidos cambios de escena son típicos del género K-pop, que se ha convertido en un fenómeno mundial en los últimos años.
«Abrázame fuerte, apóyate en mi hombro», canta uno de los miembros.
Pero los fans del grupo no pueden hacer ninguna de estas cosas, físicamente hablando, porque ninguno de los 11 miembros de Eternity es real.
Creado con tecnología de inteligencia artificial, Eternity es uno de los últimos grupos surcoreanos en cruzar la línea entre el entretenimiento real y el virtual. Pulse9, la empresa creadora y gestora del grupo, cree que las estrellas generadas por ordenador tienen una ventaja significativa sobre sus homólogas reales.
Como la mayoría de los grupos populares de K-pop, Eternity está formado por un líder, vocalistas, raperos y bailarines. Pero un miembro en particular, Zae-in, puede hacerlo todo. «Zae-in tiene (una combinación de) características que a la mayoría de los artistas humanos les resultaría difícil realizar», afirma Park Ji-eun, director ejecutivo de la compañía. «Puede cantar muy bien, rapear muy bien y ser creativa como diseñadora (de moda). Y es una actriz nata»
Con la ayuda de una tecnología de intercambio de rostros en tiempo real y una voz generada por IA, Zae-in es interpretada por 10 personas diferentes, entre actores, cantantes y bailarines, que prestan su talento a su avatar cuando es necesario. En un vídeo publicado en la cuenta de Instagram de Zae-in, por ejemplo, monta hábilmente una tabla de longboard junto al río Han, en Seúl. Para el vídeo, sus creadores filmaron la acrobacia con un doble cuyo rostro se cambió después por el de Zae-in.
«Hay una Zae-in músico pop, una Zae-in actriz, una Zae-in reportera», dijo la estrella virtual a CNN en una entrevista con Zoom, durante la cual fue interpretada por un actor (aunque Pulse9 dijo que su software de IA puede recrear la voz de Zae-in y generar el habla sin intervención humana). «Hay varios Zae-ins, así que nuestra ventaja única es que podemos hacer lo que una persona no puede»
«Lo único que no podemos hacer es dar un autógrafo», añade, con los ojos sonrientes.
El intercambio de rostros en tiempo real y las primeras formas de tecnología deepfake existen desde hace casi una década. En ese tiempo, influencers virtuales como Lil Miquela y el surcoreano Rozy han conseguido un enorme número de seguidores en Internet en los ámbitos de la moda y la música.
Pero los últimos avances en vídeo y audio generados por IA están facilitando a empresas como Pulse9 la creación de personajes virtuales convincentes, mientras que los avances en programas de IA generativa como ChatGPT están eliminando la necesidad de que estrellas como Zae-in sean «interpretadas» por cualquiera.
Cómo se hicieron
El equipo de Pulse9 comenzó el proceso de dar «vida» a la eternidad diseñando la apariencia de sus miembros. El equipo de Park generó 101 rostros digitales únicos, inspirados en famosos coreanos existentes, antes de dividirlos en cuatro categorías -denominadas «sexy», «guapa», «inteligente» e «inocente»- y reducir la selección a 11 mediante una encuesta en línea.
Utilizando tecnología deepfake y captura de movimiento, Pulse9 produjo el primer vídeo musical del grupo (para acompañar al tema «I'm Real», de título irónico) en 2021. La reacción al vídeo fue variada. Muchos usuarios de las redes sociales consideraron que las expresiones faciales de los miembros de la banda parecían poco naturales y ajenas a sus cuerpos, mientras que otros citaron el efecto «valle inquietante», por el que los espectadores se sienten incómodos con cosas que se parecen a los humanos pero no lo son.
Pero cinco meses después, cuando Pulse9 publicó el siguiente vídeo musical de Eternity, «No Filter», los seguidores se dieron cuenta de que el grupo casi no se distinguía del real. «Me sorprende lo realistas que suenan, y los visuales parecen más realistas que la canción de debut», reza el comentario con más likes en YouTube.
«DTDTGMGN», que salió el pasado octubre, supuso otro gran salto de calidad. «Hasta el año pasado, la cara era la única parte virtual del artista, pero hoy podemos crear imágenes de cuerpo entero con tecnología de IA», afirma Park, que añade que «No Filter» también se compuso con IA (aunque los humanos editaron la música y escribieron la letra).
SM Entertainment, la agencia detrás de megaestrellas del K-pop como Super Junior, Girls' Generation y Exo, entre otras, también ha estado experimentando con la IA. En 2020, la empresa presentó Aespa, un grupo formado por cuatro artistas humanos y sus compañeros virtuales. Tras el lanzamiento del grupo, el fundador de SM, Lee Soo-man, declaró que el futuro del entretenimiento es «la celebridad y el robot».
Por otra parte, la empresa de gestión de BTS, Hybe, utilizó la IA para ajustar la pronunciación y el tono de su cantante, antes de lanzar una de sus canciones en seis idiomas: coreano, inglés, español, chino, japonés y vietnamita.
Y a principios de este año, Metaverse Entertainment, una agencia formada por el editor de videojuegos Netmarble y la empresa matriz de SM Entertainment, Kakao Entertainment, presentó un grupo virtual de chicas, MAVE. A diferencia de Eternity, que se basa en intercambios directos de caras, las cuatro integrantes de MAVE se generaron desde cero mediante CGI.
Metaverse Entertainment utilizó tecnología de IA para generar rostros, mezclando los rasgos y peinados considerados más deseables en cuatro personajes finales. La empresa empleó tecnología de captura de movimiento para grabar actuaciones reales de K-pop que un programa de aprendizaje profundo utilizó para animar los vídeos musicales. Según Kang Sung-ku, director técnico de Metaverse Entertainment, las voces del grupo son en parte humanas y en parte generadas por IA.
«Nuestro objetivo es crear humanos virtuales totalmente impulsados por IA (que sean) realmente creíbles», dijo a CNN.
El vídeo musical del primer single de MAVE, «Pandora», ya ha acumulado 25 millones de visitas en YouTube desde su lanzamiento en enero.
¿El futuro del K-pop?
Las estrellas virtuales pueden tener ventaja sobre los humanos a la hora de relacionarse con sus fans. Según Kang, los avances en los programas lingüísticos de inteligencia artificial podrían hacer posible que los fans «hablaran» con sus ídolos e incluso entablaran una relación personal con ellos.
«Se acordarán de lo que hablamos ayer y podrán seguir hablando de cosas (de conversaciones anteriores)», dijo, haciendo una comparación entre las creaciones de IA de su empresa y el asistente virtual del iPhone, Siri. «Te recordarán y sabrán de ti, y te hablarán basándose en esa información»
Metaverse Entertainment ya está experimentando con esta idea a través de aplicaciones que permiten a los usuarios interactuar directamente con MAVE. En la actualidad, los miembros del grupo hablan coreano, inglés, francés e indonesio, lo que indica que cuentan con importantes bases de fans y mercados objetivo, aunque en teoría podrían hablar cualquier número de idiomas.
«Hay cosas que no puedo decir (ni siquiera a mis mejores amigos), pero quizá pueda decir una IA personalizada, que me consuele y se preocupe por mí», afirma Kang. «Creo que será bueno para todos»
Zae-in, de Eternity, declaró a CNN que la «ventaja única» de las estrellas virtuales es que «pueden hacer lo que una persona no puede».
Sin duda, el desarrollo podría ser bueno para empresas como la de Kang. La industria del K-pop se sustenta en un sistema de formación intensivo en mano de obra en el que las aspirantes se moldean desde muy jóvenes, a menudo sometiéndose a años de costosas clases de baile y música antes de debutar (según el Wall Street Journal, SM Entertainment gastó aproximadamente 3 millones de dólares en sacar al mercado a Girls Generation en 2007) Las agencias deben invertir en clases, espacio de estudio, estilismo y, a veces, incluso procedimientos estéticos para los miembros potenciales de la banda, costes que no son necesarios para los talentos virtuales.
Además, las estrellas del pop generadas por ordenador nunca enfermarán, envejecerán ni se verán envueltas en disputas contractuales o escándalos sensacionalistas. Pero no hay muchas posibilidades de que las grandes agencias sustituyan a corto plazo a sus bandas reales, afirma Kang, que reconoce que algunos sectores del fandom del K-pop han reaccionado mal ante los grupos de IA.
«Las críticas se referían a la sustitución de los ídolos actuales por ídolos virtuales: pensaban que los ídolos actuales podrían perder su trabajo», explica Kang, y añade que algunos fans siempre preferirán a los artistas humanos.
Park, creador de Eternity, se mostró de acuerdo y comparó el auge de la IA con la invención de la fotografía en el siglo XIX: «Muchos pintores tenían miedo de la (nueva) tecnología, pero hoy seguimos teniendo pintores. No creo que BTS tema nunca a los ídolos virtuales: son sólo nuevos contenidos»