O estúdio criativo D-ID desenvolveu uma nova ferramenta de retrato ao vivo. Ele permite que os usuários criem apresentadores gerados por IA para marketing e conteúdo educacional e muito mais.
A ferramenta de retrato ao vivo combina a geração de texto conversacional de GPT-3, animação alimentada por Stable Diffusion e a escolha de um conjunto de vozes de IA ou a capacidade dos usuários de fazer upload de seu próprio áudio.
O Futuro do Podcast
A ferramenta da D-ID potencialmente transforma a maneira como criadores e empresas podem criar conteúdo, em teoria negando a necessidade de passar horas filmando e gravando. Os usuários podem simplesmente reutilizar fotografias existentes de si mesmos com uma gravação de voz ou uma voz gerada por IA.
Os criadores que falam mal durante uma gravação para um podcast ou se esquecem de mencionar um tópico-chave não precisam mais regravar, mas podem ter retratos ao vivo preenchendo os espaços em branco.
Na prática, os movimentos dos lábios e da cabeça em assuntos da vida real ainda são um pouco chocantes e ainda é possível dizer que a imagem foi manipulada por um computador.
Um sonho para contar histórias
A ferramenta de retrato ao vivo funciona muito melhor com seus próprios apresentadores gerados por IA. Ele também trabalha com imagens de IA geradas usando Midjourney e DALL-E, dando aos artistas digitais a capacidade de animar seu trabalho e contar uma história.
Os usuários perdidos por palavras também podem aproveitar a nova ferramenta de geração de texto da D-ID, alimentada por GPT-3, a mesma tecnologia que sustenta o ChatGPT.
Outros casos de uso para a ferramenta Live Portrait incluem chatbots automatizados apresentados por uma imagem animada de uma pessoa real, algo que a empresa capitalizou com sua outra ferramenta de chatbot Chat D-ID.
Fotos familiares no My Heritage
A D-ID já licenciou seu software para o site de história da família My Heritage. Sua ferramenta Deep Nostalgia permite que genealogistas iniciantes enviem fotos de seus antepassados e os tragam de volta à vida.
De acordo com My Heritage, isso já foi usado mais de 100 milhões de vezes. Sua ferramenta LiveStory de próxima geração permite que os usuários não apenas animem seus antepassados, mas também lhes permite contar uma história sobre suas experiências.
Ética e privacidade
Todas as ferramentas do D-ID impedem que os usuários enviem fotos de figuras da vida real para evitar o abuso de deepfakes. Tentei fazer o upload de uma fotografia do rei britânico George V e combiná-la com sua transmissão de rádio de Natal da vida real de 1935 sem sucesso. Parece que essa política se aplica até mesmo a figuras públicas, há muito falecidas.
Em sua declaração de ética, a D-ID também se compromete a não “licenciar conscientemente o uso de nossa plataforma para partidos políticos. Tampouco trabalharemos conscientemente com editores de pornografia ou organizações terroristas, fabricantes de armas ou armas.
A D-ID foi fundada em 2017 pelos cientistas da computação israelenses Gil Perry, Sella Blondheim e Eliran Kuta e é apoiada por capitalistas de risco. Notícia baseada no the decodr