Nova IA transforma voz em vídeo a partir de fotos

Pesquisadores do Instituto para Computação Inteligente, do Alibaba Group, apresentou seu novo sistema de inteligência artificial (IA) capaz de transformar fotos do rosto de uma pessoa em vídeos animados, como se ela estivesse falando ou cantando.

Por Adeilson em 02/03/2024 às 01:45:06

Foto: Reprodução internet

Pesquisadores do Instituto para Computação Inteligente, do Alibaba Group, apresentou seu novo sistema de inteligência artificial (IA) capaz de transformar fotos do rosto de uma pessoa em vídeos animados, como se ela estivesse falando ou cantando.

A tecnologia, chamada de Emote Portrait Alive (EMO), combina a imagem estática com áudios de pessoas falando ou cantando. Na apresentação da tecnologia, um dos vídeos divulgados foi de Mona Lisa, famoso quadro de Leonardo da Vinci, "falando" (veja mais abaixo).

Leia mais:

IA combina fotos e áudios para criar vídeos animados

Apesar da novidade, pesquisadores passados já demonstraram o processamento de fotos de rostos para uso semi-animado;
Porém, a equipe do Alibaba foi além, pois adicionou som;
Além disso, eles o fizeram sem usar modelos 3D, nem referências faciais,;
Em seu lugar, os pesquisadores usaram modelagem de difusão baseada no treinamento de IA em grandes conjutos de dados de arquivos de áudio e vídeo;
Foram utilizadas cercas de 250 horas de dados para criar o EMO.

Segundo o TechXplore, convertendo automaticamente as ondas de áudio em quadros de vídeo, os pesquisadores criaram uma ferramenta que captura gestos humanos sutis, peculiaridades de discurso e outras características que identificam uma imagem animada de um rosto como sendo humano.

Os vídeos recriaram os prováveis formatos e movimentos de boca usados para formar palavras e frases com expressões tipicamente associadas a tais movimentos.

No GitHub da equipe, há vários outros vídeos exemplificando o sucesso da ferramenta. Lá, alegaram ainda que o EMO supera outras aplicações no que tange realismo e expressividade.

A equipe observou ainda que a duração do vídeo final depende da duração da trilha de áudio original anexada à ferramenta. Nos vídeos, vemos a imagem original lado-a-lado à pessoa falando ou cantando na voz de quem foi gravado na trila de áudio original.

Eles frisam, porém, que o uso do EMO precisará ser restrito ou monitorado para evitar seu uso antiético.

O grupo publicou os resultados de sua ferramenta e mais detalhes de seu desenvolvimento no servidor de pré-impressão arXiv.

Fonte: Olhardigital

Comunicar erro

Comentários

CATEGORIAS

PÁGINAS

Últimas Notícias

Nova IA transforma voz em vídeo a partir de fotos

Pesquisadores do Instituto para Computação Inteligente, do Alibaba Group, apresentou seu novo sistema de inteligência artificial (IA) capaz de transformar fotos do rosto de uma pessoa em vídeos animados, como se ela estivesse falando ou cantando.

IA combina fotos e áudios para criar vídeos animados

Comentários

Carmo Dalla Vecchia fala de paternidade gay e papéis estereotipados para LGBT+ na TV

Vitor Roque é 'descartado' do Barcelona e deve deixar clube, diz rádio espanhola

Cresce número de imóveis vendidos com desconto no país; veja taxa média

São Paulo supera Fluminense em jogo movimentado no Morumbi

Exportação de café verde do Brasil salta 60,8%, recorde para abril

Petrobras tem lucro líquido de R$ 23,7 bilhões no 1º trimestre de 2024

Especialista alerta sobre aumento das infecções respiratórias em crianças no outono

Ciclovia do Trabalhador impulsiona negócios às margens da antiga ferrovia de Arapiraca

Representante da Alurb de Maceió conhece tecnologias ambientais em Brasília

Assembleia Legislativa de AL realiza hoje sessão especial sobre o trabalho no lar

Maio Laranja: RAV é referência na assistência a crianças vítimas de abuso e exploração sexual

O ritmo é delas: Vem Ver a Banda Tocar realiza apresentação especial em homenagem ao Dia das Mães

Veja fotos do show histórico de Madonna em Copacabana; confira

Esposa de jogador brasileiro bate Ferrari avaliada em mais de R$ 1 milhão

FPI constata situação de abandono e falta de manutenção da maior barragem de Alagoas

Ensaio de máscara, dublê e Monique Alfradique: Madonna confunde fãs em passagem pelo Brasil

Fiuk canta música para Deolane: 'Era uma brincadeira, virou verdadeiro'; assista

Marido de Isabel Veloso, que tem câncer terminal, responde sobre 'perdê-la em breve'

Mão Branca

Ciberataques no Brasil crescem 38% no 1º trimestre, aponta estudo

Carreira em Ação

Empreendedorismo Feminino

Alessandro Queiroz

Você é o modelo para seus filhos

Mulheres falando sobre mulheres

Palavras não ditas sufocam

CATEGORIAS

PÁGINAS

Últimas Notícias

Nova IA transforma voz em vídeo a partir de fotos

Pesquisadores do Instituto para Computação Inteligente, do Alibaba Group, apresentou seu novo sistema de inteligência artificial (IA) capaz de transformar fotos do rosto de uma pessoa em vídeos animados, como se ela estivesse falando ou cantando.

IA combina fotos e áudios para criar vídeos animados

Comentários

Mais sobre Tecnologia

Leia também

Carmo Dalla Vecchia fala de paternidade gay e papéis estereotipados para LGBT+ na TV

Especialista alerta sobre aumento das infecções respiratórias em crianças no outono

Veja fotos do show histórico de Madonna em Copacabana; confira