A capacidade de transformar uma simples foto em um vídeo convincente representa um salto significativo no campo da IA. Será que estamos prontos para isso?
Não é novidade para ninguém que a inteligência artificial (IA) vem dominando várias práticas da rotina, apesar de recente. Hoje, existe uma IA para cada tarefa que você deseja fazer, e isso tende a ficar mais comum.
Nos últimos meses, o Google liberou o próprio chatbot chamado inicialmente de Bard e atual Gemini, que imediatamente se colocou como uma resposta direta ao ChatGPT da OpenAI.
Agora, pelo que parece, a empresa deseja alcançar voos mais altos, desenvolvendo para o mercado mais uma IA, mas esta capaz de mais que dar respostas às perguntas. Será que isso é um bom sinal?
Google apresenta algoritmo de IA que transforma fotos em vídeos
A nova tecnologia pode revolucionar como os vídeos são produzidos e utilizados, abrindo possibilidades em várias áreas – Foto: enriccorona.github.io/Reprodução
O algoritmo, mencionado em um artigo científico escrito por seis pesquisadores do Google, possui um potencial significativo para o futuro, uma vez que consegue criar vídeos de alguém a partir de uma única foto.
É só fornecer a imagem para a IA e digitar o que deseja que a pessoa fale no vídeo. O resultado não é perfeito, mas é impressionante o suficiente para enganar um observador menos atento nas redes sociais, por exemplo.
Além de criar as expressões faciais e o piscar de olhos da pessoa, a IA também move sua cabeça e mãos de forma natural.
O ângulo da câmera e a pose são fixos, determinados pelo algoritmo utilizado para produzir vídeos no estilo “talking head” (não sendo um concorrente do algoritmo Soma, da Open AI, que gera clipes em vários ângulos e estilos).
Conforme os pesquisadores explicam, o VLOGGER foi treinado com 800 mil vídeos de pessoas falando, utilizando um banco de dados compilado pelo Google chamado MENTOR.
Com isso, o programa tornou-se capaz de reconhecer e reproduzir movimentos faciais e corporais.
O algoritmo é um projeto de pesquisa sem data de lançamento definida. Porém, caso seja disponibilizado ao público, certamente terá uma variedade de aplicações, positivas e negativas.
A IA poderia ser empregada para animar conversas por texto, criando, por exemplo, um avatar fotorrealista da pessoa com quem você está teclando.
Além disso, poderia ser utilizada na produção de telejornais ou na animação de assistentes pessoais digitais.
Segundo o artigo, “indústrias como a criação de conteúdo, o entretenimento ou os jogos têm uma grande demanda por síntese de humanos”.
Os pesquisadores também consideram outros usos potenciais, como na área da educação e da telemedicina.
Por exemplo, se integrado a uma inteligência artificial de conversação, o VLOGGER poderia gerar a imagem de um médico para realizar consultas online.
Contudo, o algoritmo também poderia ser utilizado para criar vídeos falsos de quase qualquer pessoa.
Embora não reproduza a voz do indivíduo, já existem inteligências artificiais que são capazes disso.
Além disso, o artigo sobre o VLOGGER, com 22 páginas, não aborda medidas de segurança para prevenir usos maliciosos do algoritmo.