Recentemente, a “ressurreição” de fotos por meio de IA causou um grande impacto na internet, e o Heygen finalmente lançou sua ferramenta de sincronização labial.

Basta carregar uma foto e um áudio, e o personagem da foto começará a falar, cantar ou mesmo ler em voz alta, de acordo com o conteúdo do áudio. Atualmente, ele suporta áudios de até 20 segundos, ou seja, você pode gerar um vídeo de 20 segundos. Ainda mais impressionante: a ferramenta identifica a voz principal e garante que a sincronia labial e as expressões faciais estejam perfeitamente alinhadas com o áudio.

No entanto, há um pequeno inconveniente: o Heygen parece ter criado uma barreira para usuários na China. Atualmente, usuários na China não conseguem fazer login nem criar novas contas. Isso pode desapontar muitos que estão interessados nessa tecnologia.

Deixando isso de lado, o Heygen apresenta um crescimento bastante forte. Em junho deste ano, o Heygen arrecadou US$ 60 milhões em uma rodada de financiamento com uma avaliação de US$ 500 milhões. A rodada foi liderada pela Benchmark, com a participação de Conviction, Thrive Capital e Bond Capital, entre outras empresas de investimento de renome. Como parte do acordo, Victor Lazarte, sócio da Benchmark, se juntará ao conselho administrativo do Heygen.

Até o momento, o Heygen já arrecadou um total de US$ 74 milhões. Fundada em 2020, esta startup é uma das muitas que utilizam a tecnologia de IA generativa para produzir vídeos de forma mais barata e simples. A ferramenta do Heygen permite que qualquer pessoa crie avatares realistas, fale com a própria voz e até mesmo traduza para vários idiomas.

Endereço para experimentar: https://labs.heygen.com/guest/expressive-photo-avatar