A Tencent lançou oficialmente seu mais recente modelo de imagem Hunyuan 2.0 (Hunyuan Image2.0), marcando a entrada da tecnologia de geração de imagens por IA na era do "tempo de resposta em milissegundos".

imagem.png

O novo modelo apresenta melhorias significativas na velocidade, com o aumento de uma ordem de magnitude nos parâmetros em comparação ao modelo anterior. Combinando um eficiente codec de imagem e uma nova arquitetura de difusão, o Hunyuan Image2.0 consegue uma resposta rápida em milissegundos, enquanto produtos comerciais similares geralmente levam de 5 a 10 segundos para realizar inferências. Os usuários podem receber saídas de imagem em tempo real enquanto digitam texto ou fornecem instruções por voz, eliminando completamente o tradicional ciclo de "sortear - esperar - sortear", e melhorando significativamente a experiência interativa.

imagem.png

Qualidade hiper-realista das imagens

Além das melhorias na velocidade, o Hunyuan Image2.0 também demonstra avanços significativos na qualidade das imagens geradas. O modelo utiliza aprendizado reforçado e incorpora grande quantidade de conhecimentos estéticos humanos para evitar o "jeito de IA" comum nas imagens geradas por IA. As imagens produzidas são não apenas realistas e detalhadas, mas também muito úteis. No teste de benchmarking GenEval, reconhecido internacionalmente, o Hunyuan Image2.0 alcançou uma precisão superior a 95% na avaliação da compreensão e geração de imagens sob instruções textuais complexas, superando todos os outros modelos competitivos.

Ferramenta de quadro de desenho em tempo real

Nesta atualização, foi introduzida a funcionalidade de quadro de desenho em tempo real, que aproveita a capacidade do novo modelo de criar imagens instantaneamente. Enquanto os usuários desenham esboços ou ajustam parâmetros, a área de visualização gera automaticamente o efeito de coloração em tempo real. Essa funcionalidade elimina o fluxo tradicional de "desenhar - esperar - ajustar", tornando o processo criativo muito mais fácil para designers profissionais. Além disso, o quadro de desenho em tempo real suporta fusão de múltiplas imagens; os usuários podem carregar vários rascunhos, e o IA automaticamente coordenará perspectiva e iluminação conforme as instruções fornecidas, gerando imagens de fusão, aumentando ainda mais a interatividade da criação de imagens por IA.

imagem.png

A Tencent também anunciou que está desenvolvendo um modelo nativo multiformato de geração de grandes imagens, que promete oferecer excelente desempenho em geração iterativa de imagens e experiências interativas em tempo real, proporcionando aos usuários uma experiência criativa ainda mais rica.

Entrada do produto: https://hunyuan.tencent.com/