A empresa XiYu Technology alcançou um novo progresso no campo de geração de vídeos e lançou oficialmente o novo modelo de geração de vídeo Hailuo02.
Segundo informes, o Hailuo02 se destaca ao processar cenas extremamente complexas, como movimentos de ginástica artística, sendo atualmente o único modelo do mundo capaz de gerar resultados desse tipo. Desde a exibição da demonstração do site de geração de vídeos em agosto do ano passado, o produto de vídeo SeaShell, desenvolvido pela XiYu Technology, já ajudou os criadores a gerar mais de 370 milhões de vídeos. O lançamento do Hailuo02 reduziu ainda mais a barreira para criação de vídeos e melhorou significativamente a qualidade das produções.
O núcleo da arquitetura por trás do Hailuo02 é a Noise-aware Compute Redistribution (NCR), que, com o mesmo volume de parâmetros, aumentou a eficiência de treinamento e inferência em 2,5 vezes. Isso permite adotar uma escala maior de parâmetros sem aumentar os custos dos criadores, resultando em uma expressividade mais avançada do modelo. Além disso, considerando o espaço para otimização da inferência, o volume total de parâmetros foi ampliado para três vezes o tamanho da versão anterior.
Graças ao aumento do volume total de parâmetros e à melhoria da eficiência do treinamento, o Hailuo02 consegue ajustar mais dados. Com base nas sugestões dos criadores na versão Hailuo01, a quantidade de dados foi ampliada para quatro vezes a da versão anterior, melhorando significativamente tanto a qualidade quanto a diversidade dos dados. Isso permitiu que o novo modelo apresentasse melhorias significativas no cumprimento de instruções complexas e na representação física complexa, respondendo integralmente a instruções complexas e oferecendo uma melhor resposta às palavras-chave cuidadosamente escritas pelos criadores. Além disso, os criadores podem gerar vídeos nativos em 1080p a preços relativamente acessíveis.
No teste do Artificial Analysis Video Arena, uma versão preliminar do Hailuo02 classificou-se em segundo lugar globalmente. Atualmente, o modelo foi atualizado nos produtos Web, APP e API da plataforma aberta da SeaShell Video, disponibilizando três versões: 768p-6s, 768p-10s e 1080p-6s. A XiYu Technology continua oferecendo aos criadores os melhores preços do setor e planeja realizar atualizações rápidas nas áreas de aumento da velocidade de geração, alinhamento de preferências, implementação de funções de alta ordem e exploração dos limites técnicos e artísticos.