Recentemente, a empresa líder no campo de IA multimodal, Shengshu Technology, anunciou com sucesso uma rodada de financiamento de centenas de milhões de yuans. Este financiamento foi liderado pela Bocai Capital, e os investidores anteriores, como o departamento de investimento estratégico da Baidu e o fundo de investimento da indústria de inteligência artificial de Pequim, também continuaram a investir, demonstrando o alto reconhecimento do mercado por Shengshu Technology. A empresa planeja usar esses recursos para avançar ainda mais no desenvolvimento de modelos e inovações tecnológicas, explorar o potencial dos grandes modelos multimodais e acelerar a expansão de produtos e serviços aos usuários.
A tecnologia multimodal, especialmente no campo da geração de vídeos, está em fase de rápido desenvolvimento. O responsável pelo financiamento da Shengshu Technology afirmou que espera que, nos próximos três anos, a geração multimodal transforme a forma como o conteúdo digital é produzido globalmente, se infiltrando gradualmente em diversos setores. Nesse contexto, o modelo de vídeo Vidu, lançado pela Shengshu Technology em 2023, teve um desempenho satisfatório, alcançando uma receita recorrente anual superior a 20 milhões de dólares em apenas 8 meses e gerando mais de 400 milhões de vídeos em todo o mundo.
O sucesso do Vidu não se limita apenas às receitas, mas também à sua ampla aplicação comercial. A Shengshu Technology firmou parcerias com empresas renomadas, como JD.com e Amazon, abrangendo cenários industriais como publicidade, comércio eletrônico, divulgação cinematográfica e produção de animações. Essas parcerias não só validam a força tecnológica da Shengshu Technology, mas também marcam um avanço adicional na aplicação comercial da geração de vídeos.
Com o avanço tecnológico, a geração de vídeos é amplamente considerada o campo mais desafiador dentro do multimodal. O responsável pelo financiamento da Shengshu Technology acredita que, nos próximos anos, as capacidades de geração de vídeos continuarão a melhorar, seguindo direções de maior controle, consistência e contexto longo. Além disso, a implementação de funcionalidades de geração e edição em tempo real tornará a geração de vídeos mais flexível e eficiente.
No ambiente geral da indústria, com a queda dos preços dos GPUs e o avanço das capacidades computacionais nacionais, os custos de geração de vídeos devem diminuir significativamente, acelerando assim a penetração comercial para empresas. No entanto, enquanto a indústria cresce rapidamente, também enfrenta desafios como governança de direitos autorais e regulação de informações falsas, e as empresas precisam se preparar antecipadamente em termos de conformidade e identificação de conteúdo.