Récemment, Shengshu Technology, une entreprise pionnière dans le domaine de l'intelligence artificielle multimodale, a annoncé avoir réussi à lever plusieurs centaines de millions de yuans lors de sa série A. Cette levée de fonds a été menée par Bocai Capital, avec la participation continue d'investisseurs tels que le fonds de croissance de Baidu, le fonds d'industrie de l'intelligence artificielle de Pékin et d'autres, ce qui témoigne de la forte reconnaissance du marché envers Shengshu Technology. L'entreprise prévoit d'utiliser ces fonds pour accélérer le développement des modèles et les innovations technologiques, explorer le potentiel des grands modèles multimodaux, et ainsi accélérer l'expansion des produits et le service aux utilisateurs.
La technologie multimodale, notamment dans le domaine de la génération vidéo, se trouve actuellement en pleine phase de développement rapide. Le responsable de financement de Shengshu Technology a déclaré qu'il s'attendait à ce que la génération multimodale change la manière dont le contenu numérique est produit à l'échelle mondiale au cours des trois prochaines années, progressivement s'introduisant dans tous les secteurs d'activité. Dans ce contexte, le modèle vidéo Vidu lancé par Shengshu Technology en 2023 a montré un bon rendement, atteignant plus de 20 millions de dollars de revenus annuels récurrents en seulement 8 mois, et générant plus de 400 millions de vidéos à l'échelle mondiale.
Le succès de Vidu ne se limite pas aux revenus, mais aussi à la grande portée de ses applications commerciales. Shengshu Technology a conclu des partenariats avec des entreprises renommées telles que JD.com et Amazon, couvrant divers scénarios d'industrie tels que la publicité, le commerce électronique, la promotion cinématographique et la production d'animations. Ces collaborations valident non seulement les compétences techniques de Shengshu Technology, mais marquent également une maturité accrue de la génération vidéo dans les applications commerciales.
Avec le développement technologique, la génération vidéo est de plus en plus considérée comme l'un des domaines les plus difficiles dans le cadre de l'intelligence artificielle multimodale. Le responsable de financement de Shengshu Technology estime que les capacités de génération vidéo s'amélioreront continuellement au cours des prochaines années, allant vers une meilleure contrôle, une plus grande cohérence et une compréhension contextuelle plus longue. De plus, la mise en œuvre de fonctions de génération et d'édition en temps réel rendra la génération vidéo plus flexible et efficace.
Dans l'environnement général de l'industrie, avec la baisse des prix des GPU et le développement des capacités informatiques nationales, les coûts de la génération vidéo devraient diminuer significativement, accélérant ainsi la pénétration commerciale à l'échelle entreprise. Cependant, tout en développant rapidement, l'industrie doit faire face à des défis tels que la gestion des droits d'auteur et la régulation des fausses informations. Les entreprises doivent anticiper leurs stratégies concernant la conformité et l'identification des contenus.