Microsoft a annoncé le 17 octobre que le nouveau modèle de génération vidéo développé par OpenAI, Sora2, est désormais disponible sur Azure AI Foundry version internationale et entre dans la phase de prévisualisation publique. C'est la première fois que ce modèle met à disposition des entreprises et des développeurs ses interfaces API via une plateforme cloud, marquant ainsi le passage des outils de génération d'images par l'intelligence artificielle d'une phase de tests fermés à une application commerciale.
Sora2 est un modèle de génération vidéo multimodal capable de traiter divers types de données d'entrée, comme les textes, les images et les vidéos, et de les combiner pour produire de nouveaux contenus vidéo. Cette capacité en fait un outil adapté à plusieurs scénarios d'application tels que la réalisation de publicités, de vidéos éducatives ou de contenus pour les réseaux sociaux. Les utilisateurs peuvent directement générer des extraits vidéo à partir de descriptions textuelles, évitant ainsi les étapes traditionnelles de tournage et de montage.
Remarque sur la source de l'image : l'image a été générée par l'intelligence artificielle
En termes d'accès, les utilisateurs doivent utiliser l'API Standard Global d'Azure AI Foundry pour accéder au service Sora2, avec un prix de 0,1 dollar par seconde de vidéo. Cette stratégie tarifaire repose sur un modèle de facturation par durée de génération, ce qui rend le coût plus transparent et prévisible pour les utilisateurs professionnels ayant besoin de générer de nombreux courts extraits vidéo.
Microsoft a choisi de déployer Sora2 sur la plateforme Azure, continuant ainsi son mode de collaboration approfondie avec OpenAI dans le domaine des services cloud. À l'époque, les modèles de la série GPT étaient également accessibles aux clients d'entreprises via Azure. Cette coopération permet à Microsoft d'intégrer rapidement les dernières capacités d'intelligence artificielle à son écosystème cloud, tout en offrant à OpenAI une infrastructure soutenant la mise en œuvre commerciale à grande échelle.
D'un point de vue technologique, Sora2 pourrait présenter des améliorations par rapport à sa version initiale concernant la fusion multimodale et la cohérence vidéo, bien que les paramètres techniques et les résultats de tests de performance n'aient pas encore été divulgués officiellement. La phase de prévisualisation publique signifie que le service est encore en cours d'optimisation, et les utilisateurs pourraient rencontrer des problèmes tels qu'une qualité de génération instable ou une compréhension erronée de certains scénarios pendant leur utilisation.
Pour l'industrie de la création de contenus vidéo, l'apparition des outils de génération vidéo par l'intelligence artificielle apporte à la fois des opportunités d'amélioration de l'efficacité, mais aussi des discussions sur les droits d'auteur, la véracité et la valeur créative. Les entreprises doivent prendre en compte les autorisations d'utilisation commerciale des contenus générés, les risques éthiques potentiels et les façons d'intégrer ces outils dans leurs processus de travail existants lors de leur utilisation.
Il convient de noter que Sora2 n'est actuellement disponible que sur la version internationale d'Azure AI Foundry, ce qui signifie que les utilisateurs de la Chine continentale ne peuvent pas actuellement accéder à ce service via Azure en Chine. De plus, le prix de 0,1 dollar par seconde peut être considéré comme élevé pour les créateurs individuels, et les coûts s'accumulent rapidement en cas d'utilisation en volume. Il reste à voir si Microsoft lancera à l'avenir des schémas tarifaires différenciés adaptés à différents groupes d'utilisateurs.
D'un point de vue de la concurrence, le lancement de Sora2 entrera en concurrence avec les produits de Google tels que Veo, les outils de génération vidéo de Meta, ainsi que les solutions chinoises comme Ke Ling et Ji Meng. Les différences entre les différentes entreprises concernant la qualité de la génération vidéo, le contrôle, le coût et l'adaptation aux scénarios d'application détermineront la structure du marché durant la phase de commercialisation.