Genmo publie le modèle de génération de vidéo open source Mochi1 : rivalisant avec Runway, Kuaishou et autres, utilisable gratuitement par les utilisateurs

AIbase基地

Publié leActualités IA · 6 minutes de lecture · Oct 23, 2024

446

Récemment, la société de vidéos IA Genmo a annoncé le lancement de Mochi1, un nouveau modèle de génération de vidéos open source permettant aux utilisateurs de créer des vidéos de haute qualité à partir d'invites textuelles. Les performances de Mochi1 sont considérées comme comparables, voire supérieures, à celles des principaux concurrents propriétaires du marché, tels que Runway, Dream Machine de Luma AI, Kuaishou Ke Ling, et Hailuo de Minimax.

Ce modèle est disponible sous licence Apache2.0, permettant aux utilisateurs d'accéder gratuitement à une technologie de pointe de génération de vidéos, contrairement à d'autres produits concurrents dont les tarifs varient de plans gratuits limités à 94,99 $ par mois.

Les poids du modèle et le code de Mochi1 peuvent être téléchargés gratuitement sur Hugging Face. Cependant, pour exécuter ce modèle sur un appareil personnel, il faut au minimum quatre GPU Nvidia H100. Pour permettre aux utilisateurs de découvrir les fonctionnalités de Mochi1, Genmo propose également une plateforme d'essai en ligne.

Exemples de vidéos générées par Mochi1 :

Selon Genmo, Mochi1 excelle dans le respect des instructions détaillées des utilisateurs, permettant un contrôle précis des personnages, des décors et des actions dans les vidéos générées. Genmo affirme que lors de tests internes, Mochi1 a surpassé la plupart des autres modèles d'IA vidéo, y compris les concurrents propriétaires Runway et Luna, en termes de rapidité d'adhérence et de qualité de mouvement.

Mochi1 a réalisé des progrès significatifs dans le domaine de la génération de vidéos, notamment en termes de rendu de mouvements haute fidélité et de précision du suivi des invites. Le PDG de Genmo, Paras Jain, a déclaré que leur objectif était de réduire l'écart entre les modèles de génération de vidéos open source et propriétaires. Il a souligné que la vidéo était la forme de communication la plus importante, et qu'ils souhaitaient donc rendre cette technologie accessible à un plus grand nombre de personnes.

Parallèlement, Genmo a annoncé avoir bouclé un tour de financement de série A de 28,4 millions de dollars, avec la participation de NEA et de plusieurs sociétés de capital-risque. Jain a indiqué que la génération de vidéos n'était pas seulement un outil de divertissement ou de création de contenu, mais aussi un outil important pour les robots et les systèmes autonomes du futur.

L'architecture de Mochi1 est basée sur le transformateur de diffusion asymétrique (AsymmDiT) développé par Genmo, le plus grand modèle de génération de vidéos open source publié à ce jour, avec 10 milliards de paramètres. Ce modèle se concentre sur le raisonnement visuel, ce qui lui confère un avantage dans le traitement des données vidéo.

Exemples de vidéos générées par Mochi1 :

Bien que Mochi1 ait déjà démontré de puissantes fonctionnalités, il présente encore certaines limitations, telles qu'une résolution actuelle de 480p et de légères distorsions visuelles dans les scènes de mouvements complexes. Genmo prévoit de lancer une version Mochi1HD prenant en charge une résolution 720p d'ici la fin de l'année, afin d'améliorer l'expérience utilisateur.

Accès à la démo :https://www.genmo.ai/play

Téléchargement du modèle : https://huggingface.co/genmo/mochi-1-preview

Points clés :
🌟 Mochi1 est un modèle de génération de vidéos open source développé par Genmo, gratuit pour les utilisateurs et offrant des performances comparables à plusieurs produits propriétaires.
💰 Genmo a bouclé un tour de financement de série A de 28,4 millions de dollars, visant à démocratiser la technologie vidéo IA.
🎥 Une version Mochi1HD sera prochainement lancée pour résoudre les limitations actuelles de résolution 480p et de certaines scènes de mouvements complexes.

Hugging Face acquiert Pollen Robotics et ouvre une nouvelle ère pour la robotique

Le 15 avril, Hugging Face, la plateforme de modèles open source renommée, a annoncé l'acquisition de Pollen Robotics, marquant son entrée officielle dans le domaine de la robotique physique. Bien que les termes exacts de l'accord n'aient pas encore été divulgués, cette acquisition intégrera les quelque 20 employés de Pollen Robotics à Hugging Face. Il s'agit de la plus importante acquisition de personnel jamais réalisée par la société, témoignant de son ambition d'expansion dans de nouveaux secteurs d'activité. Le co-fondateur de Hugging Face...

智谱AI采用新域名Z.ai 并开源32B/9B系列GLM模型

L'équipe technique de Zhihu a annoncé la publication en open source des modèles GLM (General Language Model) de la série 32B et 9B, et le lancement officiel de la nouvelle plateforme d'interaction Z.ai. Cette série de modèles comprend des modèles de base, des modèles d'inférence et des modèles de réflexion, tous sous licence MIT permissive, offrant aux développeurs une grande liberté d'utilisation et de développement, utilisables gratuitement à des fins commerciales et librement distribuables.

Nouveau modèle open source DeepCoder : programmation ultra-efficace, surpassant le modèle o1 d'OpenAI

Dans le contexte de l'évolution rapide des technologies, l'intelligence artificielle (IA) ne cesse de progresser. Récemment, le nouveau modèle DeepCoder-14B-Preview, mis en open source par la célèbre plateforme d'entraînement de grands modèles Together AI et la plateforme d'agents intelligents Agentica, a suscité un vif intérêt. Avec seulement 14 milliards de paramètres, ce modèle a obtenu un score de 60,6 % sur la plateforme de test de code LiveCodeBench, surpassant le modèle o1 d'OpenAI (59,5 %), avec une légère marge.

Bulletin IA : Le modèle open source d'Alibaba, Tongyi Qianwen, arrive en tête du classement mondial ; MiniMax lance le modèle vocal Speech-02 ; Le nombre d'utilisateurs payants de ChatGPT atteint 20 millions

Bienvenue à la rubrique 【Bulletin IA】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en nous concentrant sur les développeurs, pour vous aider à comprendre les tendances technologiques et les nouvelles applications des produits d'IA innovants. Découvrez les nouveaux produits IA : https://top.aibase.com/1. Le modèle Qwen-2.5-Omni d'Alibaba Tongyi Qianwen arrive en tête du classement mondial des modèles open source Le 2 avril 2024, HuggingFace a publié le dernier classement des grands modèles, et le modèle Qwe d'Alibaba...

Google publie le modèle open source TxGemma pour accélérer la recherche et le développement de médicaments thérapeutiques

Google a récemment annoncé le lancement de TxGemma, un nouveau modèle open source conçu pour améliorer l'efficacité de la recherche et du développement de médicaments thérapeutiques. Développé par l'équipe Google DeepMind à partir de sa famille de modèles Gemma, ce modèle intègre des capacités avancées de compréhension du langage, de prédiction scientifique et de dialogue multi-tours, visant à révolutionner le domaine de la recherche pharmaceutique. Le lancement de TxGemma est considéré comme une avancée majeure de l'intelligence artificielle dans le secteur biomédical, promettant de réduire considérablement le temps nécessaire pour qu'un médicament passe du laboratoire à la clinique, tout en réduisant les…

Bulletin IA : Tencent lance 5 modèles 3D open source ; Anthropic publie une mise à jour majeure du mécanisme de transfert MCP ; Nouveau modèle open source Mistral Small 3.1

Bienvenue dans la rubrique 【Bulletin IA】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités du secteur de l'IA, en nous concentrant sur les développeurs, pour vous aider à comprendre les tendances technologiques et les applications innovantes des produits d'IA. Découvrez les nouveaux produits IA : https://top.aibase.com/1. Tencent lance 5 modèles 3D open source : génération en 30 secondes, compatible avec plusieurs plateformes. Tencent HunYuan a annoncé le lancement de cinq nouveaux modèles de génération 3D open source, basés sur Hunyuan3D-2.0, offrant une vitesse de génération améliorée...

Actualités IA

IA Quotidien

Chronologie de l'IA

Al hardware

Derniers cas

Collection d'images

Collection de vidéos

Collection audio

Collection de contenu

Derniers tutoriels

Classement des produits IA

Classement de la croissance du trafic IA

Classement de la baisse du trafic IA

Classement hebdomadaire de l'IA

États-Unis

Chine

Inde

Brésil

Génération d'images

Assistant personnel

Génération de personnages

Génération de vidéos

Classement des projets IA

Classement de la croissance des projets IA

Classement des développeurs IA

Classement des organisations IA

Deepseek

TTS

LLM

ChatGPT

Aperçu

Genmo publie le modèle de génération de vidéo open source Mochi1 : rivalisant avec Runway, Kuaishou et autres, utilisable gratuitement par les utilisateurs

AIbase基地

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

Mistral présente le nouveau modèle open source Devstral : Un défi contre GPT-4.1-mini même sur un ordinateur portable.

MAI-DS-R1 : Nouveau modèle open source de Microsoft pour une meilleure réponse aux sujets sensibles et une réduction des risques de sécurité