« Journal AI du 30 juin » : Baidu ouvre le code de la série WENXIN Grand Model 4.5 ; modèle multimodal Qwen VLo de Tongyi Qianwen

Bienvenue sur le programme 【Journal de l'IA】 d'AIbase !

En trois minutes par jour, découvrez les événements majeurs du jour en intelligence artificielle et comprenez les tendances de l'industrie ainsi que les nouvelles applications innovantes.

Plus d'informations sur l'IA :https://www.aibase.com/zh

1. Baidu lance en open source la série WENXIN DaMo 4.5, dix nouveaux modèles présentés !

Baidu a officiellement lancé la série WENXIN DaMo 4.5 et l'a rendue entièrement open source, comprenant dix nouveaux modèles avec diverses configurations de paramètres, entraînés et utilisés via le framework PaddlePaddle. Ils ont une utilisation des FLOPs de 47 % et se sont montrés performants dans les tests de base multimodaux. Un guide complet d'utilisation et des outils sont fournis pour faciliter aux développeurs l'ajustement et le déploiement. Les modèles ont été mis en ligne sur des plateformes comme Hugging Face et GitHub.

Adresse de démonstration : https://yiyan.baidu.com

Hugging Face : https://huggingface.co/baidu

GitHub : https://github.com/PaddlePaddle/ERNIE

2. Qwen VLo, un modèle d'intelligence artificielle multimodale uni, est publié

微信截图_20250628093705.png

Le modèle multimodal Qwen VLo est lancé, basé sur la série Qwen-VL. Il utilise une méthode progressive de génération, permettant de comprendre le monde avec précision et de le recréer de manière de haute qualité. Il prend en charge l'édition des instructions ouvertes, dispose de capacités multilingues et peut traiter à la fois des images et du texte. Il se trouve actuellement en phase de prévisualisation, avec une adresse de démonstration sur la plateforme Qwen Chat.

Adresse de démonstration : chat.qwen.ai

3. Ovis-U1 d’Alibaba : une IA multimodale triple en un, open source pour aider les développeurs du monde entier

L’équipe internationale d’intelligence artificielle d’Alibaba a lancé le modèle multimodal Ovis-U1, comprenant 3 milliards de paramètres, intégrant la compréhension multimodale, la génération d’images à partir de texte et l’édition d’images. Il utilise une architecture innovante construite sur des technologies comme Python 3.10. Lors de l’entraînement, un algorithme de vérification de conformité a été introduit, et les poids du modèle et le code ont été rendus publics, facilitant ainsi des applications dans plusieurs domaines.

Projet : (https://huggingface.co/AIDC-AI/Ovis-U1-3B)

4. Huawei ouvre le code du modèle dense PanGu 7B et du modèle mixte Expert 72B

华为开源盘古7B稠密模型、72B混合专家模型及升腾推理技术，践行升腾生态战略，推动大模型技术研究与行业应用，相关模型权重代码已上线开源平台，邀请开发者等下载使用反馈。

5. Une seule image suffit pour générer une vidéo virale ! MOKI de Meitu propose une fonction « Publicité créative AI » gratuite pendant une période limitée

微信截图_20250630083834.png

Meitu MOKI propose une fonctionnalité « Publicité créative AI », permettant aux utilisateurs de télécharger une image et de choisir un modèle pour générer une vidéo professionnelle. Elle intègre sept modèles de génération vidéo principaux. L’adresse de démonstration est www.moki.cn, permettant de terminer le processus complet de création à la réalisation.

Adresse de démonstration : www.moki.cn

6. Le API Gemini 2.5 Pro est de retour gratuit, la communauté des développeurs réagit chaleureusement

Le API Gemini 2.5 Pro a été réintroduit dans le niveau gratuit de Google AI Studio. Ce modèle possède une forte capacité multimodale et de raisonnement, supporte divers types d'entrées. Cette mise à disposition gratuite offre aux développeurs des opportunités d'innovation, doubler les ressources informatiques gratuites, et la communauté a réagi positivement.

7. La fonctionnalité « Recherche approfondie » est testée sur l'application Douyin, la version Web et la version PC

微信截图_20250630140622.png

La fonctionnalité « Recherche approfondie » est testée sur les plateformes Douyin, le site web et la version PC. Elle peut intégrer de vastes informations profondes pour générer des rapports ou des résultats visuels, permettant aux utilisateurs d’obtenir rapidement un rapport personnalisé en quelques minutes. Elle soutient également la conversion directe en format d’émission.

8. La phase de test de « Boîte à outils AI Xiaomi » s’achève, le service sera arrêté à partir du 5 juillet

La phase de test de « Boîte à outils AI Xiaomi » s’est achevée, et le service sera suspendu à partir du 5 juillet. Les données recueillies lors du test ont permis d'améliorer le projet, ce n'est pas un abandon mais plutôt une stratégie de planification de données. Xiaomi continue d’investir dans l'IA pour construire un écosystème d’IA complet à plusieurs niveaux.

9. Nouveau système AI open source OmniGen2 : il intègre l'image et la génération de texte comme GPT-4o

Le Centre de recherche en intelligence artificielle de Pékin a lancé le système open source OmniGen2, axé sur la génération et l'édition d'images et de texte. Il utilise une voie de décodage indépendante, basée sur le transformateur Qwen2.5-VL-3B et un transformateur de diffusion personnalisé. Il dispose d’un mécanisme de réflexion, et ses performances sont excellentes dans plusieurs tests de référence. Il sera bientôt disponible sur la plateforme Hugging Face.

Projet : https://huggingface.co/OmniGen2/OmniGen2

10. Zhihu met à niveau sa fonction de base de connaissances dans « Zhida », pour offrir une expérience d'interrogation AI immersive

Actualités IA

IA Quotidien

Chronologie de l'IA

Al hardware

Derniers cas

Collection d'images

Collection de vidéos

Collection audio

Collection de contenu

Derniers tutoriels

Classement des produits IA

Classement de la croissance du trafic IA

Classement de la baisse du trafic IA

Classement hebdomadaire de l'IA

États-Unis

Chine

Inde

Brésil

Génération d'images

Assistant personnel

Génération de personnages

Génération de vidéos

Classement des projets IA

Classement de la croissance des projets IA

Classement des développeurs IA

Classement des organisations IA

Deepseek

TTS

LLM

ChatGPT

Aperçu

« Journal AI du 30 juin » : Baidu ouvre le code de la série WENXIN Grand Model 4.5 ; modèle multimodal Qwen VLo de Tongyi Qianwen

AIbase基地

Cet article provient d'AIbase Daily