« Journal AI du 27 juin » : Tencent ouvre le code de son modèle Huan Yuan-A13B léger ; Ke Ling AI lance une fonction d'effets sonores vidéo

AIbase基地

Publié leActualités IA · 10 minutes de lecture · Jun 27, 2025

19.3k

Bienvenue sur le programme 【Journal de l'IA】 d'AIbase !

Découvrez les événements majeurs de l'IA du jour en trois minutes par jour, pour mieux comprendre les tendances de l'industrie de l'IA et les applications innovantes des produits d'IA.

Plus d'informations sur l'IA :https://www.aibase.com/zh

1. Tencent ouvre au public le modèle léger Huyuan-A13B, déployable sur une seule carte GPU de milieu de gamme

Capture d'écran WeChat_20250627155201.png

Tencent a lancé un nouveau membre de la famille de modèles Huyuan, le modèle Huyuan-A13B, qui utilise une architecture Mixture of Experts (MoE). Il comporte un total de 80 milliards de paramètres, dont 13 milliards activés, ce qui réduit significativement le délai de traitement et les coûts de calcul, offrant ainsi une solution d'IA plus rentable aux développeurs individuels et aux petites entreprises. Ce modèle se distingue particulièrement dans les tâches de raisonnement mathématique, scientifique et logique, et permet d'appeler des outils pour générer des réponses complexes.

Entrée d'essai : https://hunyuan.tencent.com/

Adresse de l'ouverture : https://github.com/Tencent-Hunyuan.

2. Keling AI lance la fonctionnalité "effets sonores vidéo", offrant une expérience immersive "ce que vous voyez, c'est ce que vous entendez"

Keling AI a lancé la fonctionnalité "effets sonores vidéo" pour toute sa série de modèles vidéo. Lorsque les utilisateurs créent des vidéos, ils peuvent générer simultanément des effets sonores stéréo, réalisant ainsi "ce que vous voyez, c'est ce que vous entendez". La fonction "génération d'effets sonores" a été améliorée avec un module "génération d'effets sonores à partir de vidéos", basé sur le modèle multimodal Klings-Foley développé par Keling, permettant une synchronisation au niveau des images et des sons. Cette fonction est actuellement gratuite pour tous les utilisateurs pendant une période limitée.

3. Black Forest ouvre au public FLUX.1Kontext [dev], une image de qualité comparable à celle de GPT-4o

Black Forest Labs a ouvert au public le modèle d'édition d'images FLUX.1Kontext [dev], basé sur une architecture de transformateur de correspondance de flux de 1,2 milliard de paramètres, compatible avec les appareils grand public. Son principal atout réside dans la perception contextuelle et l'édition précise, permettant de comprendre les entrées textuelles et visuelles, de générer et d'éditer véritablement en fonction du contexte, et de supporter l'édition itérative.

Adresse de l'ouverture : https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev

Github : https://github.com/black-forest-labs/flux。

4. OpenAI lance un nouveau modèle pour son API Deep Research : o3/o4-mini-deep research

OpenAI a lancé deux nouveaux modèles pour son API Deep Research : o3-deep-research et o4-mini-deep-research, conçus spécifiquement pour des analyses avancées et une synthèse d'informations approfondie, prenant en charge des fonctions telles que la recherche automatique sur Internet, l'analyse de données et l'exécution de code. En termes de prix, le modèle o3 coûte entre 10 et 40 dollars pour 1 000 appels, tandis que le modèle o4-mini est moins cher, avec un prix compris entre 2 et 8 dollars.

5. Des lunettes intelligentes Xiaomi à partir de 1 999 yuans, révolutionnent les accessoires intelligents, capables de prendre des photos, de payer et de jouer de la musique en une seule vue !

Xiaomi a lancé son premier produit d'accessoire intelligent, les lunettes Xiaomi AI, équipées de fonctionnalités de prise de vue en première personne, d'assistant vocal et d'enceinte ouverte. Grâce à la technologie électrochromique, ces lunettes offrent une expérience personnalisée. Elles sont légères, pesant seulement 40 grammes, et disposent d'une caméra avant de 12 mégapixels, capable de filmer et de diffuser en direct en 2K à 30 images par seconde.

6. Thunder lance un service MCP de téléchargement, laissez l'IA télécharger pour vous en une phrase !

Capture d'écran du navigateur Sogou 20250626192546.png

Thunder a lancé un service de téléchargement MCP, permettant à l'utilisateur de laisser l'IA effectuer automatiquement les tâches de téléchargement simplement en disant une phrase. Ce service est compatible avec la version PC de Thunder et Thunder NAS, et est actuellement gratuit pour tous les utilisateurs. Le service MCP de Thunder est capable de s'intégrer à plusieurs modèles d'IA majeurs, tels que Nano AI, Kouti Space, Cursor et Cherry Studio.

7. Génération de vidéos virales en un clic ! L'agent vidéo IA de HeyGen révolutionne le domaine de la création de contenus !

HeyGen a lancé un agent vidéo IA, capable de compléter automatiquement tout le processus de création de vidéos, de la planification de l'histoire à la rédaction du scénario et au choix des plans, en quelques minutes, produisant ainsi du contenu vidéo professionnel prêt à être publié. Il prend en charge divers types de vidéos, avec un processus simple, sans nécessiter de compétences spécialisées en édition vidéo. Des indications intelligentes guident l'utilisateur pour charger facilement les matériaux et définir les besoins créatifs, laissant l'IA accomplir toutes les tâches, du scénario à la vidéo finale.

8. Une grande nouvelle ! Google ouvre au public le modèle multimodal Gemma3n, capable de fournir des performances d'IA en cloud même sur un téléphone portable

Google a lancé et ouvert au public le modèle multimodal de bord Gemma3n, apportant des fonctions multimodales puissantes aux appareils de bord tels que les téléphones portables, les tablettes et les ordinateurs portables. Deux versions E2B et E4B sont proposées, avec respectivement 5 milliards et 8 milliards de paramètres initiaux, mais leur utilisation de mémoire ne représente que la moitié de celle des modèles traditionnels de 2 et 4 milliards de paramètres, pouvant fonctionner avec seulement 2 Go et 3 Go de mémoire RAM. Il prend naturellement en charge le traitement des entrées multimodales telles que les images, les sons, les vidéos et les textes, supportant la compréhension multimodale dans 140 langues de texte et 35 langues.

Adresse de l'ouverture : https://huggingface.co/collections/google/gemma-3n-685065323f5984ef315c93f4

Événement majeur ! Le premier grand modèle open source maritime de Chine, Cangyuan, voit le jour, facilitant l'ère de l'intelligence marine !

Le premier grand modèle open source dans le domaine marin, OceanGPT (Cangyuan), a été officiellement dévoilé à Hangzhou, en Chine. Cette innovation a été développée par le laboratoire national de technologie de perception précise des océans de l'Université Zhejiang, marquant une importante avancée dans le domaine des technologies marines en Chine. OceanGPT possède la capacité de répondre aux questions sur les connaissances de base en océanographie et peut interpréter naturellement les données multimodales telles que les images sonar et les cartes d'observation marine. Cette capacité permet à OceanGPT de se distinguer lors du traitement des données marines complexes. Ce modèle utilise également

Le modèle HuanYuan-A13B léger et open source de Tencent peut être déployé avec une seule carte GPU de milieu de gamme

Tencent a officiellement lancé et open-sourcé un nouveau membre de la famille de modèles HuanYuan : le modèle HuanYuan-A13B. Ce modèle utilise une architecture basée sur l'expertise mixte (MoE), avec un ensemble total de paramètres de 80 milliards et des paramètres activés de 13 milliards. Il maintient les performances des meilleurs modèles open source, tout en réduisant significativement le délai de traitement et les coûts de calcul, offrant ainsi une solution d'IA plus économique aux développeurs individuels et aux petites et moyennes entreprises.

Google launcht eine experimentelle AI-Versuchsanwendung Doppl: Neue virtuelle Modeerfahrung

Google hat am Donnerstag eine neue experimentelle Anwendung namens Doppl für iOS- und Android-Plattformen in den USA veröffentlicht, die es mit Hilfe von KI-Technologie ermöglichen soll, verschiedene Kleidungsstücke an sich selbst sichtbar zu machen. Die Anwendung verwendet KI, um digitale Darstellungen von Kleidung zu generieren, die auf dem eigenen Körper getragen werden können, und sogar statische Bilder in dynamische Videos umzuwandeln, um ein immersives Probiererlebnis zu bieten. Der Kernfunktionspunkt von Doppl besteht darin, dass Benutzer Fotos ihres gesamten Körpers hochladen können, und dann durch das Importieren von Kleidungsfotos oder Screenshot-Bildern diese auf ihrer digitalen Version anprobieren können.

À partir de 1999 yuans ! Les lunettes intelligentes AI de Xiaomi révolutionnent les accessoires intelligents, tout en un seul objectif : enregistrement, paiement et musique !

Le 26 juin, Xiaomi a présenté lors de la conférence sur l'écosystème « personne, voiture, maison » son premier produit d'accessoires intelligents à base d'IA : les lunettes intelligentes AI de Xiaomi. Ce modèle, qui allie design élégant et technologie avancée, se distingue par sa conception légère, ses puissantes fonctionnalités IA et son application dans divers scénarios, devenant rapidement un sujet de débat sur le marché. Selon AIbase, les lunettes intelligentes AI de Xiaomi ne disposent pas seulement des fonctions de prise de vue en première personne, d'assistant vocal et d'écouteurs ouverts, mais offrent également une expérience personnalisée grâce à une technologie électrochromique innovante, avec un prix à partir de 1999 yuans (environ 275 dollars américains)

Meta débauche un chercheur de niveau supérieur d'OpenAI, l'équipe d'intelligence super-ai de Meta gagne un nouveau talent

Alors que la concurrence dans le domaine de l'IA devient de plus en plus intense, Meta a annoncé cette nuit qu'elle avait réussi à recruter Trapit Bansal, un chercheur de haut niveau d'OpenAI, au sein de son nouveau département d'intelligence super-ai. Selon les informations de Techcrunch, un porte-parole d'OpenAI, Kayla Wood, a confirmé le départ de Bansal. Le profil LinkedIn de Bansal indique également qu'il n'est plus employé par OpenAI.

Flux.1 Kontext [dev] de Black Forest : un modèle d'édition d'images open source qui rivalise avec GPT-4o

Black Forest Labs a officiellement annoncé que son nouveau modèle d'édition d'images FLUX.1Kontext [dev] est désormais open source, suscitant une grande attention dans la communauté de l'intelligence artificielle. Ce modèle, dernier membre de la série FLUX.1, est réputé pour ses capacités d'édition d'images puissantes et sa performance élevée, ce qui le rend considéré comme une alternative open source compétitive face à GPT-4o. Le FLUX.1Kontext [dev] repose sur une architecture de transformateur de correspondance de flux de 12 milliards de paramètres, conçue spécifiquement pour les tâches d'édition d'images, et prend en charge les matériels de niveau consommateur.

Actualités IA

IA Quotidien

Chronologie de l'IA

Al hardware

Derniers cas

Collection d'images

Collection de vidéos

Collection audio

Collection de contenu

Derniers tutoriels

Classement des produits IA

Classement de la croissance du trafic IA

Classement de la baisse du trafic IA

Classement hebdomadaire de l'IA

États-Unis

Chine

Inde

Brésil

Génération d'images

Assistant personnel

Génération de personnages

Génération de vidéos

Classement des projets IA

Classement de la croissance des projets IA

Classement des développeurs IA

Classement des organisations IA

Deepseek

TTS

LLM

ChatGPT

Aperçu

« Journal AI du 27 juin » : Tencent ouvre le code de son modèle Huan Yuan-A13B léger ; Ke Ling AI lance une fonction d'effets sonores vidéo

AIbase基地

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

Événement majeur ! Le premier grand modèle open source maritime de Chine, Cangyuan, voit le jour, facilitant l'ère de l'intelligence marine !

Le modèle HuanYuan-A13B léger et open source de Tencent peut être déployé avec une seule carte GPU de milieu de gamme

Kling AI lance une fonction d'effets sonores vidéo pour offrir une expérience immersive où tout ce que l'on voit est entendu

Google launcht eine experimentelle AI-Versuchsanwendung Doppl: Neue virtuelle Modeerfahrung

OpenAI lance un nouveau modèle de l'API Deep Research : o3/o4-mini-deep research

À partir de 1999 yuans ! Les lunettes intelligentes AI de Xiaomi révolutionnent les accessoires intelligents, tout en un seul objectif : enregistrement, paiement et musique !

Découvrez ! Google lance open source le modèle multimodal Gemma3n, capable de fonctionner sur smartphone avec des performances d'IA en cloud

Générez en un clic des vidéos virales ! L'Agent vidéo AI de HeyGen révolutionne le domaine de la création de contenu !

​Meta débauche un chercheur de niveau supérieur d'OpenAI, l'équipe d'intelligence super-ai de Meta gagne un nouveau talent

Flux.1 Kontext [dev] de Black Forest : un modèle d'édition d'images open source qui rivalise avec GPT-4o

Meta débauche un chercheur de niveau supérieur d'OpenAI, l'équipe d'intelligence super-ai de Meta gagne un nouveau talent