Bienvenue dans le programme « Journal de l'IA » ! C'est votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les sujets d'actualité dans le domaine de l'IA, en mettant l'accent sur les développeurs, afin que vous puissiez comprendre les tendances technologiques et découvrir des applications innovantes de l'IA.

Produits d'IA nouveaux cliquez pour en savoir plus : https://app.aibase.com/zh

1. DINGTALK célèbre son 10e anniversaire avec la lancement de la version 8.0, introduisant une nouvelle forme d'application de bureau intelligente : DINGTALK ONE

DINGTALK a lancé sa version 8.0 à l'occasion de son 10e anniversaire, introduisant une nouvelle forme d'application de bureau intelligente appelée DINGTALK ONE. Ce produit permet l'interaction entre les humains et l'IA par le biais de dialogues en langage naturel, simplifiant les processus de travail complexes et réduisant les barrières d'utilisation. En outre, DINGTALK a présenté sa position sur le marché et son niveau d'acceptation par les utilisateurs, notamment en matière de nombre d'organisations entreprises, de nombre d'organisations payantes et de quantité d'applications d'IA.

image.png

【Résumé par AiBase :】

✨ DINGTALK lance la version 8.0, introduisant une nouvelle forme d'application de bureau intelligente : DINGTALK ONE.

🤖 DINGTALK ONE permet l'interaction entre les humains et l'IA via le langage naturel, simplifiant les processus de travail.

📊 DINGTALK a démontré sa position sur le marché et son acceptation par les utilisateurs, y compris le nombre d'organisations entreprises et le nombre d'applications d'IA.

2. Alibaba ouvre au public Mobile-Agent 3 : une famille d'agents puissants

L'équipe X-PLUG a lancé Mobile-Agent-v3, un cadre multi-agents à travers les plateformes, doté de fonctionnalités puissantes et d'une performance optimisée, adapté aux tâches d'automatisation GUI.

image.png

【Résumé par AiBase :】

🧠 Mobile-Agent-v3 repose sur GUI-Owl, offrant des capacités puissantes de planification, de gestion du progrès, de réflexion et de mémoire.

⚙️ L'adaptation des gestionnaires d'anomalies et des capacités de réflexion a été optimisée, garantissant une opération efficace même en cas de perturbations.

📚 Des rapports techniques, des vidéos de démonstration et des bibliothèques de code sont fournis pour faciliter l'exploration des possibilités par les développeurs.

Lien vers les détails : https://github.com/X-PLUG/MobileAgent

3. Le podcast IA de WeChat fait sensation ! Une diffusion en dialogue à deux personnes, les animateurs traditionnels risquent-ils de perdre leur emploi ?

WeChat teste une fonctionnalité appelée « podcast IA », qui diffuse des nouvelles sous forme de dialogue à deux personnes, offrant aux utilisateurs une expérience immersive d'information. Cette fonctionnalité s'appuie sur les contenus de nouvelles et utilise la technologie IA pour transformer le texte en un format de diffusion fluide et naturel, changeant ainsi le mode traditionnel de consommation d'informations.

image.png

【Résumé par AiBase :】

✨ WeChat lance une fonctionnalité de podcast IA, diffusant des nouvelles sous forme de dialogue à deux personnes, améliorant l'expérience utilisateur.

💡 Le podcast IA s'appuie sur les informations des médias autorisés et des gouvernements locaux, assurant la précision et la fiabilité du contenu.

🚀 Il pourrait éventuellement s'étendre à des scénarios comme la lecture de longs textes et le rappel des discussions, redéfinissant ainsi la manière d'obtenir de l'information.

4. DINGTALK lance son premier appareil IA : le produit d'enregistrement vocal DingTalk A1

Le PDG de DINGTALK, Chen Hang, a lancé son premier appareil IA, le DingTalk A1, lors de la conférence de l'anniversaire de dix ans. Épais de seulement 3,8 millimètres, cet appareil permet aux utilisateurs d'enregistrer clairement le contenu vocal et offre un service de transcription précis. De plus, il intègre 36 modèles d'agents pour le travail et la vie, augmentant ainsi l'efficacité de la prise de notes en réunion et de la synthèse de travail.

image.png

【Résumé par AiBase :】

🔋 Le DingTalk A1 est un appareil IA d'une épaisseur de seulement 3,8 mm, facile à transporter.

🎙️ Il supporte une reconnaissance vocale claire à une distance de 8 mètres et propose un service gratuit de transcription de 10 000 minutes, avec une précision de 97 %.

🤖 Il intègre 36 modèles d'agents pour le travail et la vie, améliorant ainsi l'efficacité professionnelle.

5. Siri d'Apple pourrait intégrer le modèle géant Gemini de Google, renforçant ses capacités d'IA

Apple explore une collaboration avec Google, prévoyant d'introduire une version personnalisée du modèle géant Gemini pour la mise à jour de Siri prévue pour 2026, afin d'améliorer les capacités d'IA de ce logiciel d'assistance vocale. Cette initiative reflète la pression concurrentielle qu'Apple subit dans le domaine de l'IA et vise à combler les lacunes de Siri grâce à une collaboration avec Google, offrant ainsi aux utilisateurs une expérience d'interaction plus intelligente et efficace.

image.png

【Résumé par AiBase :】

🍎 Apple prévoit de collaborer avec Google pour intégrer le modèle géant Gemini à Siri.

🤖 Cela vise à renforcer les capacités d'IA de Siri, améliorant ainsi l'expérience d'interaction utilisateur.

📈 Cette collaboration pourrait avoir un impact profond sur la structure du marché des assistants d'IA.

6. Apple publie une version adaptée du modèle SlowFast-LLaVA : performances en analyse vidéo longue supérieures aux modèles de grande taille

Le modèle adaptatif SlowFast-LLaVA publié par l'équipe de recherche d'Apple montre d'excellentes performances dans les tâches d'analyse de vidéos longues, surpassant même les modèles avec un plus grand nombre de paramètres. Ce modèle utilise une architecture à deux flux, résolvant efficacement les problèmes de redondance d'informations et de dépassement de la fenêtre contextuelle dans les modes de traitement par image individuelle, offrant ainsi une solution efficace pour l'analyse de contenus vidéo longue.

image.png

【Résumé par AiBase :】

🍎 Le principal avantage réside dans l'architecture à deux flux, optimisant l'efficacité du traitement vidéo.

📈 Sur le benchmark LongVideoBench, le modèle de 10 milliards de paramètres obtient 56,6 points.

🔧 Le modèle est entraîné et open source sur des jeux de données publics, offrant de nouvelles idées à la communauté d'IA.

7. Meta investit lourdement pour obtenir une licence de Midjourney ! La course aux armes d'IA de Zuckerberg continue

Meta a conclu un accord de licence technique avec Midjourney, renforçant ainsi sa compétitivité dans le domaine de la génération d'images par IA. Cette collaboration représente une étape importante dans l'expansion d'IA de Meta, tout en illustrant la concurrence intense actuelle dans le secteur de l'IA.

image.png

【Résumé par AiBase :】

🔥 Meta a conclu un accord de licence technique avec Midjourney, améliorant ainsi ses capacités de génération d'images par IA.

💡 Zuckerberg accélère l'acquisition de talents et de ressources en IA par des salaires élevés et des investissements.

⚖️ Midjourney fait face à des défis juridiques, mais reste indépendant.

8. Les mises à jour importantes du montage vidéo de Google Drive ! Outil Vids AI accessible en un clic, la barrière de création vidéo diminue encore

Google a ajouté un bouton de montage vidéo rapide Vids dans Google Drive, permettant aux utilisateurs de réaliser plus facilement des montages vidéo. Cette fonctionnalité simplifie non seulement le processus d'utilisation, mais réduit également la barrière de création vidéo, améliorant ainsi l'expérience des utilisateurs de Workspace.

image.png

【Résumé par AiBase :】

🚀 Google a ajouté un bouton de montage vidéo rapide Vids à Google Drive, améliorant ainsi l'efficacité du traitement vidéo.

💡 Vids dispose de fonctions pilotées par l'IA, comme la rédaction automatique de scénarios et la restructuration intelligente des fragments, simplifiant ainsi la création vidéo.

🌐 Google intègre des outils d'IA dans les tâches quotidiennes, stimulant ainsi l'innovation des outils de productivité.

9. Quark publie un rapport technique sur le grand modèle de santé, révélant les détails techniques du « médecin-chef » d'IA

Le grand modèle de santé de Quark a réussi les tests écrits de 12 disciplines médicales principales en Chine, devenant ainsi le premier grand modèle à accomplir ce défi en Chine. Ce modèle se distingue par ses performances dans les tâches complexes de raisonnement médical et améliore ses performances grâce à des données médicales de haute qualité et à la technique d'apprentissage renforcé.

image.png

【Résumé par AiBase :】

✨ Le grand modèle de santé de Quark a réussi les tests écrits des médecins-chefs, démontrant une forte capacité professionnelle.

🧠 Il est formé sur trois types de données médicales, améliorant ainsi la précision et la capacité de raisonnement du modèle.

🚀 L'introduction d'une phase d'apprentissage renforcé optimise la qualité et la conformité des sorties du modèle.

Lien vers les détails : https://arxiv.org/pdf/2508.11894 https://github.com/Quark-Medical/QuarkMed/blob/main/report/QuarkMed_Technical_Report.pdf

10. Une folie mondiale pour dessiner des poissons ! Des millions de internautes s'adonnent à ce jeu d'IA, transformant rapidement des dessins simples en poissons vivants

Cet article explore comment le jeu d'IA Draw A Fish, grâce à son design minimaliste et à son mécanisme d'interaction sociale, a rapidement suscité une vague de popularité à travers le monde, montrant la beauté de la combinaison de la technologie IA et de la créativité humaine.

image.png

【Résumé par AiBase :】

🐟 La technologie IA transforme rapidement des dessins simples en poissons virtuels dynamiques, offrant une expérience créative unique.

🎮 Le jeu est simple à utiliser, sans nécessiter d'inscription pour participer, attirant ainsi de nombreux utilisateurs immergés dans le jeu.

🌐 Le mécanisme d'interaction sociale stimule la passion créative des joueurs du monde entier, créant ainsi un espace de présentation créative.