Bienvenue sur la rubrique 【AI日报】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en nous concentrant sur les développeurs et en vous aidant à comprendre les tendances technologiques et les applications innovantes des produits IA.

Nouveaux produits IA : Cliquez ici pour en savoir plus : https://top.aibase.com/

1. Lancement officiel des versions 4.0o1 et 4o du modèle TianGong de Kunlun Wanwei

Le 6 janvier 2025, le groupe Kunlun Wanwei a lancé ses dernières versions du « modèle TianGong 4.0 », les versions 4.0o1 et 4o, marquant une avancée majeure dans le domaine de l'intelligence artificielle. La version 4.0o1 est le premier modèle en Chine capable de raisonnement logique en chinois. Grâce à des améliorations techniques, il peut relever de nombreux défis de raisonnement. La version 4o est quant à elle un modèle multi-modalités, doté de capacités d'expression émotionnelle et multilingues, offrant aux utilisateurs une expérience de conversation plus naturelle.

image.png

【Résumé AiBase :】

🧠 La version 4.0o1 possède des capacités de raisonnement logique en chinois, améliorées techniquement pour gérer les défis de raisonnement mathématiques, de codage, etc.

💬 La version 4o est un modèle multi-modalités, offrant une expression émotionnelle et un assistant conversationnel vocal en temps réel et réactif, Skyo.

🌐 Le lancement de ces deux modèles a stimulé les progrès technologiques et l'expansion des applications de Kunlun Wanwei dans le domaine de l'IA.

Lien détaillé : https://www.tiangong.cn/

2. Lancement officiel de « J1Assistant », le nouvel assistant IA de Luo Yonghao, révolutionnant l'interaction vocale intelligente

Le projet d'intelligence artificielle de Luo Yonghao, Jarvis, a lancé un logiciel d'assistant IA appelé « J1Assistant », actuellement disponible uniquement à l'étranger pour les appareils Android. Le point fort de ce logiciel réside dans sa fonction d'entrée audio, permettant aux utilisateurs d'envoyer facilement des messages, de rechercher des informations ou d'interagir avec le modèle IA par la voix. J1Assistant intègre le propre modèle IA de Jarvis et possède une fonction de prise de notes pour aider les utilisateurs à gérer leurs tâches quotidiennes.

【Résumé AiBase :】

🎤 J1Assistant propose une fonction d'entrée audio, permettant aux utilisateurs de réaliser des actions par la voix pour une meilleure expérience interactive.

📅 Intégration du modèle IA propriétaire de Jarvis, fournissant des réponses utiles et une fonction de prise de notes pour aider les utilisateurs à gérer leurs tâches.

🌍 Actuellement uniquement disponible sur Android, de nouvelles fonctionnalités et plateformes devraient être ajoutées pour répondre aux besoins des utilisateurs.

3. iQiyi poursuit MiniMax : un modèle IA accusé de violation de droits d'auteur, 100 000 yuans de dommages et intérêts réclamés

Des médias ont rapporté qu'iQiyi a intenté une action en justice contre la start-up d'IA MiniMax, l'accusant de violation de droits d'auteur lors de l'entraînement de son modèle. MiniMax est accusé d'avoir utilisé sans autorisation le contenu d'iQiyi pour générer du contenu illicite. iQiyi exige que MiniMax cesse immédiatement ses violations et réclame 100 000 yuans de dommages et intérêts. MiniMax pourrait se défendre en arguant que le contenu était du domaine public ou qu'il s'agissait de données saisies par les utilisateurs, afin d'obtenir une exonération de responsabilité juridique. L'affaire n'a pas encore fait l'objet de déclarations publiques de la part des deux parties, et le litige juridique est en cours.

【Résumé AiBase :】

⚖️ iQiyi a poursuivi MiniMax en justice pour violation de droits d'auteur.

📜 MiniMax est accusé d'avoir utilisé sans autorisation du contenu protégé par les droits d'auteur d'iQiyi pour l'entraînement de son modèle.

💰 iQiyi réclame à MiniMax l'arrêt de la violation et le versement de dommages et intérêts d'environ 100 000 yuans.

4. Produit par l'équipe d'Alibaba ! La technologie de transfert de maquillage SHMT : obtenez un maquillage parfait avec une simple image de référence

Le modèle SHMT, récemment développé par le laboratoire de recherche d'Alibaba, le DAMO Academy, utilise un modèle de diffusion latent pour transférer avec précision les effets de maquillage. Il a été accepté par la conférence académique internationale de premier plan NeurIPS 2024. Cette technologie, grâce à une simple image de référence de maquillage et une photo du sujet, permet de générer rapidement des effets de maquillage, stimulant considérablement le développement des applications de maquillage et du traitement d'images.

image.png

【Résumé AiBase :】

🎓 Le modèle SHMT utilise un modèle de diffusion latent pour transférer les effets de maquillage et a été accepté par NeurIPS 2024.

🔧 L'équipe fournit le code source complet et les modèles pré-entraînés pour faciliter l'application et l'amélioration par les chercheurs.

📂 La préparation des données et l'ajustement des paramètres sont essentiels. L'étude guide en détail les procédures et la structure des répertoires.

Lien détaillé : https://github.com/Snowfallingplum/SHMT

5. ByteDance open-source un nouveau modèle d'IA, LatentSync, pour un contrôle précis de la synchronisation labiale

LatentSync, développé par ByteDance, est une technologie de pointe de synchronisation labiale de bout en bout qui utilise un modèle de diffusion latent conditionnel à l'audio pour assurer une correspondance précise entre les mouvements des lèvres d'une personne dans une vidéo et l'audio. Cette technologie, grâce à l'introduction de la technologie TREPA, améliore la cohérence temporelle et optimise la convergence de SyncNet, améliorant ainsi considérablement la précision de la synchronisation labiale.

【Résumé AiBase :】

🎤 Cadre de bout en bout : LatentSync ne nécessite pas de représentation intermédiaire du mouvement, générant directement les mouvements des lèvres à partir de l'audio.

🌟 Génération de haute qualité : utilisation de Stable Diffusion pour générer des vidéos parlées dynamiques et réalistes, améliorant l'effet visuel.

⏱️ Cohérence temporelle : la technologie TREPA améliore la cohérence temporelle entre les images vidéo pour garantir la précision de la synchronisation labiale.

Lien détaillé : https://github.com/bytedance/LatentSync

6. Meta publie une nouvelle technologie de couche mémoire : dépassement des limites des paramètres, amélioration significative de la précision factuelle de l'IA

Meta a récemment présenté une technologie de couche mémoire innovante visant à améliorer la précision factuelle des grands modèles linguistiques et à étendre l'échelle des paramètres. Cette technologie, grâce à un mécanisme de recherche clé-valeur entraînable, améliore considérablement les capacités de stockage et de récupération d'informations du modèle. Les résultats expérimentaux montrent que les modèles équipés de la couche mémoire affichent d'excellentes performances dans de nombreuses tâches, notamment les tâches factuelles.

image.png

【Résumé AiBase :】

🧩 La technologie de couche mémoire améliore la précision factuelle grâce à un mécanisme d'activation clairsemé, atteignant une échelle de 128 milliards de paramètres.

🚀 Les expériences montrent que les modèles équipés de la couche mémoire surpassent les modèles denses traditionnels dans des tâches telles que les questions-réponses factuelles.

🔧 Les chercheurs ont optimisé la couche mémoire à plusieurs égards, améliorant les performances et la stabilité, démontrant une forte extensibilité.

Lien détaillé : https://arxiv.org/pdf/2412.09764

7. Yukai lance le robot de compagnie « Mirumi » : une douceur pelucheuse pour une expérience émotionnelle digne d'un bébé

Yukai Engineering, connue pour ses produits robotiques innovants, lance Mirumi, une petite boule pelucheuse qui tient dans un portefeuille et qui tourne la tête spontanément pour observer les personnes autour d'elle. Ce robot vise à imiter la naïveté et la joie d'un bébé, offrant une expérience interactive agréable. Inspiré des yokai japonais, Mirumi utilise la détection de mouvement pour exprimer diverses émotions, telles que la curiosité et la timidité, soulignant la position unique de Yukai dans le domaine des robots insolites.

【Résumé AiBase :】

👶 Mirumi est une petite boule pelucheuse qui tourne spontanément la tête pour observer les alentours, procurant une sensation de plaisir.

🤔 Ce robot exprime ses émotions par la détection de mouvement, imitant la naïveté et l'interaction d'un bébé.

🎉 Mirumi, inspiré des yokai japonais, vise à recréer la joie de l'interaction avec un bébé.

8. OpenAI commence à se concentrer sur la « superintelligence »

Sam Altman, PDG d'OpenAI, a annoncé sur son blog que l'entreprise maîtrisait les technologies clés pour construire une intelligence artificielle générale (AGI) et qu'elle se concentrait désormais sur la superintelligence. Il estime que la superintelligence améliorera considérablement la vitesse des découvertes scientifiques et de l'innovation, stimulant la prospérité sociale. Malgré les limites actuelles de la technologie, telles que les « hallucinations » et les coûts de fonctionnement élevés, Altman est confiant dans l'avenir et pense que les progrès technologiques modifieront le calendrier.

【Résumé AiBase :】

🌟 Sam Altman, PDG d'OpenAI, a déclaré que l'entreprise maîtrisait la technologie de construction de l'AGI et qu'elle se concentrait désormais sur la superintelligence.

🔍 L'AGI est définie comme un système hautement autonome surpassant économiquement les humains, un objectif clairement défini dans l'accord entre OpenAI et Microsoft.

🚀 Malgré les limites actuelles de la technologie, Altman est confiant dans l'avenir et estime que le calendrier évoluera avec les progrès technologiques.

9. Jeffrey Wang, chercheur chinois de Harvard, rejoint OpenAI pour se concentrer sur le pré-entraînement et l'inférence des modèles

Jeffrey Wang, chercheur chinois de l'université de Harvard, a récemment rejoint OpenAI pour se concentrer sur le pré-entraînement et l'inférence des modèles. Ses réalisations académiques et son expérience de recherche ont suscité un vif intérêt, notamment ses contributions dans les domaines de l'apprentissage automatique et de la confidentialité. L'arrivée de Jeffrey représente non seulement une étape importante dans sa carrière, mais témoigne également de l'attrait d'OpenAI pour les meilleurs talents, présageant un développement florissant de la recherche en IA.

image.png

【Résumé AiBase :】

🎓 Pendant son séjour à Harvard, Jeffrey Wang a activement participé à la recherche en apprentissage automatique et en statistique, et a enseigné des cours connexes.

📄 Ses travaux de recherche ont été publiés dans plusieurs conférences internationales, explorant la confidentialité des modèles linguistiques et l'équité des modèles de diffusion.

🌟 L'arrivée de Jeffrey Wang souligne la capacité d'OpenAI à attirer les meilleurs talents et à stimuler le développement du domaine de l'IA.

10. Microsoft prévoit d'investir 80 milliards de dollars dans la construction de centres de données d'intelligence artificielle pour l'exercice 2025

Microsoft prévoit d'investir 80 milliards de dollars pour l'exercice 2025 dans la construction de centres de données spécialement conçus pour gérer les charges de travail de l'intelligence artificielle. Cet investissement vise à accélérer l'entraînement des modèles d'IA et le déploiement mondial des applications cloud, soulignant le rôle important des États-Unis dans la nouvelle vague technologique. Avec le développement rapide de la technologie de l'IA, l'investissement de Microsoft représente non seulement une expansion de ses propres activités, mais reflète également le besoin urgent d'infrastructures, offrant à l'avenir un soutien puissant à la transformation numérique de nombreux secteurs.

【Résumé AiBase :】

💰 Plus de la moitié des fonds seront utilisés pour la construction aux États-Unis, soulignant son importance dans la technologie de l'IA.

🌐 La relation concurrentielle entre Microsoft et OpenAI est de plus en plus tendue, ce qui pourrait affecter la configuration du secteur à l'avenir.

⚡ Avec l'augmentation de la demande en technologie IA, la demande d'électricité augmente également fortement, les centres de données étant confrontés à un risque de pénurie d'électricité.

11. Incroyable ! L'IA peut « entendre » les signaux annonçant un incendie imminent dans les batteries au lithium

Les batteries lithium-ion sont omniprésentes dans notre vie quotidienne, mais leur surchauffe ou leur endommagement peuvent provoquer des incendies graves. En 2023, la ville de New York a connu de nombreux incendies causés par des batteries de vélos électriques, faisant plusieurs victimes. Pour faire face à ce risque, l'équipe de recherche du NIST a mis au point une technologie d'alerte incendie basée sur le son, capable d'identifier le bruit de la rupture du clapet de sécurité d'une batterie grâce à un algorithme d'IA, et ce, environ deux minutes à l'avance.

image.png

【Résumé AiBase :】

🔥 L'équipe de recherche du NIST a mis au point une technologie d'alerte incendie pour les batteries au lithium basée sur le son, utilisant l'IA pour identifier le bruit de la rupture du clapet de sécurité.

🔊 L'algorithme entraîné affiche un taux de reconnaissance de 94 %, conservant une détection efficace même en présence de nombreux bruits parasites.

⏳ Le nouveau détecteur d'incendie devrait fournir un avertissement d'environ deux minutes à l'avance, permettant aux personnes de s'échapper à temps.