Bienvenue dans le programme « Journal de l'IA » ! C'est votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les contenus les plus chauds du domaine de l'IA, en mettant l'accent sur les développeurs, pour vous aider à comprendre les tendances technologiques et à découvrir les applications innovantes des produits d'IA.
Produits d'IA frais cliquez pour en savoir plus :https://top.aibase.com/
1. Kunlun Wanjie lance officiellement le modèle SkyReels-A3 : les photos peuvent s'adapter au son
Le modèle SkyReels-A3 de la société Kunlun Wanjie repose sur le modèle de diffusion vidéo DiT et réalise la création d'avatar pilotée par le son. Ce modèle permet aux personnes présentes dans les images ou vidéos statiques ou animées de parler ou chanter selon le contenu du son, et il prend en charge le changement de dialogues et le contrôle des mouvements de caméra, offrant ainsi une solution technique d'IA efficace et pratique pour les publicités, les ventes en direct et les clips musicaux.
【Résumé d'AiBase :】
📷 SkyReels-A3 peut faire effectuer des performances dynamiques aux personnages présents dans des images ou vidéos statiques en fonction du contenu audio.
🎥 Il supporte la sortie de vidéos de 60 secondes par plan, et les plans multiples peuvent être illimités, répondant ainsi à différents besoins créatifs.
🔄 Il propose 8 paramètres prédéfinis pour les mouvements de caméra, ajustables en intensité, pour obtenir des effets professionnels.
Lien détaillé : https://skyworkai.github.io/skyreels-a3.github.io/
2. xAI, fondée par Musk, annonce que le modèle d'IA Grok 4 est désormais gratuit et accessible à tous
L'entreprise xAI a annoncé que le modèle d'intelligence artificielle Grok4 sera désormais gratuit et accessible à tous les utilisateurs du monde entier, leur offrant des outils d'IA avancés.
【Résumé d'AiBase :】
🤖 Le modèle d'intelligence artificielle Grok4 est désormais gratuit et accessible à tous les utilisateurs du monde entier.
⚙️ Il propose des modes Auto et Expert pour répondre aux différents besoins des utilisateurs.
🌐 L'ouverture gratuite pourrait favoriser la diffusion et l'application de la technologie d'IA.
3. Open AI présente un guide complet pour GPT-5 : déverrouiller une nouvelle ère de programmation et de multimodalité avec l'IA
L'article présente en détail le modèle GPT-5 d'Open AI et son guide de prompt officiel, soulignant ses améliorations concernant les tâches complexes, la programmation et l'interaction multimodale. Le guide propose des stratégies d'optimisation, comme l'ajustement de la force de raisonnement, le contrôle de la tendance des agents et l'utilisation de préambules d'outils, pour aider les utilisateurs à maximiser le potentiel de GPT-5.
【Résumé d'AiBase :】
🧠 GPT-5 améliore les performances des tâches d'agents, de la génération de code et de l'obéissance aux instructions grâce à une conception précise des prompts.
💻 Il soutient la génération de interfaces frontales, le débogage de grands dépôts de code et l'utilisation d'API Responses pour améliorer l'efficacité de la génération de code.
🖼️ Il intègre des fonctions d'interaction multimodale, y compris le traitement du texte, des images et du son, ainsi que des paramètres personnalisés, pour renforcer sa praticité.
Lien détaillé : https://cookbook.openai.com/examples/gpt-5/gpt-5_prompting_guide
4. Baidu Search lance officiellement la fonction de recherche d'IA sur le bureau
Baidu Search a lancé officiellement une série de fonctions d'IA sur le bureau, transformant l'entrée traditionnelle d'information en un centre de tâches. Les modules « Super Double Line Box » et « Bureau de travail » ajoutés offrent une intégration d'outils d'IA lecture, écriture et PPT, améliorant ainsi l'efficacité de la recherche et l'expérience de travail. En outre, le nombre d'utilisateurs actifs mensuels de la recherche d'IA de Baidu dépasse 322 millions, occupant la première place du secteur de la recherche d'IA en Chine.
【Résumé d'AiBase :】
🧠 La version PC de Baidu Search a lancé officiellement des fonctions d'IA, améliorant l'expérience de recherche.
🛠️ Le module « Bureau de travail » a été ajouté, intégrant des outils d'IA lecture, écriture et PPT.
📈 Le nombre d'utilisateurs actifs mensuels atteint 322 millions, Baidu occupe la première place du secteur de la recherche d'IA en Chine.
5. Windows 11 Copilot intègre gratuitement GPT-5, avec des limites d'utilisation bien plus faibles que ChatGPT
Microsoft a annoncé que l'application Copilot des systèmes Windows 11 et Windows 10 prend désormais en charge le mode intelligent GPT-5. Cette fonctionnalité est réalisée via la technologie de routage Web, permettant aux utilisateurs d'activer le mode intelligent sans mise à jour, et ses limites d'utilisation sont plus souples que celles de ChatGPT.
【Résumé d'AiBase :】
🌟 Copilot prend désormais en charge le mode intelligent GPT-5, offrant une expérience utilisateur fluide.
💬 Par rapport à ChatGPT, les limites d'utilisation de Copilot sont plus larges, augmentant ainsi la liberté.
🖥️ Les utilisateurs peuvent accéder gratuitement à Copilot et GPT-5 en quelques étapes simples, facilitant l'accès à l'information.
6. Baichuan Intelligence dépasse OpenAI ! Le modèle médical open source Baichuan-M2 devient le meilleur au monde
Le modèle médical amélioré open source Baichuan-M2 de Baichuan Intelligence a obtenu 60,1 points lors de l'évaluation HealthBench, surpassant le modèle gpt-oss120b d'OpenAI et se positionnant en tête des autres modèles open source à l'international. Après un traitement extrêmement léger, ce modèle peut être déployé sur une seule carte, réduisant considérablement les coûts pour les établissements médicaux. En outre, Baichuan-M2 possède des capacités de traitement de problèmes médicaux complexes comparables à celles de GPT-5, montrant un grand potentiel d'application.
【Résumé d'AiBase :】
🌟 Baichuan-M2 a obtenu 60,1 points lors de l'évaluation HealthBench, devenant ainsi le modèle médical open source le plus avancé au monde.
💡 Le modèle a été optimisé pour être léger, pouvant être déployé sur une seule carte, réduisant ainsi significativement les coûts pour les établissements médicaux.
🚀 Baichuan-M2 montre des capacités de traitement de problèmes médicaux complexes comparables à celles de GPT-5, avec un grand potentiel d'application.
Lien détaillé : https://huggingface.co/baichuan-inc/Baichuan-M2-32B
7. Apple annonce que GPT5 rejoindra iOS 26 : iOS 26 intégrera ChatGPT5
Apple a annoncé qu'elle intégrera le modèle ChatGPT-5 dans le système iOS 26 qui sera lancé le mois prochain. Cela améliorera considérablement les performances d'Apple Intelligence et apportera une série de nouvelles fonctionnalités, telles que la traduction en temps réel et l'optimisation de la recherche de contenu. Les utilisateurs pourront utiliser ces fonctionnalités sans compte OpenAI, mais les comptes associés bénéficieront de plus d'avantages.
【Résumé d'AiBase :】
🧠 ChatGPT-5 sera intégré dans iOS 26, améliorant ainsi les performances d'Apple Intelligence.
🌐 De nouvelles fonctionnalités comme la traduction en temps réel amélioreront l'expérience d'interaction multilingue.
💰 Les comptes associés à OpenAI bénéficieront d'avantages d'abonnement, offrant davantage de choix.
8. Google lance BlenderFusion : un nouveau cadre pour la modification et la génération synthétique en 3D
BlenderFusion, lancé par Google, est un cadre innovant visant à améliorer les capacités de modification et de génération synthétique en 3D, offrant aux designers et créateurs des outils de création plus intuitifs et efficaces.
【Résumé d'AiBase :】
🎨 BlenderFusion intègre des outils avancés de modification en 3D et des modèles de diffusion, permettant une modification et une génération synthétique efficaces en 3D.
🛠️ Le processus de travail de ce cadre inclut trois étapes : hiérarchisation, modification et synthèse, permettant aux utilisateurs de modifier facilement les objets 3D et de générer des images finales.
📈 Grâce à l'optimisation du modèle, BlenderFusion améliore la capacité de traitement des scènes complexes, aidant ainsi les designers à réaliser leurs créations.
Lien détaillé : https://blenderfusion.github.io/
9. Kitten TTS, un modèle TTS ultra petit : seulement 15 millions de paramètres
Kitten TTS est un modèle open source de synthèse vocale léger, avec seulement 15 millions de paramètres et un volume inférieur à 25 Mo, adapté à plusieurs appareils. Il prend en charge l'exécution sans GPU, permettant une synthèse vocale de haute qualité sur un processeur ordinaire, et fournit des guides d'installation et d'utilisation simples, facilitant ainsi l'adoption rapide par les utilisateurs.
【Résumé d'AiBase :】
🐱 Kitten TTS est un modèle open source de synthèse vocale léger, avec un volume inférieur à 25 Mo, adapté à divers appareils.
⚡ Le modèle prend en charge l'exécution sans GPU, garantissant aux utilisateurs une synthèse vocale de haute qualité même sur un processeur ordinaire.
🚀 Kitten TTS propose des guides d'installation et d'utilisation simples, permettant aux utilisateurs de créer rapidement des audios.
Lien détaillé : https://huggingface.co/KittenML/kitten-tts-nano-0.1
10. MiniCPM-V 4.0, un modèle visuel puissant, offre une meilleure performance sur mobile
MiniCPM-V 4.0, la dernière version de la série MiniCPM-V, excelle dans la compréhension visuelle, le traitement de plusieurs images et vidéos, et a obtenu un score élevé de 69,0 lors de l'évaluation OpenCompass, surpassant plusieurs modèles similaires. Conçu spécifiquement pour les appareils mobiles, il répond rapidement sans surchauffe, et propose plusieurs façons d'utilisation et des outils open source facilitant l'adoption par les utilisateurs.
【Résumé d'AiBase :】
🌟 MiniCPM-V4.0 a obtenu un score de 69,0 lors de l'évaluation OpenCompass, surpassant plusieurs modèles similaires.
📱 Ce modèle est conçu spécifiquement pour les appareils mobiles, répondant rapidement sans surchauffe.
📚 Une application open source iOS et des guides d'utilisation détaillés sont disponibles, permettant aux utilisateurs de s'initier facilement.
Lien détaillé : https://huggingface.co/openbmb/MiniCPM-V-4
11. Rapport de Stripe : l'économie de l'IA connaît une croissance exponentielle, dépassant trois fois celle des SaaS
Le dernier rapport publié par Stripe révèle le développement rapide de l'économie de l'IA, notamment la vitesse de croissance des revenus, l'expansion mondiale et l'innovation des modèles commerciaux. Le rapport indique que les startups IA atteignent les jalons de revenus à une vitesse bien supérieure à celle des entreprises technologiques précédentes, et possèdent une « génétique globale » innée.