Bienvenue à la rubrique 【AI日报】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en nous concentrant sur les développeurs, pour vous aider à comprendre les tendances technologiques et les applications innovantes des produits d'IA.

Nouveaux produits IA Cliquez pour en savoir plus : https://top.aibase.com/

1. Manus, le premier agent intelligent universel au monde, fait fureur, les codes d'invitation sont revendus jusqu'à 50 000 yuans

Manus, le premier agent intelligent universel au monde, a suscité un vif intérêt dans le monde de la technologie. Manus possède la capacité de penser de manière indépendante et d'exécuter des tâches complexes, capable de fournir des résultats complets, démontrant ainsi une grande polyvalence. Il peut non seulement gérer les tâches quotidiennes, mais aussi effectuer des études de marché approfondies, planifier des voyages personnalisés et bien d'autres tâches. Sur le marché de la revente, le prix des codes d'invitation Manus varie de 999 yuans à 50 000 yuans, certains vendeurs refusant même les négociations, ce qui souligne la rareté du produit.

image.png

【Résumé AiBase :】

🚀 Manus possède la capacité de penser de manière indépendante et d'exécuter des tâches complexes, démontrant une grande polyvalence et un pouvoir d'exécution.

📊 Dans de nombreux domaines tels que les études de marché et la planification de voyages, les exemples d'application de Manus montrent son utilité et son efficacité.

🏆 Manus a établi un nouveau record lors du test de référence GAIA, ses performances techniques dépassant largement celles des produits similaires, prouvant ainsi sa position de leader.

Lien détaillé : https://manus.im/

2. Alibaba publie le nouveau modèle d'inférence de grande taille QwQ-32B, dont les performances sont comparables à celles de DeepSeek-R1, avec une demande de mémoire vidéo réduite

L'équipe Qwen d'Alibaba a publié le modèle linguistique de grande taille open source QwQ-32B, visant à améliorer ses performances dans les tâches de résolution de problèmes complexes grâce à l'apprentissage par renforcement. Ce modèle, basé sur 32 milliards de paramètres et une longueur de contexte étendue de 131 072 jetons, peut rivaliser avec des modèles à plus de paramètres dans des tests de référence tels que les mathématiques et la programmation, tout en nécessitant moins de mémoire vidéo.

image.png

【Résumé AiBase :】

🚀 QwQ-32B utilise la technique d'apprentissage par renforcement pour améliorer sa capacité à résoudre des problèmes complexes.

💡 Ses performances dans les tests de référence de mathématiques et de programmation sont comparables à celles de modèles à plus de paramètres, avec une demande de mémoire vidéo réduite.

🧠 Il possède une longueur de contexte étendue et des capacités agentiques, et les recherches sur le potentiel de l'apprentissage par renforcement se poursuivront.

Lien détaillé : https://qwenlm.github.io/blog/qwq-32b/

3. OpenAI annonce que GPT-4.5 sera progressivement mis à la disposition de tous les utilisateurs de ChatGPT Plus

OpenAI a récemment annoncé que son dernier modèle d'intelligence artificielle, GPT-4.5, serait progressivement mis à la disposition des utilisateurs de ChatGPT Plus. Bien que ce modèle présente une amélioration significative des capacités de conversation, il présente encore des lacunes en matière de raisonnement complexe. Son coût d'utilisation élevé, à 150 dollars par million de jetons, suscite des inquiétudes quant à son adoption généralisée.

image.png

【Résumé AiBase :】

💬 GPT-4.5 est le dernier et plus grand modèle d'intelligence artificielle lancé par OpenAI, et sera progressivement mis à la disposition des utilisateurs de ChatGPT Plus.

⚖️ Bien que GPT-4.5 présente une amélioration significative des capacités de conversation, il présente encore des lacunes en matière de raisonnement complexe.

💰 Le coût d'utilisation de GPT-4.5 est élevé, à 150 dollars par million de jetons, ce qui suscite des inquiétudes quant à son adoption généralisée.

4. Doubao lance le mode de raisonnement approfondi : la chaîne logique de l'IA est visualisée, une nouvelle percée dans la recherche et la réponse aux questions

ByteDance a lancé le mode de raisonnement « réflexion approfondie » pour son assistant IA Doubao, qui, grâce à une chaîne logique visualisée, améliore la confiance et la transparence des utilisateurs envers l'IA. Cette technologie, basée sur le modèle Doubao 1.5, combinée à une percée technologique en matière de modèles de raisonnement approfondi, améliore l'intelligence et l'aspect humain de l'IA, annonçant de vastes perspectives dans les domaines de la réponse aux questions, de la recherche, de la rédaction et de la lecture.

image.png

【Résumé AiBase :】

🔍 Le mode de réflexion approfondie, en affichant la chaîne logique complète de l'IA, améliore l'expérience utilisateur.

🤖 Ce mode est basé sur le modèle Doubao 1.5, utilisant l'algorithme RL et l'optimisation de l'ingénierie pour améliorer l'intelligence de l'IA.

📈 Cette nouvelle fonctionnalité préfigure de vastes perspectives de développement de l'IA dans divers domaines, et l'expérience utilisateur s'est considérablement améliorée.

5. Lancement de LTX-Video 0.9.5 : licence commerciale prise en charge, la génération de vidéos IA open source atteint de nouveaux sommets

La sortie de la version 0.9.5 de LTX-Video marque une avancée majeure dans la technologie de génération de vidéos IA open source. Elle prend non seulement en charge les licences commerciales, permettant aux entreprises et aux développeurs individuels d'utiliser ce modèle dans des projets commerciaux, mais elle introduit également la prise en charge des conditions d'images clés, améliorant ainsi la flexibilité et la qualité de la génération de vidéos. De plus, le modèle a également connu une amélioration significative de la résolution et de la vitesse de génération, répondant ainsi aux besoins des récits complexes.

image.png

【Résumé AiBase :】

🌟 Le point culminant est la prise en charge des licences commerciales, ce qui élargit les perspectives d'application.

🎥 L'introduction de la prise en charge des conditions d'images clés améliore la flexibilité de la génération de vidéos.

📈 Amélioration significative de la résolution et de la vitesse de génération, répondant aux besoins des récits complexes.

6. Système de synthèse vocale Spark-TTS : prise en charge du clonage vocal sans échantillon et du contrôle granulaire

Spark-TTS est un système de synthèse vocale avancé qui a suscité un vif intérêt au sein de la communauté de l'IA grâce à ses capacités de clonage vocal sans échantillon et de contrôle granulaire de la voix. Ce système, basé sur Qwen 2.5, simplifie le processus de génération audio, améliore l'efficacité et prend en charge la génération multilingue, ce qui le rend particulièrement adapté à la création de livres audio. Son architecture technique utilise un codec unique BiCodec pour garantir une qualité vocale naturelle et contrôlable, les utilisateurs pouvant ajuster les caractéristiques vocales en fonction de leurs besoins.

image.png

【Résumé AiBase :】

🎤 Clonage vocal sans échantillon : génération de voix de locuteur sans données d'entraînement spécifiques, adapté aux applications personnalisées.

⚙️ Contrôle granulaire de la voix : les utilisateurs peuvent ajuster précisément la vitesse et le ton de la voix pour répondre à différents besoins.

🌍 Génération multilingue : prise en charge de plusieurs langues, maintien d'un haut degré de naturel et de précision, expansion de l'applicabilité mondiale.

Lien détaillé : https://github.com/SparkAudio/Spark-TTS

7. Google publie la version préliminaire de Whisk Animate : transformation d'images en courts métrages animés de 8 secondes

Google a publié la version préliminaire de Whisk Animate sur sa plateforme IA expérimentale Google Labs, permettant aux utilisateurs de transformer des images statiques Whisk en clips vidéo dynamiques de 8 secondes à l'aide du modèle Veo2 avancé. Cette nouvelle fonctionnalité a rapidement suscité des discussions sur les médias sociaux, les utilisateurs ayant donné des retours positifs, démontrant son potentiel dans l'industrie créative. Le lancement de Whisk Animate marque une simplification et une amélioration de l'efficacité de la transformation du design statique en contenu dynamique, renforçant ainsi l'avantage concurrentiel de Google dans le domaine de l'IA générative.

image.png

【Résumé AiBase :】

🎥 Whisk Animate utilise le modèle Veo2 pour transformer des images statiques en vidéos dynamiques de 8 secondes, démontrant la flexibilité de la génération d'animations.

🌟 Les utilisateurs ont donné des retours positifs, certains testeurs précoces le qualifiant de « très impressionnant », ce qui montre son potentiel créatif.

🖼️ Le lancement de Whisk Animate offre de nouveaux outils à l'industrie créative, simplifiant le processus de création de courtes vidéos et de conception publicitaire.

8. Cohere publie le nouveau modèle d'IA multimodale Aya Vision, disponible en deux versions : 32B et 8B

Le laboratoire de recherche à but non lucratif de Cohere a publié Aya Vision, un modèle d'IA multimodale de pointe capable d'exécuter de multiples tâches linguistiques et visuelles. Ce modèle est disponible gratuitement via WhatsApp, visant à faciliter l'accès des chercheurs du monde entier à la technologie. Aya Vision est disponible en deux versions, 32B et 8B, surpassant les modèles concurrents de plus grande taille. De plus, Cohere a publié un nouvel outil d'évaluation de référence, AyaVisionBench, pour faire face à la crise actuelle de l'évaluation dans l'industrie de l'IA.

image.png

【Résumé AiBase :】

🌟 Cohere qualifie le modèle Aya Vision de meilleur du secteur, capable d'exécuter de multiples tâches linguistiques et visuelles.

💡 Aya Vision est disponible en deux versions, 32B et 8B, surpassant les modèles concurrents de plus grande taille.

🔍 Cohere a également publié un nouvel outil d'évaluation de référence, AyaVisionBench, visant à améliorer les problèmes d'évaluation des modèles d'IA.

Lien détaillé : https://cohere.com/blog/aya-vision

9. ByteDance envisage de rechercher des fournisseurs d'étiquetage de données IA

ByteDance a publié un avis le 6 mars, recrutant des fournisseurs d'étiquetage de données IA de qualité pour répondre aux besoins de sa croissance rapide. Ce recrutement s'adresse principalement aux entreprises disposant de ressources verticales abondantes, notamment dans les domaines médical, juridique et éducatif. Les entreprises participantes doivent être des personnes morales indépendantes, avec un capital social d'au moins 1 million de yuans, une bonne réputation sociale et ne peuvent pas être des groupements.

image.png

【Résumé AiBase :】

🌟 ByteDance recrute des fournisseurs d'étiquetage de données IA, le capital social requis étant d'au moins 1 million de yuans.

📄 Les entreprises candidates doivent être des personnes morales indépendantes, jouir d'une bonne réputation sociale et les candidatures conjointes ne sont pas acceptées.

🚀 Ce recrutement vise à répondre aux besoins de croissance rapide de ByteDance dans le domaine de l'étiquetage de données IA et à stimuler le développement du secteur.

10. OpenAI lance un agent IA « niveau doctorat », avec un abonnement mensuel pouvant atteindre 20 000 dollars

OpenAI a récemment annoncé le lancement d'un agent IA appelé « niveau doctorat », visant à répondre aux besoins haut de gamme des secteurs de la finance, de la santé et de la fabrication. L'abonnement mensuel de cet agent IA peut atteindre 20 000 dollars, offrant divers types de services, le prix étant basé sur la valeur économique créée pour les clients. Bien que le prix élevé ait suscité certaines moqueries, OpenAI cible clairement les grandes entreprises plutôt que les utilisateurs individuels.

image.png

【Résumé AiBase :】

💰 L'abonnement mensuel de cet agent IA est compris entre 2 000 et 20 000 dollars, le prix étant basé sur la valeur économique créée pour les clients.

🏢 OpenAI cible les grandes entreprises, permettant aux entreprises de payer par poste de travail, réduisant ainsi le seuil d'utilisation.

✈️ L'agent IA vise à effectuer des tâches automatiquement avec une intervention humaine minimale, par exemple, rechercher automatiquement des informations sur les vols et effectuer les paiements.

11. L'App Store d'Apple s'apprête à lancer des résumés de critiques d'applications générés par l'IA, pour obtenir facilement les commentaires des utilisateurs