Bienvenue dans le segment « Journal de l'IA » ! C'est votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les sujets d'actualité dans le domaine de l'IA, en mettant l'accent sur les développeurs, pour vous aider à comprendre les tendances technologiques et à découvrir les applications innovantes des produits d'IA.

Produits d'IA fraîchement lancés cliquez ici pour en savoir plus : https://app.aibase.com/zh

1. Google lance le modèle de génération vidéo Veo 3.1 : fonctionnalités audio ajoutées et capacité d'édition précise

Le modèle de génération vidéo Veo 3.1 lancé par Google a été amélioré en termes de sortie audio, de granularité du contrôle d'édition et de qualité de conversion d'image en vidéo, ce qui améliore la réalisme des vidéos et la capacité à suivre les instructions des utilisateurs. En outre, les nouvelles fonctions d'ajout et de suppression d'objets ainsi que la capacité à générer de l'audio renforcent davantage la flexibilité et l'immersion dans l'édition vidéo.

image.png

【Bilan AiBase :】

🎥 Veo 3.1 dispose désormais d'une fonctionnalité de génération audio, améliorant ainsi l'immersion et l'intégrité du contenu vidéo.

🖌️ Il supporte les fonctions d'ajout et de suppression d'objets, augmentant ainsi la flexibilité et la précision de l'édition vidéo.

🌐 Intégré à plusieurs plateformes comme Flow, Gemini et Vertex AI, élargissant ainsi la portée d'utilisation des utilisateurs.

2. Qwen annonce officiellement la mise en place de la fonction Qwen Chat Memory

Qwen a lancé la fonction Qwen Chat Memory, permettant aux utilisateurs d'avoir une expérience plus naturelle et personnalisée lors de dialogues multi-étapes. Cette fonction peut se souvenir des préférences et habitudes des utilisateurs, améliorant ainsi la continuité et l'efficacité des échanges.

image.png

【Bilan AiBase :】

🌟 La fonction Qwen Chat Memory permet à Qwen d’avoir une « mémoire longue », capable de retenir activement des informations importantes.

💡 Cette fonction peut se souvenir des préférences, habitudes et contenus passés des utilisateurs, offrant ainsi des réponses plus continues.

🚀 Cela marque un pas important dans la direction de l'intelligence artificielle multistep de Qwen, en devenant un assistant intelligent plus proche des besoins des utilisateurs.

3. Mise à jour épique de Sora2 ! Les utilisateurs gratuits peuvent créer des vidéos de 15 secondes, les utilisateurs Pro peuvent aller jusqu'à 25 secondes

Sora2 a publié une mise à jour majeure de ses fonctionnalités, offrant aux créateurs une liberté de création et un contrôle encore plus importants. Les utilisateurs gratuits peuvent maintenant créer des vidéos de durée maximale de 15 secondes, tandis que les utilisateurs Pro peuvent créer des vidéos de 25 secondes via le site web et bénéficier de la fonction « storyboard » pour contrôler précisément chaque plan et chaque effet visuel.

image.png

【Bilan AiBase :】

🎥 Les utilisateurs gratuits peuvent créer des vidéos de 15 secondes au maximum, augmentant ainsi la flexibilité de création.

🎬 Les utilisateurs Pro disposent désormais de la fonction « storyboard », permettant un contrôle précis des plans et du rythme narratif.

💡 Cette mise à jour marque l'évolution de Sora vers une création contrôlée, en devenant un outil professionnel de création.

4. Wenyi Assistant de Baidu s’affine, les capacités d’IA créative explosent, huit nouveaux modes d’interaction arrivent !

L'amélioration globale du Wenyi Assistant de Baidu a significativement renforcé ses capacités de création multimodale AIGC et de résolution de tâches intelligentes, offrant aux utilisateurs des outils de création et des expériences plus riches.

image.png

【Bilan AiBase :】

🧠 Après la mise à jour, le Wenyi Assistant prend en charge la génération de huit types de contenus, y compris des images, vidéos, musique et podcasts d'IA.

🎥 Le nouvel agent intelligent numérique interactif en temps réel ouvert offre une haute fidélité et une faible latence pour les interactions émotionnelles.

🔄 Le modèle « Steam Engine » a franchi la limite traditionnelle de 10 secondes des vidéos d'IA, réalisant ainsi une génération de « durée illimitée ».

5. Mise à niveau de l'outil de génération vidéo AI de Google Flow : édition plus flexible, fonctions audio puissantes

Google a récemment apporté une importante mise à niveau à son outil de génération vidéo AI Flow, permettant aux utilisateurs de créer des vidéos générées par IA plus réalistes et indiscernables. Cette mise à niveau a ajouté la fonctionnalité de modification des ombres et de la lumière des vidéos, améliorant ainsi la flexibilité et le réalisme de la production vidéo. En outre, les fonctions audio ont également été renforcées, permettant aux utilisateurs de générer des vidéos avec de l'audio à partir de trois images de référence et de supprimer n'importe quel objet d'une vidéo.

image.png

【Bilan AiBase :】

🌟 L'outil Flow ajoute la fonctionnalité de modification des ombres et de la lumière, améliorant ainsi le réalisme des vidéos.

🎵 Les utilisateurs peuvent générer des vidéos avec de l'audio à partir de trois images de référence, offrant des fonctions audio plus puissantes.

🛠️ La fonction de suppression d'objets qui arrive bientôt rendra les vidéos sans ces objets.

6. Le roi de la performance ! Anthropic lance Claude Haiku 4.5, sa capacité de programmation rivalise avec Sonnet 4 mais à un tiers du prix !

Le Claude Haiku 4.5 lancé par Anthropic a trouvé un équilibre entre performance et coût, convient aux applications en temps réel et aux tâches de programmation, montrant une forte compétitivité sur le marché.

image.png

【Bilan AiBase :】

🧠 Claude Haiku 4.5 est miniaturisé grâce à la technique de distillation tout en maintenant des performances proches de celles des modèles volumineux.

💡 Dans les tâches de codage, Haiku 4.5 se distingue, son coût représente seulement un tiers de celui de Sonnet 4.

🚀 Le workflow de travail collaboratif entre plusieurs modèles améliore l'efficacité et le rapport qualité-prix du traitement des tâches complexes.

7. Première affaire de publicité mensongère utilisant l'IA dévoilée à Pékin : l'IA imite un présentateur célèbre pour vendre des huiles de poisson

La Direction de la supervision du marché de Pékin a annoncé une affaire impliquant l'utilisation de la technologie de l'IA pour publier une publicité mensongère, c'est la première fois qu'un tel comportement est sanctionné à Pékin. L'entreprise a utilisé l'IA pour couper les vidéos d'un présentateur de CCTV et y ajouter du contenu original, promouvant un aliment ordinaire nommé « Huile de poisson polyénique des profondeurs », affirmant qu'elle pouvait résoudre divers problèmes de santé, violant ainsi les dispositions de la loi sur la publicité. Les autorités de régulation rappellent aux consommateurs de prêter attention à ces comportements illégaux et encouragent les signalements pour préserver l'ordre du marché.

image.png

【Bilan AiBase :】

🤖 Pékin a procédé à la première enquête sur une affaire utilisant la technologie de l'IA pour faire de la publicité mensongère en imitant un présentateur.

💊 L'annonce affirme que l'aliment ordinaire a des effets médicaux, violant ainsi les dispositions de la loi sur la publicité.

📞 Les consommateurs peuvent appeler le 12315 ou le 12345 pour signaler les comportements de publicité mensongère.

8. Qoder CLI arrive ! Alibaba crée le plus rapide assistant de programmation par IA, réponse en seulement 200 millisecondes

Qoder CLI est un outil innovant de programmation par IA développé par Alibaba, conçu spécialement pour l'environnement de ligne de commande, afin d'améliorer l'efficacité du développement et l'expérience de programmation. Sa rapidité de réponse est élevée, sa consommation de mémoire est faible, et il prend en charge plusieurs fonctionnalités avancées, comme la programmation autonome et la revue de code, améliorant ainsi significativement la qualité du code et l'efficacité du développement.

image.png

【Bilan AiBase :】

🧠 Qoder CLI est un outil de programmation par IA développé par Alibaba, conçu spécialement pour l'environnement de ligne de commande, améliorant ainsi l'efficacité du développement.

⚡ Le temps de réponse est de seulement 200 millisecondes, la consommation de mémoire est réduite de 70 %, les optimisations de performance sont significatives.

🔄 Supporte le mode Quest et la capacité de CodeReview, réduisant de 50 % le temps de revue de code et améliorant la qualité du code de deux fois.