Journal de l'IA : ByteDance lance Seed LiveInterpret 2.0 avec des services de traduction simultanée ; l'API de Mita Search est lancée ; la version finale de Lovart AI est officiellement lancée à l'échelle mondiale

Bienvenue dans le programme « Journal de l'IA » ! C'est votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les sujets d'actualité dans le domaine de l'IA, en mettant l'accent sur les développeurs, pour vous aider à comprendre les tendances technologiques et découvrir les applications innovantes des produits d'IA.

Produits d'IA nouveaux cliquez pour en savoir plus :https://top.aibase.com/

1. ByteDance lance le modèle de traduction simultanée bout à bout Seed LiveInterpret 2.0

La équipe Seed de ByteDance a lancé son dernier résultat de recherche - Seed LiveInterpret 2.0, qui atteint un niveau exceptionnel dans la qualité de la traduction simultanée chinois-anglais, avec une faible latence et une fonction de réplique vocale en temps réel, améliorant significativement la nature et la fluidité de la communication interlingue.

【Résumé par AiBase :】
🚀 Seed LiveInterpret 2.0 réalise une précision de traduction proche de celle d'un interprète humain, avec une latence extrêmement faible, seulement 3 secondes.
🎙️ Il prend en charge la fonction de réplique vocale en temps réel, permettant de synthétiser un « son original » sans avoir besoin d'échantillons vocaux préalables.
📊 Dans les évaluations professionnelles, Seed LiveInterpret 2.0 s'est montré excellent dans les tâches de traduction chinois-anglais, avec des scores bien supérieurs aux autres systèmes.
Lien vers les détails : https://arxiv.org/pdf/2507.17527

2. API de recherche Mita lancée : prix de 3 centimes, capacité de recherche multimodale

La recherche Mita AI a officiellement lancé son API de recherche, offrant aux développeurs une nouvelle option de remplacement du Bing Search API. Cette API est facturée à 0,03 yuans par requête, prend en charge la recherche multimodale et n'a pas de seuil d'utilisation, ce qui facilite une intégration rapide.

【Résumé par AiBase :】
✅ L'API de recherche Mita AI a été lancée, offrant aux développeurs une nouvelle solution de recherche.
💡 Le prix est de 0,03 yuan par requête, compétitif sur le marché, et prend en charge la recherche multimodale.
🚀 Les développeurs peuvent tester et utiliser directement, sans processus complexe d'approbation, augmentant ainsi l'efficacité d'intégration.

3. Lovart AI version finale lancée à l'échelle mondiale : une conception intelligente complète révolutionne l'expérience de création

L'article présente le lancement mondial de la version finale de Lovart AI, soulignant son innovation en tant que premier agent de conception d'intelligence artificielle, et comment il redéfinit les normes de l'industrie de la conception grâce à l'interaction par langage naturel et à ses capacités de conception complète. L'article mentionne également ses nouvelles fonctions ChatCanvas et le « Agent Xingliu » pour le marché chinois, et souligne son impact profond sur l'industrie de la conception.

【Résumé par AiBase :】
🎨 Lovart AI fournit des services de génération d'actifs visuels de haute qualité grâce à l'interaction par langage naturel et à ses capacités de conception complète.
🧠 La nouvelle fonction ChatCanvas prend en charge les dialogues multiples et l'ajustement en temps réel des dispositions, des couleurs, etc., améliorant ainsi l'efficacité de la création.
🇨🇳 L'« Agent Xingliu » optimisé pour le marché chinois prend en charge le sens du chinois et l'esthétique nationale, aidant les créateurs locaux à créer efficacement.

4. Le Higgs Audio v2 du groupe Li Mu est lancé : une nouvelle ère de synthèse vocale

Le Higgs Audio v2 lancé par l'équipe de Li Mu est une avancée majeure dans le domaine de la synthèse vocale, prenant en charge la génération de dialogues multilingues, l'ajustement automatique de la prosodie et la copie vocale. Ce modèle a été entraîné sur 10 millions d'heures de données vocales et a montré d'excellents résultats dans plusieurs tests, devenant un standard de l'industrie.

【Résumé par AiBase :】
🔥 Le Higgs Audio v2 prend en charge la génération de dialogues multilingues et la copie vocale, réalisant des tâches complexes.
📊 Dans le test EmergentTTS-Eval, le Higgs Audio v2 s'est montré excellent en termes d'émotion et de catégories de questions.
🚀 Il prend en charge les conversations vocales en temps réel et la création de contenus audio, adapté aux scénarios tels que les animateurs virtuels et les assistants vocaux.

5. Sora2 apparaît : OpenAI veut reprendre la position dominante dans le domaine des vidéos générées par l'IA

L'article présente le développement en cours par OpenAI de son successeur Sora2 au modèle Sora, tout en mentionnant la popularité de Google Veo3. Cela indique que la concurrence dans le domaine des vidéos générées par l'IA deviendra encore plus intense.

【Résumé par AiBase :】
🚀 OpenAI travaille activement sur Sora2 pour répondre à la concurrence de Google Veo3.
💡 Sora2 n'est pas encore publié publiquement, mais des informations supplémentaires seront disponibles dans les prochaines semaines.
🌐 Google Veo3 est gratuit pour les étudiants universitaires et peut être expérimenté via Google Cloud.

6. OpenAI et Oracle collaborent pour élargir le projet Stargate, ayant créé des milliers d'emplois

OpenAI a signé un nouveau contrat avec Oracle, augmentant la capacité des centres de données américains du projet Stargate à 4,5 gigawatts, portant la capacité totale à plus de 5 gigawatts. Cela marque une étape importante vers l'objectif d'OpenAI d'atteindre 10 gigawatts d'ici 2029. Ce projet vise à faire du États-Unis un leader mondial dans le développement de l'intelligence artificielle et a attiré de nombreuses entreprises technologiques et investisseurs internationaux.

【Résumé par AiBase :】
🔥 La capacité du projet Stargate a été augmentée à plus de 5 gigawatts, l'objectif étant d'atteindre 10 gigawatts d'ici 2029.
🤝 OpenAI collabore avec Oracle et d'autres entreprises technologiques pour promouvoir le projet, qui devrait créer plus de 100 000 emplois.
💰 Le projet a reçu plus de 1,9 milliard de dollars de financement, attirant des investisseurs de plusieurs pays.

7. Google Photos ajoute de nouvelles fonctionnalités basées sur l'IA : photos en animation en quelques secondes, génération d'une vidéo en un clic

Google Photos a lancé plusieurs nouvelles fonctionnalités basées sur l'IA, notamment la transformation de photos statiques en vidéos dynamiques et des outils créatifs pour transformer les photos en différents styles artistiques. Ces fonctionnalités visent à améliorer l'expérience de création des utilisateurs et à continuer à optimiser les produits de manière expérimentale.

【Résumé par AiBase :】
📷 La fonction de conversion photo en vidéo utilise le modèle Veo2, permettant aux utilisateurs de transformer facilement des photos statiques en vidéos dynamiques de 6 secondes.
🎨 La fonction Remix est alimentée par Imagen AI, transformant des photos ordinaires en styles artistiques comme les mangas et les dessins animés.
📌 Google a ajouté une page « Créer » dans l'application Photos, intégrant divers outils créatifs pour offrir une expérience de création complète.

8. YouTube Shorts va proposer de nouveaux effets IA : les photos deviennent des vidéos en un clin d'œil !

YouTube a annoncé qu'il ouvrira aux créateurs de Shorts une série de fonctionnalités révolutionnaires basées sur l'IA, notamment la conversion d'images en vidéos et des effets IA. Ces outils transforment les photos statiques en vidéos dynamiques et proposent plusieurs options créatives, réduisant considérablement le seuil de création tout en augmentant l'attractivité du contenu.

【Résumé par AiBase :】
📷 La fonction de conversion image en vidéo donne vie à des photos statiques en 6 secondes, améliorant ainsi l'efficacité de la création de vidéos courtes.
🎨 Les effets IA transforment des éléments simples comme des dessins ou des selfies en œuvres artistiques élaborées, stimulant la créativité des créateurs.
🎥 Le nouveau générateur de vidéos Veo3 produira simultanément de l'audio, offrant une solution de création complète.

9. Google lance le modèle Aeneas : ouverture d'une nouvelle voie pour l'interprétation des textes anciens

Le modèle Aeneas lancé par Google offre une nouvelle méthode pour l'interprétation des inscriptions anciennes, accélérant le travail des historiens dans la restauration, l'identification et la datation des inscriptions, tout en s'étendant à d'autres langues anciennes et matériaux, augmentant ainsi significativement l'efficacité et la profondeur de la recherche historique.

【Résumé par AiBase :】
🧠 Le modèle Aeneas développé par DeepMind de Google vise à aider les historiens à comprendre les textes anciens.
🗣️ Ce modèle peut analyser la similarité des textes anciens, combler les lacunes des textes et alléger la charge des chercheurs historiques.
📜 Le modèle Aeneas convertit les textes en « empreintes historiques », aidant les historiens à interpréter les inscriptions dans un contexte plus large.
Lien vers les détails : https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/

10. GitHub Spark sort : une phrase pour créer une application Web, l'ère du développement d'IA commence !

GitHub Spark permet aux développeurs et non-développeurs de construire rapidement des applications Web personnalisées grâce à la technologie de traitement du langage naturel, réduisant significativement le seuil de programmation et offrant de nouvelles possibilités pour le développement d'applications micro.

【Résumé par AiBase :】
🌟 GitHub Spark permet aux utilisateurs de décrire leurs besoins en langage naturel pour générer rapidement des applications Web complètes.
🚀 Il fournit un environnement d'exécution entièrement géré, supporte le déploiement instantané et l'adaptation PWA, simplifiant ainsi le processus de développement.
🔧 Il prend en charge le choix de plusieurs modèles et s'intègre profondément à l'écosystème GitHub, améliorant ainsi l'efficacité du développement.
Lien vers les détails : https://github.blog/changelog/2025-07-23-github-spark-in-public-preview-for-cop ilot-pro-subscribers/

11. HUAWEI M-Pencil Pro lancé : 699 yuans, prise en charge d'un accès direct à l'assistant intelligent Xiaoyi

HUAWEI a lancé une nouvelle génération de stylo numérique HUAWEI M-Pencil Pro, au prix de 699 yuans, disposant de 16 384 niveaux de pression, d'une fonction de rotation latérale et de diverses pointes de stylo, tout en prenant en charge des raccourcis d'IA et une fonction de localisation précise par Starlight, offrant aux créateurs une expérience de création plus pratique et réaliste.

【Résumé par AiBase :】

Product Finder

Product Submit

AI Models Finder

MCP Servers

MCP Client

MCP Inspector

Case Tutorials

Latest AI News

AI Daily Brief

Journal de l'IA : ByteDance lance Seed LiveInterpret 2.0 avec des services de traduction simultanée ; l'API de Mita Search est lancée ; la version finale de Lovart AI est officiellement lancée à l'échelle mondiale

站长之家

Cet article provient d'AIbase Daily