Bienvenue sur la rubrique 【AI日报】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en nous concentrant sur les développeurs et en vous aidant à comprendre les tendances technologiques et les applications innovantes des produits IA.
Nouveaux produits IA Cliquez ici pour en savoir plus :https://top.aibase.com/
1、Kimi lance un mode d'appel vocal multifonctionnel avec changement de voix et réglage de la vitesse
L'assistant IA Kimi a récemment lancé sa fonction d'appel vocal très attendue, offrant aux utilisateurs une expérience interactive riche. Cette nouvelle fonctionnalité combine des applications diversifiées et une expérience personnalisée pour améliorer l'efficacité de la communication et répondre aux besoins individuels. Des applications spécifiques ont été développées pour des scénarios particuliers, tels que l'entraînement à l'anglais et les simulations d'entretiens, offrant des solutions innovantes pour l'apprentissage et le monde professionnel. L'intégration de la technologie de clonage vocal ajoute une touche ludique, et l'équipe suit attentivement les retours des utilisateurs pour optimiser et étendre l'éventail des applications de services vocaux.
【Résumé AiBase :】
🌟 L'assistant Kimi met à jour sa fonction d'appel vocal pour améliorer l'expérience interactive des utilisateurs.
🎤 Prise en charge des sous-titres en temps réel et d'une voix réglable pour une interaction plus naturelle.
🤖 Intégration de la technologie de clonage vocal pour plus de fun et de scénarios d'application.
2、Le modèle CogView3-Plus de Zhipu est open source : une nouvelle ère pour la technologie de génération d'images à partir de texte
L'équipe technique de Zhipu a publié CogView3 et sa version améliorée CogView3-Plus-3B, marquant une nouvelle étape dans la création artistique assistée par l'IA. CogView3 offre des performances exceptionnelles, surpassant SDXL de 77 % avec une vitesse d'inférence dix fois plus rapide. CogView3-Plus intègre le framework DiT et un mécanisme d'attention conjoint texte-image pour améliorer les performances et réduire les coûts. Le référentiel open source est désormais disponible, stimulant le développement rapide du domaine de la génération d'images par IA, et ouvrant de vastes perspectives d'application pour la technologie de génération d'images à partir de texte.
【Résumé AiBase :】
🚀 CogView3 et CogView3-Plus-3B sont open source, marquant une nouvelle étape dans la création artistique assistée par l'IA.
💡 CogView3 offre des performances exceptionnelles, surpassant SDXL de 77 %, avec une vitesse d'inférence dix fois plus rapide.
💻 CogView3-Plus intègre le framework DiT et un mécanisme d'attention conjoint texte-image pour améliorer les performances et réduire les coûts.
Lien détaillé : https://top.aibase.com/tool/cogview3Plus
3、Adobe lance le modèle vidéo Firefly IA, Photoshop enrichi de plusieurs fonctions IA
Lors de sa dernière conférence MAX, Adobe a lancé le modèle vidéo Firefly IA et plusieurs outils Photoshop améliorés, offrant aux utilisateurs de nouvelles fonctionnalités IA impressionnantes. Le modèle vidéo Firefly permet aux utilisateurs de créer ou de modifier du contenu vidéo à partir d'invites textuelles, offrant aux créateurs un nouvel espace de création. Parallèlement, les nouveaux outils IA de Photoshop, tels que l'outil de suppression et la fonction de remplissage génératif, permettent aux utilisateurs d'éditer des images plus facilement. Adobe s'engage à n'utiliser que du contenu sous licence pour entraîner ses modèles et lance des certificats de contenu pour plus de transparence.
【Résumé AiBase :】
📹 Le modèle vidéo Firefly IA permet aux utilisateurs de créer et de modifier du contenu vidéo à partir de texte, offrant aux créateurs un nouvel espace de création.
🖼️ Photoshop est enrichi de plusieurs outils IA, tels que l'outil de suppression et le remplissage génératif, facilitant l'édition d'images.
🔍 Adobe s'engage à n'utiliser que du contenu sous licence pour entraîner ses modèles et lance des certificats de contenu pour plus de transparence.
Lien détaillé : https://blog.adobe.com/en/publish/2024/09/11/bringing-gen-ai-to-video-adobe-firefly-video-model-coming-soon
4、ChatGPT métamorphosé : une nouvelle interface intégrant une fonction de recherche
OpenAI a récemment apporté d'importantes mises à jour à ChatGPT, le transformant d'un simple assistant de conversation en une plateforme d'information complète. La mise à jour de l'interface inclut la nouvelle fonction Canvas et le déplacement de la zone de saisie des invites, pour une expérience utilisateur plus conviviale. La fonction SearchGPT intégrée permet aux utilisateurs d'accéder à des données en temps réel sur le Web, et des partenariats avec des éditeurs réputés garantissent la fiabilité des informations.
【Résumé AiBase :】
🔍 Nouvelle conception de l'interface : nouvelle fonction Canvas et déplacement de la zone de saisie des invites pour une meilleure expérience utilisateur.
🌐 Intégration de la fonction SearchGPT : activation par la touche /, accès aux données Web en temps réel, avec références et liens intégrés.
💡 Utilisation facile : fonctionnement intuitif, réponses fournies en quelques secondes avec sources, possibilité de questions complémentaires pour approfondir le sujet.
5、Volcano Engine publie une solution de prétraitement vidéo pour l'entraînement des grands modèles
Lors de sa récente conférence sur la technologie du cloud vidéo, Volcano Engine a publié une solution de prétraitement vidéo pour l'entraînement des grands modèles. Cette technologie a déjà été appliquée avec succès au modèle de génération vidéo Doubao, marquant une avancée majeure dans la technologie de génération vidéo par IA.
【Résumé AiBase :】
🔑 L'AIGC et les technologies multimodales transforment profondément l'expérience utilisateur.
🔑 Volcano Engine explore l'intégration des grands modèles IA et des technologies vidéo, offrant des solutions complètes.
🔑 La solution de prétraitement développée par Volcano Engine optimise les algorithmes et les aspects techniques, améliorant l'efficacité de l'entraînement des modèles.
6、Midjourney s'apprête à lancer un éditeur en ligne, la version V7 et des fonctionnalités personnalisées sont en préparation
Midjourney a récemment annoncé une série de mises à jour passionnantes et de nouvelles fonctionnalités à venir, démontrant le développement rapide et l'innovation de l'entreprise dans le domaine de la génération d'images par IA. L'équipe travaille activement sur plusieurs projets, en privilégiant l'amélioration de la qualité et le développement des fonctionnalités essentielles plutôt que la précipitation dans la sortie de nouveaux produits.
【Résumé AiBase :】
🚀 Midjourney s'apprête à lancer un nouvel éditeur en ligne permettant aux utilisateurs d'importer des images et de les éditer à l'aide de cartes de profondeur et de fonctions de restauration d'images.
💡 L'équipe optimise l'interface utilisateur pour distinguer les nouvelles fonctionnalités des fonctionnalités d'image existantes, et discute des fonctionnalités à inclure lors du premier lancement.
🔧 Midjourney développe de nouveaux outils pour faciliter la gestion et le basculement entre plusieurs configurations personnalisées, et introduit un système de personnalisation de style plus précis.
7、Microsoft crée un compagnon IA capable de « voir » et de « se souvenir » de tous les comportements de l'utilisateur
Microsoft travaille actuellement sur un compagnon IA capable d'observer en temps réel les comportements de l'utilisateur, dans le but d'établir une relation interactive profonde. Cela reflète le besoin fondamental humain de confidence, de compréhension et de compagnie. Parallèlement, la nouvelle fonction Recall de Windows permet d'explorer en profondeur l'historique numérique de l'utilisateur, reconstituant des expériences passées. Zoom lance une fonction de clonage IA permettant aux utilisateurs d'envoyer une version numérique d'eux-mêmes à des réunions, améliorant ainsi l'efficacité du travail.
【Résumé AiBase :】
🌟 Microsoft développe un compagnon IA capable d'observer en temps réel les comportements de l'utilisateur, dans le but d'établir une relation interactive profonde.
📂 La nouvelle fonction Recall de Windows permet d'explorer en profondeur l'historique numérique de l'utilisateur, reconstituant des expériences passées.
💬 Zoom lance une fonction de clonage IA permettant aux utilisateurs d'envoyer une version numérique d'eux-mêmes à des réunions, améliorant ainsi l'efficacité du travail.
8、Le vice-président de l'IA de Microsoft rejoint OpenAI pour se consacrer à la recherche sur l'AGI
Sébastien Bubeck, vice-président de l'IA chez Microsoft, a rejoint OpenAI pour se consacrer à la recherche sur l'intelligence artificielle générale (AGI). Ce changement marque un tournant dans la carrière de Bubeck et apporte un soutien considérable au développement d'OpenAI.
【Résumé AiBase :】
🧠 Bubeck quitte Microsoft pour rejoindre OpenAI et se concentrer sur la recherche en AGI.
🤝 La relation entre Microsoft et OpenAI est complexe, étant à la fois investisseur et concurrent, les deux parties souhaitant poursuivre leur collaboration.
🚀 L'arrivée de Bubeck devrait permettre à OpenAI de faire des percées dans les petits modèles linguistiques et la recherche en AGI.
9、Étonnant ! Le modèle IA DIAMOND peut simuler Counter-Strike, fonctionnant sur une seule RTX 3090
Les chercheurs ont développé le modèle IA DIAMOND capable de simuler le jeu Counter-Strike : Global Offensive, fonctionnant sur une carte graphique Nvidia RTX 3090 à une vitesse de 10 images par seconde. Bien que présentant quelques défauts, il est envisageable d'améliorer les performances du modèle en augmentant les données et la capacité de calcul.
【Résumé AiBase :】
🎮 Le modèle DIAMOND peut simuler le jeu CS:GO à une vitesse de 10 images par seconde.
📊 Entraîné avec seulement 87 heures de données de jeu, il peut néanmoins simuler des scénarios de jeu complexes.
🐛 Présente des défauts, tels que des sauts infinis et des écarts de trajectoire entraînant des plantages de la simulation, mais possède un potentiel d'amélioration.
Lien détaillé : https://diamond-wm.github.io/
10、La demande pour les GPU Blackwell de Nvidia explose, les stocks des 12 prochains mois sont épuisés
La dernière génération de GPU Blackwell de Nvidia a suscité une demande sans précédent. Le PDG Jensen Huang a révélé que les stocks des 12 prochains mois étaient épuisés, confirmant une fois de plus l'appétit du marché pour le calcul haute performance.
【Résumé AiBase :】
💡 La demande pour les GPU Blackwell explose, les stocks des 12 prochains mois sont épuisés.
🔍 Les principaux clients incluent AWS, Google et d'autres grandes entreprises technologiques, stimulant la croissance du marché.
📈 NVIDIA prévoit d'expédier pour des milliards de dollars de GPU Blackwell en 2024, avec une croissance significative des revenus des centres de données.
11、Le cours de l'action Nvidia atteint un nouveau sommet historique, la capitalisation boursière frôle les 3 400 milliards de dollars
Le cours de l'action Nvidia a atteint un nouveau sommet historique cette semaine, sa capitalisation boursière frôlant les 3 400 milliards de dollars, au grand enthousiasme des investisseurs. La fortune personnelle du PDG Jensen Huang dépasse désormais les 1215 milliards de dollars, grâce à la forte demande pour les puces Blackwell de nouvelle génération. Nvidia consolide sa position dominante sur le marché des puces IA, sa capitalisation boursière étant seulement dépassée par celle d'Apple, démontrant sa puissance.
【Résumé AiBase :】
🚀 Le cours de l'action Nvidia a atteint un nouveau sommet à 138,07 $, soit une hausse de près de 180 % depuis le début de l'année.
📊 La société détient une part de marché de 70 % à 95 % sur le marché des puces IA, avec une capitalisation boursière de 3 400 milliards de dollars.
💡 Le PDG Jensen Huang a déclaré que la demande pour les puces Blackwell de nouvelle génération était « folle » et que les stocks étaient épuisés jusqu'à l'année prochaine.