Bienvenue à la rubrique 【AI日报】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en mettant l'accent sur les développeurs, pour vous aider à comprendre les tendances technologiques et les applications innovantes des produits d'IA.

Nouveaux produits IA Cliquez ici pour en savoir plus : https://top.aibase.com/

1、Lancement de la version Edu de ChatGPT : prise en charge de GPT-4o, GPT personnalisé, analyse de données

La version Edu de ChatGPT est lancée, offrant un ChatGPT multifonctionnel aux universités pour aider les étudiants et les enseignants à améliorer la qualité de l'apprentissage et de l'enseignement. De nombreuses universités de pointe utilisent déjà ChatGPT dans l'éducation, les jeunes de 18 à 24 ans constituant le principal groupe d'utilisateurs. Les fonctionnalités incluent la prise en charge de GPT-4o, l'analyse de données, un GPT personnalisé, etc., offrant des limites de messages plus élevées et une prise en charge vocale. Les mécanismes de sécurité sont robustes et de nombreux exemples d'applications pratiques sont disponibles.

【Résumé AiBase :】

🚀 Lancement de la version Edu de ChatGPT, prenant en charge GPT-4o, GPT personnalisé et l'analyse de données, pour aider les étudiants et les enseignants à améliorer leur efficacité d'apprentissage.

🔍 De nombreuses universités de pointe utilisent déjà ChatGPT dans l'éducation. Les jeunes de 18 à 24 ans constituent le principal groupe d'utilisateurs, ayant de forts besoins et une grande capacité d'apprentissage.

💡 De nombreux exemples d'applications pratiques existent, notamment les travaux de réflexion de fin d'année, les services communautaires et les exercices linguistiques, démontrant une application approfondie de ChatGPT dans le domaine de l'éducation.

2、Kuaishou lance « Ketu », son propre modèle de génération d'images à partir de texte

Kuaishou a officiellement lancé « Ketu », son propre modèle de génération d'images à partir de texte, offrant aux utilisateurs une toute nouvelle expérience de création d'images par IA. Ce grand modèle prend en charge deux types de fonctionnalités : la génération d'images à partir de texte et la génération d'images à partir d'images, pouvant être utilisé pour la création d'images par IA et la personnalisation d'images. Les utilisateurs peuvent facilement accéder à cette technologie de pointe via le mini-programme WeChat ou la version Web de « Ketu ».

image.png

【Résumé AiBase :】

🔍 Le modèle « Ketu » a une taille de paramètres de plusieurs milliards, les données provenant de communautés open source, de la construction interne de Kuaishou et de la fusion de technologies IA auto-développées.

🎨 « Ketu » couvre des millions de concepts d'entités chinois courants, offrant une prise en charge plus large et plus approfondie de la création d'images.

🧠 « Ketu » intègre des techniques d'apprentissage par renforcement et de modèles de récompense pour résoudre le problème de l'inefficacité des grands modèles de génération d'images à partir de texte pour traiter les longs textes et les textes à sémantique complexe.

Accès au produit : https://top.aibase.com/tool/kuaishouketudamoxingkolors

3、Baidu Netdisk lance une fonction de génération d'avatars de bande dessinée par IA

Baidu Netdisk a lancé une nouvelle fonction IA étonnante. À la veille de la fête des enfants, les utilisateurs peuvent se transformer en personnages de dessins animés de leur enfance avec une seule photo. Cette fonction est très personnalisée, permettant aux utilisateurs de se sentir immergés dans un monde d'animation captivant. La vitesse de traitement rapide et efficace rend l'expérience encore plus fluide.

【Résumé AiBase :】

🎨 Conversion personnalisée : les utilisateurs peuvent télécharger une photo pour se transformer en personnage de dessin animé et profiter d'un style unique.

🚀 Traitement rapide : la fonction IA de Baidu Netdisk est extrêmement rapide, générant de superbes photos de dessins animés en quelques secondes.

🌟 Effets diversifiés : il est possible non seulement de se transformer en personnage de dessin animé, mais aussi de simuler des effets d'animation classiques, pour répondre aux besoins de différents utilisateurs.

4、Claude 3 ouvre son API tierce pour automatiser les processus métier

La nouvelle fonctionnalité d'Anthropic permet aux utilisateurs d'interagir plus facilement avec Claude et d'automatiser l'exécution de diverses tâches via des appels d'API structurés. Claude est également capable de traiter des images et de les intégrer à des applications en temps réel, offrant aux entreprises des solutions plus intelligentes et efficaces.

image.png

【Résumé AiBase :】

🔍 Les utilisateurs peuvent demander à Claude d'exécuter automatiquement plusieurs tâches via des questions textuelles.

🔍 Les utilisateurs peuvent utiliser des appels d'API structurés pour effectuer des opérations courantes et obtenir des réponses à des questions.

🔍 La nouvelle fonctionnalité d'Anthropic permet à Claude de traiter des images et des applications en temps réel.

5、Novita AI open-source le projet Animate Anyone : créez une animation à partir d'une seule photo

Novita AI a open-sourcé le projet Animate Anyone, permettant aux utilisateurs de créer une animation à partir d'une seule photo. Cette technologie ouvre de nouvelles possibilités et opportunités pour la création d'animations, permettant aux utilisateurs de créer rapidement des œuvres étonnantes.

image.png

【Résumé AiBase :】

👉 ViViD peut déplacer naturellement les vêtements sur les personnages vidéo.

👉 Que ce soient des robes ou des pantalons, ils peuvent être interchangés à volonté, adaptés à divers besoins d'essayage de vêtements.

👉 Pour le moment, seuls la démonstration et l'article ont été publiés, le code n'étant pas encore disponible.

Page du projet : https://top.aibase.com/tool/vivid

Adresse de l'article : https://arxiv.org/pdf/2405.11794

6、Alibaba et l'USTC lancent la technologie d'essayage virtuel ViViD pour un changement de vêtements vidéo facile

Le framework ViViD, développé conjointement par Alibaba et l'Université des sciences et technologies de Chine, révolutionne l'expérience d'essayage virtuel en permettant le remplacement en temps réel des vêtements des personnages vidéo. Il résout les problèmes de cohérence temporelle et de qualité d'image, améliorant ainsi l'effet d'essayage.

image.png

【Résumé AiBase :】

👗 Technologie de pointe : ViViD est basé sur la technologie des modèles de diffusion, permettant le remplacement en temps réel des vêtements dans les vidéos, pour générer des effets naturels et réalistes.

🔧 Trois composants principaux : l'encodeur de vêtements, l'encodeur de posture et le module temporel fonctionnent ensemble pour extraire les détails des vêtements, coder la posture et maintenir la cohérence temporelle.

🌟 Fusion de caractéristiques innovantes : l'introduction d'un mécanisme de fusion de caractéristiques d'attention optimise l'intégration des informations sémantiques des vêtements, améliorant l'effet d'essayage pour répondre aux besoins des utilisateurs.

Lien détaillé : https://top.aibase.com/tool/vivid

7、Perplexity lance la fonction de création de pages pour générer rapidement des documents professionnels

Perplexity AI a lancé sa nouvelle fonction Perplexity Pages, conçue pour aider les utilisateurs à générer rapidement des documents de niveau professionnel, améliorant ainsi la productivité des créateurs de contenu et remettant en question les plates-formes de bases de connaissances traditionnelles. L'outil génère rapidement du contenu, prend en charge une personnalisation élevée, l'insertion de contenu multimédia, la vérification des informations et la gestion des sources, le partage et l'optimisation de la recherche.

【Résumé AiBase :】

🚀 Génération rapide de documents professionnels, permettant de gagner du temps et des efforts.

🔧 Personnalisation élevée pour répondre à différents besoins.

📸 Insertion de contenu multimédia pour améliorer l'attrait des documents.

Lien détaillé : https://top.aibase.com/tool/perplexity

8、Midjourney va lancer la version 6.5 ; la version Web sera bientôt accessible à tous

Midjourney s'apprête à lancer la version 6.5, qui apportera une amélioration significative de la qualité de l'image, et la version Web connaîtra également une mise à jour majeure. Malgré les défis rencontrés dans le développement du modèle vidéo, l'équipe est convaincue que des efforts continus mèneront à des percées plus importantes.

【Résumé AiBase :】

🚀 Amélioration significative de la qualité de l'image, potentiellement identique à la version 7, amélioration de la cohérence, de la peau, des mains et de la représentation corporelle.

💻 La version Web se débarrassera de la dépendance à Discord, offrant une meilleure expérience utilisateur.

💡 Lancement d'un explorateur d'espace de style et d'une page d'exploration mise à jour, en envisageant des remises sur l'abonnement pour attirer plus d'utilisateurs.

9、Le modèle Suno 3.5 est désormais accessible à tous, permettant de créer des chansons de 4 minutes

Le dernier modèle Suno 3.5 est désormais disponible pour tous les utilisateurs, offrant des fonctionnalités telles que la création de chansons de 4 minutes, l'extension des chansons de 2 minutes et une structure de chanson améliorée. Suno a également lancé une nouvelle fonctionnalité permettant de transformer n'importe quel son en musique, ouvrant de nouvelles possibilités pour la création musicale. L'entreprise a levé 125 millions de dollars, consolidant sa position de leader dans le domaine de la musique par IA. Suno a démontré une capacité d'innovation et une position de leader exceptionnelles.

image.png

【Résumé AiBase :】

🎵 Création de chansons de 4 minutes et extension des chansons de 2 minutes.

🎶 Transformation de n'importe quel son en musique, ouvrant de nouvelles possibilités créatives.

💰 L'entreprise a levé 125 millions de dollars, consolidant sa position de leader.

Lien détaillé : https://top.aibase.com/tool/suno-ai

10、You.com lance une fonction d'assistant personnalisé

You.com lance une fonction d'assistant personnalisé permettant aux utilisateurs de créer des assistants IA personnalisés à l'aide de modèles linguistiques de pointe tels que GPT-4o, Llama 3 et Claude 3, dans le but d'améliorer la productivité des utilisateurs dans les tâches complexes. Cette fonctionnalité rend les puissants modèles linguistiques plus accessibles et adaptables aux besoins individuels, offrant aux utilisateurs une expérience d'assistant IA personnalisée.

【Résumé AiBase :】

⭐️ L'assistant IA personnalisé vise à améliorer la productivité des utilisateurs dans les tâches complexes.

⭐️ You.com s'engage à fournir des informations précises et en temps réel, offrant des réponses plus pertinentes et fiables via un accès en ligne.

⭐️ L'impact technologique est profond, les assistants IA personnalisés ayant le potentiel de transformer le travail intellectuel dans des domaines tels que la médecine, la finance et l'éducation.

11、Cartesia publie Sonic, un modèle de génération vocale à faible latence : une réplication du chat vocal en temps réel de ChatGPT ?

Le modèle de génération vocale à faible latence Sonic, publié par Cartesia, a suscité un intérêt considérable, sa vitesse d'inférence rapide et sa latence ultra-faible étant impressionnantes. Sonic peut générer en temps réel une voix dotée d'émotions et d'expressions réalistes. Les utilisateurs n'ont besoin que de 10 secondes d'enregistrement pour imiter les caractéristiques vocales d'un locuteur. L'objectif de Cartesia est de créer un système intelligent en temps réel. Ils ont introduit l'architecture SSM innovante et ont réalisé des progrès initiaux.

image.png

【Résumé AiBase :】

🚀 La latence du modèle Sonic est de seulement 135 millisecondes, ce qui le rend adapté aux applications de chat.

😊 Sonic présente des émotions et des expressions humaines, rendant les conversations plus naturelles.

🔧 Les utilisateurs peuvent ajuster des paramètres tels que la tonalité, la vitesse et les émotions pour personnaliser la sortie vocale.

Lien détaillé : https://top.aibase.com/tool/carteisa-sonic

12、Gartner prévoit que les revenus des puces d'IA atteindront 71,2 milliards de dollars en 2024

Selon les prévisions de Gartner, les revenus mondiaux des semi-conducteurs pour l'IA augmenteront de 33 % en 2024 pour atteindre 71,2 milliards de dollars. Cette tendance permettra aux ordinateurs d'être généralement dotés de fonctionnalités d'IA, et les achats d'ordinateurs d'entreprise passeront entièrement aux ordinateurs d'IA. Le traitement de l'IA se fera principalement dans les centres de données, et la valeur des accélérateurs devrait atteindre 21 milliards de dollars.

【Résumé AiBase :】

📈 Les revenus mondiaux des semi-conducteurs pour l'IA devraient augmenter de 33 % en 2024 pour atteindre 71,2 milliards de dollars.

💻 On prévoit que 22 % des ordinateurs seront dotés de fonctionnalités d'IA en 2024, et d'ici fin 2026, les achats d'ordinateurs d'entreprise passeront entièrement aux ordinateurs d'IA.

🏭 Le traitement de l'IA se fera principalement dans les centres de données, et la valeur des accélérateurs utilisés dans les serveurs atteindra 21 milliards de dollars en 2024.

13、Google éclipsé ! Des avatars 3D haute fidélité incroyablement réalistes : une jeune femme qui cligne des yeux et lève les sourcils sans aucune faille