Bienvenue à la rubrique 【AI日报】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en mettant l'accent sur les développeurs, pour vous aider à comprendre les tendances technologiques et les applications innovantes des produits d'IA.

Nouveaux produits IA Cliquez ici pour en savoir plus : https://top.aibase.com/

1. Kuaishou lance l'application indépendante « Keling AI » pour renforcer sa présence dans la création d'IA mobile

Kuaishou a récemment lancé l'application indépendante « Keling AI », visant à étendre son activité de création d'IA sur les appareils mobiles. Cette application, basée sur les modèles linguistiques de grande taille Keling et Ketu développés en interne par Kuaishou, offre des fonctionnalités de génération et d'édition de vidéos et d'images. Bien que moins complètes que la version web, elle a déjà attiré 3,6 millions d'utilisateurs, générant plus de 37 millions de vidéos et 100 millions d'images. Elle entre ainsi en concurrence avec l'application « Jimeng AI » de Douyin.

image.png

【Résumé AiBase :】

🚀 Kuaishou lance l'application indépendante « Keling AI » pour étendre sa présence dans la création d'IA mobile.

💡 L'application « Keling AI » est basée sur des modèles linguistiques de grande taille développés en interne et offre des fonctionnalités de génération et d'édition de vidéos et d'images.

💪 Elle a déjà attiré 3,6 millions d'utilisateurs, générant plus de 37 millions de vidéos et 100 millions d'images. Elle entre en concurrence avec l'application « Jimeng AI » de Douyin.

2. Zhipu AI publie en open source la dernière version de son modèle vidéo CogVideoX v1.5

L'équipe technique de Zhipu a publié la dernière version de son modèle de génération vidéo CogVideoX v1.5, et l'a mise en open source. Cette version apporte des améliorations significatives aux capacités de génération vidéo, prenant en charge les vidéos de 5/10 secondes, une résolution de 768P et une génération de 16 images par seconde. La nouvelle plateforme Qingying est lancée, combinée au modèle audio CogSound, pour offrir une génération vidéo 4K ultra-haute définition. Le traitement des données et les innovations algorithmiques garantissent la qualité et la cohérence des vidéos.

image.png

【Résumé AiBase :】

🚀 CogVideoX v1.5 est publié en open source, prenant en charge les vidéos de 5/10 secondes, une résolution de 768P et une génération de 16 images par seconde.

🎬 La nouvelle plateforme Qingying est lancée, combinée au modèle audio CogSound, pour offrir une génération vidéo 4K ultra-haute définition.

🔬 Le traitement des données et les innovations algorithmiques garantissent la qualité et la cohérence des vidéos générées.

Lien : https://github.com/thudm/cogvideo

3. Selon les informations, Baidu va lancer des lunettes intelligentes intégrant un assistant IA, basé sur le modèle Wenxin

Baidu prévoit de lancer des lunettes intelligentes intégrant l'assistant IA Xiaodu, qui seront présentées lors de la conférence mondiale Baidu 2024. Ces lunettes offrent des fonctionnalités innovantes et une nouvelle expérience intelligente.

【Résumé AiBase :】

🌟 Les lunettes seront équipées d'une caméra, permettant de prendre des photos et des vidéos.

📷 Les lunettes prendront en charge l'interaction vocale basée sur le modèle Ernie, améliorant l'expérience utilisateur.

🗣️ Les lunettes intelligentes Baidu offriront des solutions plus personnalisées et adaptées aux besoins des utilisateurs chinois.

4. Bonheur pour les joueurs à gros budget ! Krea AI lance la fonction d'entraînement Lora

Krea AI a lancé la fonction d'entraînement Lora, offrant aux utilisateurs un service d'entraînement personnalisé pour les personnages, les styles et les produits. Les utilisateurs peuvent télécharger plusieurs images pour commencer l'entraînement. L'interface est simple et conviviale. Les paramètres d'entraînement sont faciles à configurer et les résultats sont bons, ce qui est idéal pour les utilisateurs débutants. L'abonnement coûte 10 dollars par mois et permet un usage commercial.

【Résumé AiBase :】

🔥 Krea AI lance la fonction d'entraînement Lora, permettant aux utilisateurs de personnaliser les personnages, les styles et les produits.

💡 L'interface est simple, il suffit de télécharger des images et de configurer les paramètres de base. Le processus d'entraînement est simple et facile à utiliser.

💰 L'abonnement coûte 10 dollars par mois, permettant de générer 720 images FLux et 36 000 images en temps réel, avec un usage commercial autorisé.

Lien : https://www.krea.ai/train

5. Keling lance la fonction de modèle personnalisé pour résoudre le problème de la cohérence des personnages dans la génération de vidéos IA

La nouvelle fonction de modèle personnalisé lancée par Keling représente une avancée majeure dans le domaine de la génération de vidéos IA, en résolvant le problème technique de la cohérence des personnages. Cette fonction permet aux créateurs de télécharger plusieurs extraits vidéo pour l'entraînement, y compris les vidéos IA générées par Keling, offrant ainsi une plus grande flexibilité. Après l'entraînement, le système peut générer du contenu vidéo avec une cohérence des personnages, montrant ainsi des possibilités créatives variées.

image.png

【Résumé AiBase :】

🔑 Les créateurs peuvent télécharger plusieurs extraits vidéo pour l'entraînement du modèle, y compris les vidéos IA générées par Keling, offrant ainsi une plus grande flexibilité.

🚀 Après l'entraînement, le système peut générer du contenu vidéo avec une cohérence des personnages, montrant une rotation à 360 degrés et des caractéristiques d'apparence stables dans des scènes complexes.

💡 La version KLING 1.5 prend en charge la sortie vidéo HD 1080p et offre plusieurs options de format pour répondre aux besoins des différentes plateformes. L'outil de pinceau d'action améliore la précision et la flexibilité de la création vidéo.

6. Petit mais puissant ! Le modèle d'IA visuelle moondream2 de poche, utilisable sur téléphone portable

Moondream a lancé moondream2, un modèle linguistique visuel compact aux performances exceptionnelles, avec seulement 1,6 milliard de paramètres, pouvant fonctionner sur des appareils de petite taille comme les smartphones. Ce modèle possède de puissantes capacités de traitement du texte et des images, et a obtenu d'excellents résultats lors de divers tests de référence. L'équipe Moondream continue de mettre à jour les performances du modèle et a réussi à lever 4,5 millions de dollars. Le PDG possède une riche expérience.

image.png

【Résumé AiBase :】

🌟 Moondream lance moondream2, avec seulement 1,6 milliard de paramètres, pouvant fonctionner sur des appareils de petite taille comme les smartphones.

💰 Moondream a réussi à lever 4,5 millions de dollars, le PDG a travaillé chez Amazon, et l'équipe continue de mettre à jour et d'améliorer les performances du modèle.

📈 Moondream2 possède de puissantes capacités de traitement du texte et des images, peut répondre aux questions, effectuer la reconnaissance optique de caractères (OCR), le comptage et la classification d'objets, et obtient d'excellents résultats lors des tests de référence.

Lien : https://huggingface.co/vikhyatk/moondream2

7. Xiaomi annonce la mise à jour du grand modèle Xiaoi : fonction « Questions-réponses musicales » disponible sur plusieurs appareils

Xiaomi a officiellement annoncé la mise à jour des capacités musicales du grand modèle Xiaoi, avec l'ajout de la fonction « Questions-réponses musicales », disponible sur plusieurs appareils. Cette fonction, basée sur l'amélioration des capacités de l'intelligence artificielle, aide les utilisateurs à rechercher des informations sur les chansons et à répondre à des questions sur la musique. Xiaoi a subi une mise à jour majeure en juillet dernier, améliorant considérablement les fonctions de questions-réponses naturelles et d'assistant intelligent, améliorant ainsi l'expérience utilisateur.

image.png

【Résumé AiBase :】

🎵 L'assistant Xiaomi Xiaoi ajoute la fonction « Questions-réponses musicales », permettant de rechercher des informations sur les chansons et de répondre à des questions sur la musique.

📱 La fonction est disponible sur plusieurs appareils. Les utilisateurs doivent mettre à jour Xiaoi vers la dernière version.

🚗 Lors des mises à jour précédentes, Xiaoi a considérablement amélioré plusieurs fonctions de questions-réponses naturelles et d'assistant intelligent, améliorant ainsi l'expérience utilisateur.

8. Mistral AI lance une API de modération de contenu multilingue, pour défier OpenAI

Mistral AI a lancé une nouvelle API de modération de contenu, visant à concurrencer les leaders du secteur et à résoudre les problèmes de sécurité de l'IA et de filtrage du contenu. Cette API, basée sur le modèle Ministral8B, peut détecter divers contenus nuisibles, prend en charge plusieurs langues et est déjà utilisée sur la plateforme Le Chat. Mistral collabore avec plusieurs entreprises, démontrant ainsi sa technologie mature et sa vision européenne.

image.png

【Résumé AiBase :】

🌍 Prise en charge multilingue : l'API couvre 11 langues et détecte les contenus à caractère sexuel, les discours haineux et autres contenus nuisibles.

🔗 Collaborations : utilisée sur la plateforme Le Chat et collaborations avec Microsoft Azure, Qualcomm, etc.

🔒 Avantages technologiques : basé sur le contexte de la conversation, améliorant la capacité de détection des contenus potentiellement nuisibles.

Lien : https://docs.mistral.ai/capabilities/guardrailing/

9. La « langue électronique » IA est arrivée ! Elle peut goûter les aliments et détecter facilement la fraîcheur des produits alimentaires

Des scientifiques ont réussi à développer un nouveau dispositif appelé « langue électronique », utilisant l'intelligence artificielle pour distinguer avec précision différents mélanges de café et détecter la fraîcheur des aliments et des boissons, offrant ainsi une nouvelle solution pour le contrôle de la qualité et de la sécurité alimentaire. La langue électronique imite la technologie du goût humain, améliorant la précision et l'efficacité du travail, accélérant le développement des saveurs et garantissant la qualité des produits. Elle possède une fonction de surveillance de la fraîcheur des aliments, protégeant la santé des consommateurs et permettant aux commerçants de contrôler la qualité. Ses perspectives d'application sont vastes, et elle pourrait être étendue à de nombreux domaines tels que la médecine et la surveillance environnementale.

image.png

【Résumé AiBase :】

🌟 La langue électronique utilise l'intelligence artificielle pour distinguer avec précision différents mélanges de café.

🍽️ Elle détecte la fraîcheur des aliments et des boissons, évitant ainsi la détérioration.

🔬 À l'avenir, la langue électronique pourrait être utilisée dans les domaines de la médecine et de la surveillance environnementale.

Lien : https://www.nature.com/articles/s41586-024-08003-w

10. La technologie high-tech de Google ReCapture : génération en un clic de vidéos « multi-caméras »

ReCapture, une technologie innovante développée par Google Research, permet de générer des vidéos avec des trajectoires de caméra personnalisées, permettant aux utilisateurs de vivre le contenu vidéo original sous un angle totalement nouveau. Le principe sous-jacent n'est pas complexe : grâce à un modèle de diffusion multi-vues et à une technique d'ajustement fin de la vidéo masquée, la transformation d'une vidéo brute en une vidéo claire, cohérente et dynamique est possible. Les chercheurs de Google indiquent que ReCapture ne nécessite pas de grandes quantités de données d'entraînement, s'adapte à divers types de vidéos et de changements de perspective, permettant même aux utilisateurs ordinaires de créer facilement des vidéos « multi-caméras » de qualité professionnelle.

image.png

【Résumé AiBase :】

🔍 La technologie ReCapture permet aux utilisateurs de revivre la vidéo et de générer une nouvelle version avec des trajectoires de caméra personnalisées.

🛠️ Elle utilise un modèle de diffusion multi-vues et une technique d'ajustement fin de la vidéo masquée pour transformer une vidéo brute en une vidéo claire, cohérente et dynamique.

🎥 ReCapture ne nécessite pas de grandes quantités de données d'entraînement, s'adapte à divers types de vidéos et de changements de perspective, permettant aux utilisateurs ordinaires de créer des vidéos « multi-caméras » de qualité professionnelle.

Lien : https://generative-video-camera-controls.github.io/

11. OpenAI remporte son procès en matière de droits d'auteur : la légalisation de la collecte de données IA devient-elle une tendance ?

Récemment, le tribunal du district sud de New York a rejeté l'action en justice pour violation du droit d'auteur intentée par Raw Story Media, Inc. et AlterNet Media, Inc. contre OpenAI, estimant que l'affaire n'était pas recevable. Cette décision marque une victoire importante pour OpenAI dans le litige juridique entre l'IA et les droits d'auteur, et fournit une référence pour le traitement des affaires similaires à l'avenir. Le tribunal a rejeté l'action en justice, soulignant la nature synthétique du contenu généré par l'IA, ce qui rend la possibilité de copier mot pour mot moins probable, fournissant ainsi une référence juridique et des enseignements pour le traitement des litiges futurs entre l'IA et les droits d'auteur.

【Résumé AiBase :】