Modèle IA haute résolution Griffon v2 : références texte et visuelles flexibles

站长之家

Publié leActualités IA · 1 minutes de lecture · Mar 19, 2024

148

Griffon v2 : Un nouveau modèle IA haute résolution

Le nouveau modèle IA haute résolution Griffon v2 combine des indices textuels et visuels, offrant une référence d'objet flexible. L'équipe a amélioré les capacités de perception multimodale grâce à un projecteur de sous-échantillonnage. Ce modèle excelle dans les tâches de génération d'expressions de référence, de localisation de phrases et de compréhension d'expressions de référence, surpassant même les modèles experts. Doté d'une structure de co-référence visuelle et linguistique, il affiche une supériorité en matière de détection d'objets et de comptage d'objets.

Griffon Modèle IA Références

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

Journal de l'IA : ByteDance lancera une version 2.0 de son outil de programmation par IA TRAE ; Mistral présente un modèle audio majeur, Voxtral ; Moonshot répond à la lenteur de l'API Kimi K2

1. ByteDance TRAE2.0 ajoute interaction vocale. 2. Mistral lance Voxtral, modèle audio open source multilingue. 3. Optimisation de Kimi K2API. 4. Kunlun publie AgentOrchestra. 5. Thinking Machines Lab lève 2Mds$. 6. Kimi-2 surpasse GPT-4.1. 7. TRAE propose Kimi-K2 et Grok-4. 8. ByteDance open source POLARIS. 9. ima accessible via navigateur.....

Jul 16, 2025

Les outils de programmation en IA passent discrètement à l'interface en ligne de commande, le développement du futur pourrait être entièrement transformé !

Les outils d'IA passent des éditeurs de code traditionnels aux terminaux. Claude Code et d'autres prouvent leur efficacité supérieure dans les tâches de codage et DevOps, avec 95% des interactions futures prévues via des interfaces terminal.....

Jul 16, 2025

Kimi-2 est maintenant en ligne sur LiveBench AI : un nouveau roi des IA open source dépasse GPT-4.1

Kimi-2, modèle IA open-source avec 32B paramètres, surpasse Claude Opus4 et GPT-4.1. Tarif API compétitif à 0,15$/M tokens, intégré dans l'app Kimi.....

Jul 16, 2025

La dernière recette d'apprentissage par renforcement de Seed de ByteDance, POLARIS, est maintenant open source avec un modèle de 4 milliards de paramètres, capables de raisonnement mathématique proches des performances de 235 milliards de paramètres

Récemment, l'équipe Seed de ByteDance a collaboré avec l'Université de Hong Kong et l'Université Fudan pour présenter une nouvelle méthode d'entraînement par renforcement appelée POLARIS. Cette méthode, grâce à une stratégie d'apprentissage par renforcement bien conçue, a réussi à améliorer les capacités de raisonnement mathématique des petits modèles jusqu'au niveau des grands modèles. Cela offre une nouvelle voie pour l'optimisation des petits modèles dans le domaine de l'intelligence artificielle. Les résultats expérimentaux montrent que le modèle open source Qwen3-4B de 4 milliards de paramètres entraîné avec POLARIS obtient des performances proches des modèles de 235 milliards de paramètres aux tests mathématiques AIME25 et AIME24.

Jul 16, 2025

Willow Voice lève 4,2 millions de dollars : l'entrée vocale IA révolutionne l'expérience de travail efficace

Willow Voice lève 4,2M$ en amorçage pour son outil AI de transcription vocale en temps réel, compatible macOS, avec correction grammaticale et protection des données. Financement destiné à l'expansion et l'amélioration technologique.....

Jul 16, 2025

Nouvelle tendance sociale entre voisins ! Nextdoor lance des recommandations par IA et des alertes en temps réel pour redéfinir l'expérience de communication locale

L'application de socialisation entre voisins Nextdoor dévoile une nouvelle version, introduisant trois nouvelles fonctionnalités : une agrégation d'actualités locales (en collaboration avec 3500 médias locaux), des alertes de sécurité en temps réel (prévisions météo, trafic, catastrophes) et des recommandations Faves par IA (conseils personnalisés en services locaux basés sur 15 ans de données entre voisins). La plateforme vise à résoudre le problème des informations erronées précédemment présentes, en améliorant la qualité et la rapidité du contenu pour renforcer l'engagement des utilisateurs. Le PDG Tolia souligne que son avantage principal réside dans la réputation numérique entre voisins, une valeur unique qui ne peut être reproduite par d'autres plateformes.

Jul 16, 2025

Le court roman créatif Kimi K2 remporte le concours, dépassant o3-Pro et illustrant une nouvelle ère de littérature en IA

Kimi K2 excelle en écriture créative, surpassant o3-Pro. Développé par Moonshot (soutenu par Alibaba), il brille en compression littéraire et métaphores innovantes. Coût avantageux (0.15$/M tokens), suivi précis des instructions, mais progrès nécessaires en profondeur émotionnelle.....

Jul 16, 2025

TRAE lance le service du modèle Kimi-K2, la version internationale prend en charge la fonction Grok-4 (Beta) mise à niveau

TRAE.ai lance Kimi-K2 (MoE) et Grok-4(Beta). Kimi-K2 excelle en code/maths, rivalisant avec GPT-4.1. Accès en 3 étapes. Version internationale propose aussi Claude, Gemini, GPT.....

Jul 16, 2025

Google Discover lance une fonction de résumé en IA, les sites d'actualité pourraient faire face à un nouveau défi !

Google lance des résumés IA dans son moteur de recherche, suscitant des inquiétudes chez les éditeurs. Cette fonctionnalité, disponible aux États-Unis, génère automatiquement des résumés d'articles avec sources. Les éditeurs constatent une baisse de trafic depuis son introduction en mai, malgré les efforts de Google pour compenser.....

Jul 16, 2025

La IA découvre le goût, une nouvelle avancée ! Il est si simple de distinguer le Coca-Cola du café !

Des scientifiques italiens ont développé GO-ISMD, un système artificiel de goût avec 90% de précision pour identifier les saveurs. Utilisant du graphène, il atteint 92.3% pour distinguer café et cola. Une avancée majeure pour les troubles du goût.....

Jul 15, 2025

Product Finder

Product Submit

AI Models Finder

MCP Servers

MCP Client

MCP Inspector

Case Tutorials

Latest AI News

AI Daily Brief

Modèle IA haute résolution Griffon v2 : références texte et visuelles flexibles

站长之家

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

Journal de l'IA : ByteDance lancera une version 2.0 de son outil de programmation par IA TRAE ; Mistral présente un modèle audio majeur, Voxtral ; Moonshot répond à la lenteur de l'API Kimi K2

Les outils de programmation en IA passent discrètement à l'interface en ligne de commande, le développement du futur pourrait être entièrement transformé !

Kimi-2 est maintenant en ligne sur LiveBench AI : un nouveau roi des IA open source dépasse GPT-4.1

La dernière recette d'apprentissage par renforcement de Seed de ByteDance, POLARIS, est maintenant open source avec un modèle de 4 milliards de paramètres, capables de raisonnement mathématique proches des performances de 235 milliards de paramètres

Willow Voice lève 4,2 millions de dollars : l'entrée vocale IA révolutionne l'expérience de travail efficace

Nouvelle tendance sociale entre voisins ! Nextdoor lance des recommandations par IA et des alertes en temps réel pour redéfinir l'expérience de communication locale

Le court roman créatif Kimi K2 remporte le concours, dépassant o3-Pro et illustrant une nouvelle ère de littérature en IA

TRAE lance le service du modèle Kimi-K2, la version internationale prend en charge la fonction Grok-4 (Beta) mise à niveau

Google Discover lance une fonction de résumé en IA, les sites d'actualité pourraient faire face à un nouveau défi !

La IA découvre le goût, une nouvelle avancée ! Il est si simple de distinguer le Coca-Cola du café !