Modelo de IA de alta resolución Griffon v2: Referencia flexible de texto e imágenes

站长之家

Publicado elNoticias de IA · 1 minutos de lectura · Mar 19, 2024

145

El nuevo modelo de IA de alta resolución Griffon v2 combina señales de texto y visuales, ofreciendo referencias de objetos flexibles. El equipo mejoró la capacidad de percepción multimodal mediante el uso de un proyector de submuestreo. El modelo sobresale en tareas de generación de expresiones de referencia, localización de frases y comprensión de expresiones de referencia, superando a los modelos expertos. Con una estructura de coreferencia visual-lingüística, muestra una superioridad en la detección de objetos y el conteo de objetos.

Griffon Modelo de IA Referencia

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

¡NeuralOS, el sistema operativo de inteligencia artificial, aparece de repente! Interfaz perfectamente simulada de Windows, nueva era en la interacción hombre-máquina

Un equipo chino presenta NeuralOS, un sistema operativo de inteligencia artificial de código abierto, que materializa la propuesta de GUI para la era de la inteligencia artificial de Kapor. Este sistema utiliza dos módulos principales: RNN y renderizador neuronal, que pueden predecir y simular en tiempo real la interfaz de Windows, mostrando con precisión las respuestas a las operaciones del usuario. El equipo de desarrollo entrenó al sistema con una gran cantidad de grabaciones de operaciones, y actualmente puede predecir con precisión las operaciones del usuario, aunque aún tiene ciertas limitaciones al manejar entradas rápidas del teclado. NeuralOS ya ofrece una versión en línea para probar, demostrando una nueva experiencia en sistemas operativos generados dinámicamente por la inteligencia artificial. Con el código...

Jul 16, 2025

Uber se une a Luobo Kuaipao, miles de Robotaxis estarán disponibles en todo el mundo

La empresa china de conducción autónoma 'Luobo Kuaipao' se asocia con Uber para desplegar miles de Robotaxis. Esta colaboración marca un avance significativo en la tecnología autónoma, con servicio disponible en meses. Luobo Kuaipao expande rápidamente su presencia global, con pruebas en Dubái y planes para más de 1000 vehículos. El CEO de Uber elogia su tecnología, respaldada por 170 millones de km de pruebas seguras. Goldman Sachs prevé un merc....

Jul 16, 2025

Diario de IA: ByteDance lanzará la versión 2.0 de su herramienta de programación de IA TRAE; Mistral presenta de manera importante el modelo de audio Voxtral; Moonshot responde sobre la lentitud de la API Kimi K2

1. ByteDance TRAE2.0 añade voz para eficiencia. 2. Mistral lanza Voxtral, modelo de audio multilingüe. 3. Optimización de Kimi K2API. 4. Kunlun lanza AgentOrchestra. 5. Thinking Machines Lab recibe $2B. 6. Kimi-2 supera a GPT-4.1. 7. TRAE ofrece Kimi-K2 y Grok-4. 8. ByteDance abre POLARIS. 9. Ima lanza versión web.....

Jul 16, 2025

Las herramientas de programación de IA se orientan silenciosamente hacia la interfaz de terminal, el futuro del desarrollo podría cambiar por completo

Herramientas de IA evolucionan de editores de código a terminales. Claude Code y otras demuestran su eficacia en Terminal-Bench, manejando desarrollo y DevOps. Expertos predicen que 95% de interacciones con IA serán mediante terminales.....

Jul 16, 2025

Kimi-2 ya está en LiveBench AI: El nuevo rey de la inteligencia artificial de código abierto supera a GPT-4.1

Kimi-2, modelo de IA de código abierto con 32B parámetros, supera a Claude y GPT-4.1 en pruebas. Precio API: $0.15/millón tokens. Disponible en app Kimi y como servicio API.....

Jul 16, 2025

Actualización de NotebookLM de Google: nueva biblioteca pública de notas que mejora la experiencia de notas inteligentes

Google actualiza su aplicación de notas inteligentes NotebookLM, con una nueva función de biblioteca pública de notas. Esta biblioteca integra contenido autoritativo como The Economist y notas de expertos, y permite a los usuarios hacer preguntas y obtener resúmenes de IA. Se han añadido funciones de resumen en audio y mapas mentales. Los primeros recursos incluyen guías sobre longevidad, consejos de viaje y otros contenidos útiles. Actualmente, la plataforma ha acumulado más de 140.000 notas de usuarios, mejorando la eficiencia de la gestión del conocimiento a través de la tecnología de IA y fortaleciendo el ecosistema de compartición de información.

Jul 16, 2025

Xiyu Technology presenta el asistente integral para desarrolladores de MiniMax Agent

MiniMax Agent de稀宇科技 ofrece solución integral para desarrolladores con hosting en Supabase, pagos Stripe y tareas programadas. Ideal para APIs, datos en tiempo real y LLMs.....

Jul 16, 2025

Huang Renxun aparece en la Feria de la Cadena: la IA se convertirá en la nueva infraestructura global, los desarrolladores chinos desempeñarán un papel clave

CEO de NVIDIA destaca la transformación de la compañía hacia la IA, resaltando 1.5M de proyectos chinos en su plataforma y el papel clave de China en estándares globales de IA. Omniverse impulsa la digitalización de cadenas de suministro en China.....

Jul 16, 2025

Actualización de Microsoft Copilot Vision AI: que tu pantalla esté a la vista

Microsoft actualiza Copilot Vision para Windows Insiders, permitiendo analizar el escritorio o ventanas. Ofrece sugerencias personalizadas, como optimizar CVs o guías de juegos, e integra cámara del móvil para respuestas en tiempo real. Puntos clave: 1️⃣ Reconocimiento visual 2️⃣ Interacción con un clic 3️⃣ Preguntas con cámara.....

Jul 16, 2025

La nueva empresa de Mira Murati, ex CTO de OpenAI, completa una financiación de 2000 millones de dólares para impulsar el desarrollo de inteligencia artificial multimodal

Thinking Machines Lab, fundada por la exCTO de OpenAI Mira Murati, recaudó $2B en ronda semilla, valuada en $12B. Desarrolla IA multimodal para interacción humano-máquina, con enfoque en transparencia y valores humanos.....

Jul 16, 2025