Los modelos de IA Llama de código abierto de Groq encabezan las clasificaciones, superando a GPT-4 y Claude en llamadas a funciones

AIbase基地

Publicado elNoticias de IA · 5 minutos de lectura · Jul 19, 2024

227

La empresa emergente de hardware de inteligencia artificial Groq ha lanzado dos modelos de lenguaje de código abierto que superan a los gigantes tecnológicos en cuanto a capacidad de uso de herramientas especializadas. El nuevo modelo Llama-3-Groq-70B-Tool-Use ha alcanzado el primer puesto en la clasificación de llamadas a funciones de Berkeley (BFCL), superando a productos propietarios de empresas como OpenAI, Google y Anthropic.

Rick Lamers, responsable de proyecto en Groq, anunció este avance en una publicación de X.com. Declaró: "Estoy orgulloso de anunciar los modelos Llama3Groq Tool Use 8B y 70B. Se trata de una versión completamente ajustada de uso de herramientas de código abierto de Llama3, que ha alcanzado el primer puesto en BFCL, superando a todos los demás modelos, incluidos modelos propietarios como Claude Sonnet 3.5, GPT-4 Turbo, GPT-4o y Gemini 1.5 Pro."

Datos sintéticos y IA ética: un nuevo paradigma en el entrenamiento de modelos

La versión de 70B parámetros, la más grande, alcanzó una precisión general del 90,76% en BFCL, mientras que el modelo más pequeño de 8B obtuvo una puntuación del 89,06%, ocupando el tercer lugar en la clasificación general. Estos resultados demuestran que los modelos de código abierto pueden igualar o incluso superar el rendimiento de las alternativas de código cerrado en tareas específicas.

Groq desarrolló estos modelos en colaboración con la empresa de investigación de IA Glaive, utilizando un ajuste fino completo y optimización de preferencia directa (DPO) sobre el modelo base Llama-3 de Meta. El equipo destaca que solo utilizaron datos sintéticos generados éticamente para el entrenamiento, abordando las preocupaciones comunes sobre la privacidad de los datos y el sobreajuste.

Estos modelos están ahora disponibles a través de la API de Groq y la plataforma Hugging Face. Esta accesibilidad puede acelerar la innovación en áreas que requieren el uso de herramientas complejas y llamadas a funciones, como la codificación automática, el análisis de datos y los asistentes de IA interactivos.

Groq también ha lanzado una demostración pública en Hugging Face Spaces, que permite a los usuarios interactuar con los modelos y probar de primera mano su capacidad de uso de herramientas. Al igual que Gradio, adquirido por Hugging Face en diciembre de 2021, muchas de las demostraciones en Hugging Face Spaces se crean de esta manera. La comunidad de IA ha respondido positivamente, y muchos investigadores y desarrolladores están ansiosos por explorar las capacidades de estos modelos.

Puntos clave:
⭐ Los modelos de IA de código abierto lanzados por Groq superan a los modelos propietarios de los gigantes tecnológicos en tareas específicas.
⭐ Al entrenar con datos sintéticos, Groq desafía los problemas comunes de privacidad de datos y sobreajuste en el desarrollo de modelos de IA.
⭐ El lanzamiento de modelos de código abierto podría cambiar el rumbo del desarrollo en el campo de la IA, promoviendo una mayor accesibilidad a la IA y el fomento de un ecosistema de innovación más amplio.

Noticias de IA

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

¡NeuralOS, el sistema operativo de inteligencia artificial, aparece de repente! Interfaz perfectamente simulada de Windows, nueva era en la interacción hombre-máquina

Un equipo chino presenta NeuralOS, un sistema operativo de inteligencia artificial de código abierto, que materializa la propuesta de GUI para la era de la inteligencia artificial de Kapor. Este sistema utiliza dos módulos principales: RNN y renderizador neuronal, que pueden predecir y simular en tiempo real la interfaz de Windows, mostrando con precisión las respuestas a las operaciones del usuario. El equipo de desarrollo entrenó al sistema con una gran cantidad de grabaciones de operaciones, y actualmente puede predecir con precisión las operaciones del usuario, aunque aún tiene ciertas limitaciones al manejar entradas rápidas del teclado. NeuralOS ya ofrece una versión en línea para probar, demostrando una nueva experiencia en sistemas operativos generados dinámicamente por la inteligencia artificial. Con el código...

Jul 16, 2025

Uber se une a Luobo Kuaipao, miles de Robotaxis estarán disponibles en todo el mundo

La empresa china de conducción autónoma 'Luobo Kuaipao' se asocia con Uber para desplegar miles de Robotaxis. Esta colaboración marca un avance significativo en la tecnología autónoma, con servicio disponible en meses. Luobo Kuaipao expande rápidamente su presencia global, con pruebas en Dubái y planes para más de 1000 vehículos. El CEO de Uber elogia su tecnología, respaldada por 170 millones de km de pruebas seguras. Goldman Sachs prevé un merc....

Jul 16, 2025

Diario de IA: ByteDance lanzará la versión 2.0 de su herramienta de programación de IA TRAE; Mistral presenta de manera importante el modelo de audio Voxtral; Moonshot responde sobre la lentitud de la API Kimi K2

1. ByteDance TRAE2.0 añade voz para eficiencia. 2. Mistral lanza Voxtral, modelo de audio multilingüe. 3. Optimización de Kimi K2API. 4. Kunlun lanza AgentOrchestra. 5. Thinking Machines Lab recibe $2B. 6. Kimi-2 supera a GPT-4.1. 7. TRAE ofrece Kimi-K2 y Grok-4. 8. ByteDance abre POLARIS. 9. Ima lanza versión web.....

Jul 16, 2025

Las herramientas de programación de IA se orientan silenciosamente hacia la interfaz de terminal, el futuro del desarrollo podría cambiar por completo

Herramientas de IA evolucionan de editores de código a terminales. Claude Code y otras demuestran su eficacia en Terminal-Bench, manejando desarrollo y DevOps. Expertos predicen que 95% de interacciones con IA serán mediante terminales.....

Jul 16, 2025

Kimi-2 ya está en LiveBench AI: El nuevo rey de la inteligencia artificial de código abierto supera a GPT-4.1

Kimi-2, modelo de IA de código abierto con 32B parámetros, supera a Claude y GPT-4.1 en pruebas. Precio API: $0.15/millón tokens. Disponible en app Kimi y como servicio API.....

Jul 16, 2025

Actualización de NotebookLM de Google: nueva biblioteca pública de notas que mejora la experiencia de notas inteligentes

Google actualiza su aplicación de notas inteligentes NotebookLM, con una nueva función de biblioteca pública de notas. Esta biblioteca integra contenido autoritativo como The Economist y notas de expertos, y permite a los usuarios hacer preguntas y obtener resúmenes de IA. Se han añadido funciones de resumen en audio y mapas mentales. Los primeros recursos incluyen guías sobre longevidad, consejos de viaje y otros contenidos útiles. Actualmente, la plataforma ha acumulado más de 140.000 notas de usuarios, mejorando la eficiencia de la gestión del conocimiento a través de la tecnología de IA y fortaleciendo el ecosistema de compartición de información.

Jul 16, 2025

Xiyu Technology presenta el asistente integral para desarrolladores de MiniMax Agent

MiniMax Agent de稀宇科技 ofrece solución integral para desarrolladores con hosting en Supabase, pagos Stripe y tareas programadas. Ideal para APIs, datos en tiempo real y LLMs.....

Jul 16, 2025

Huang Renxun aparece en la Feria de la Cadena: la IA se convertirá en la nueva infraestructura global, los desarrolladores chinos desempeñarán un papel clave

CEO de NVIDIA destaca la transformación de la compañía hacia la IA, resaltando 1.5M de proyectos chinos en su plataforma y el papel clave de China en estándares globales de IA. Omniverse impulsa la digitalización de cadenas de suministro en China.....

Jul 16, 2025

Actualización de Microsoft Copilot Vision AI: que tu pantalla esté a la vista

Microsoft actualiza Copilot Vision para Windows Insiders, permitiendo analizar el escritorio o ventanas. Ofrece sugerencias personalizadas, como optimizar CVs o guías de juegos, e integra cámara del móvil para respuestas en tiempo real. Puntos clave: 1️⃣ Reconocimiento visual 2️⃣ Interacción con un clic 3️⃣ Preguntas con cámara.....

Jul 16, 2025

La nueva empresa de Mira Murati, ex CTO de OpenAI, completa una financiación de 2000 millones de dólares para impulsar el desarrollo de inteligencia artificial multimodal

Thinking Machines Lab, fundada por la exCTO de OpenAI Mira Murati, recaudó $2B en ronda semilla, valuada en $12B. Desarrolla IA multimodal para interacción humano-máquina, con enfoque en transparencia y valores humanos.....

Jul 16, 2025

Product Finder

Product Submit

AI Models Finder

MCP Servers

MCP Client

MCP Inspector

Case Tutorials

Latest AI News

AI Daily Brief

Los modelos de IA Llama de código abierto de Groq encabezan las clasificaciones, superando a GPT-4 y Claude en llamadas a funciones

AIbase基地

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

¡NeuralOS, el sistema operativo de inteligencia artificial, aparece de repente! Interfaz perfectamente simulada de Windows, nueva era en la interacción hombre-máquina

Uber se une a Luobo Kuaipao, miles de Robotaxis estarán disponibles en todo el mundo

Diario de IA: ByteDance lanzará la versión 2.0 de su herramienta de programación de IA TRAE; Mistral presenta de manera importante el modelo de audio Voxtral; Moonshot responde sobre la lentitud de la API Kimi K2

Las herramientas de programación de IA se orientan silenciosamente hacia la interfaz de terminal, el futuro del desarrollo podría cambiar por completo

Kimi-2 ya está en LiveBench AI: El nuevo rey de la inteligencia artificial de código abierto supera a GPT-4.1

Actualización de NotebookLM de Google: nueva biblioteca pública de notas que mejora la experiencia de notas inteligentes

Xiyu Technology presenta el asistente integral para desarrolladores de MiniMax Agent

Huang Renxun aparece en la Feria de la Cadena: la IA se convertirá en la nueva infraestructura global, los desarrolladores chinos desempeñarán un papel clave

Actualización de Microsoft Copilot Vision AI: que tu pantalla esté a la vista

La nueva empresa de Mira Murati, ex CTO de OpenAI, completa una financiación de 2000 millones de dólares para impulsar el desarrollo de inteligencia artificial multimodal