La empresa emergente de hardware de inteligencia artificial Groq ha lanzado dos modelos de lenguaje de código abierto que superan a los gigantes tecnológicos en cuanto a capacidad de uso de herramientas especializadas. El nuevo modelo Llama-3-Groq-70B-Tool-Use ha alcanzado el primer puesto en la clasificación de llamadas a funciones de Berkeley (BFCL), superando a productos propietarios de empresas como OpenAI, Google y Anthropic.
Rick Lamers, responsable de proyecto en Groq, anunció este avance en una publicación de X.com. Declaró: "Estoy orgulloso de anunciar los modelos Llama3Groq Tool Use 8B y 70B. Se trata de una versión completamente ajustada de uso de herramientas de código abierto de Llama3, que ha alcanzado el primer puesto en BFCL, superando a todos los demás modelos, incluidos modelos propietarios como Claude Sonnet 3.5, GPT-4 Turbo, GPT-4o y Gemini 1.5 Pro."
Datos sintéticos y IA ética: un nuevo paradigma en el entrenamiento de modelos
La versión de 70B parámetros, la más grande, alcanzó una precisión general del 90,76% en BFCL, mientras que el modelo más pequeño de 8B obtuvo una puntuación del 89,06%, ocupando el tercer lugar en la clasificación general. Estos resultados demuestran que los modelos de código abierto pueden igualar o incluso superar el rendimiento de las alternativas de código cerrado en tareas específicas.
Groq desarrolló estos modelos en colaboración con la empresa de investigación de IA Glaive, utilizando un ajuste fino completo y optimización de preferencia directa (DPO) sobre el modelo base Llama-3 de Meta. El equipo destaca que solo utilizaron datos sintéticos generados éticamente para el entrenamiento, abordando las preocupaciones comunes sobre la privacidad de los datos y el sobreajuste.
Estos modelos están ahora disponibles a través de la API de Groq y la plataforma Hugging Face. Esta accesibilidad puede acelerar la innovación en áreas que requieren el uso de herramientas complejas y llamadas a funciones, como la codificación automática, el análisis de datos y los asistentes de IA interactivos.
Groq también ha lanzado una demostración pública en Hugging Face Spaces, que permite a los usuarios interactuar con los modelos y probar de primera mano su capacidad de uso de herramientas. Al igual que Gradio, adquirido por Hugging Face en diciembre de 2021, muchas de las demostraciones en Hugging Face Spaces se crean de esta manera. La comunidad de IA ha respondido positivamente, y muchos investigadores y desarrolladores están ansiosos por explorar las capacidades de estos modelos.
Puntos clave:
⭐ Los modelos de IA de código abierto lanzados por Groq superan a los modelos propietarios de los gigantes tecnológicos en tareas específicas.
⭐ Al entrenar con datos sintéticos, Groq desafía los problemas comunes de privacidad de datos y sobreajuste en el desarrollo de modelos de IA.
⭐ El lanzamiento de modelos de código abierto podría cambiar el rumbo del desarrollo en el campo de la IA, promoviendo una mayor accesibilidad a la IA y el fomento de un ecosistema de innovación más amplio.