¡OpenAI vuelve a sorprender! Su último lanzamiento, GPT-4o mini, se presenta como el modelo pequeño más "económico y práctico". Esto no es solo una actualización de modelo, sino el comienzo de una revolución inteligente. Hoy, desvelaremos los misterios de GPT-4o mini y veremos cómo hace que la inteligencia sea más "accesible".

QQ截图20240719092011.jpg

Más inteligente, más económico

La visión de OpenAI es hacer que la inteligencia esté en todas partes, y GPT-4o mini es la última práctica de esta visión. Este modelo no solo reduce drásticamente los costos, sino que también ofrece un rendimiento excelente. Su precio es de solo 15 centavos de dólar por millón de tokens de entrada y 60 centavos de dólar por millón de tokens de salida, un orden de magnitud más barato que los modelos de vanguardia anteriores, y más del 60% más barato que GPT-3.5 Turbo.

image.png

El bajo costo y la baja latencia de GPT-4o mini le permiten realizar una amplia gama de tareas, como llamar a varios modelos en serie o en paralelo (por ejemplo, llamar a varias API), pasar una gran cantidad de contexto al modelo (por ejemplo, toda una base de código o el historial de una conversación), o interactuar con los clientes a través de respuestas de texto en tiempo real (por ejemplo, un chatbot de atención al cliente).

Actualmente, GPT-4o mini admite API de texto e imágenes, y en el futuro también admitirá la entrada y salida de texto, imágenes, video y audio. El modelo tiene una ventana de contexto de 128K tokens, admite hasta 16K tokens de salida por solicitud y su fecha límite de conocimiento es octubre de 2023. Gracias al tokenizador mejorado compartido con GPT-4o, el procesamiento de texto que no sea en inglés ahora es más económico y eficiente.

image.png

Pequeño tamaño, gran inteligencia

GPT-4o mini supera a GPT-3.5 Turbo y a otros modelos pequeños en las pruebas de referencia académicas, tanto en inteligencia textual como en razonamiento multimodal. También admite el mismo rango de idiomas que GPT-4o y tiene un excelente rendimiento en las llamadas a funciones, lo que permite a los desarrolladores crear aplicaciones capaces de obtener datos o realizar operaciones con sistemas externos, y mejora el rendimiento del contexto largo en comparación con GPT-3.5 Turbo.

En las pruebas de referencia clave, GPT-4o mini obtuvo los siguientes resultados:

  • Tareas de razonamiento: En las tareas de razonamiento que involucran texto e imágenes, GPT-4o mini obtuvo una puntuación del 82,0%, mientras que Gemini Flash obtuvo un 77,9% y Claude Haiku un 73,8%.

  • Habilidades matemáticas y de codificación: En las tareas de razonamiento matemático y codificación, GPT-4o mini también obtuvo excelentes resultados. En la prueba MGSM (razonamiento matemático), obtuvo una puntuación del 87,0%, mientras que Gemini Flash obtuvo un 75,5% y Claude Haiku un 71,7%. En la prueba HumanEval (rendimiento de codificación), obtuvo una puntuación del 87,2%, mientras que Gemini Flash obtuvo un 71,5% y Claude Haiku un 75,9%.

  • Razonamiento multimodal: En MMMU (evaluación de razonamiento multimodal), GPT-4o mini obtuvo una puntuación del 59,4%, mientras que Gemini Flash obtuvo un 56,1% y Claude Haiku un 50,2%.

Medidas de seguridad integradas

La seguridad siempre ha sido fundamental en el desarrollo de los modelos de OpenAI. Durante la fase de preentrenamiento, OpenAI filtró la información que no quería que el modelo aprendiera o produjera, como discursos de odio, contenido para adultos, sitios web que recopilan principalmente información personal y correo basura. Después del entrenamiento, OpenAI utiliza técnicas como el aprendizaje por refuerzo con retroalimentación humana (RLHF) para que el comportamiento del modelo se ajuste a las políticas de OpenAI, mejorando la precisión y fiabilidad de las respuestas del modelo.

GPT-4o mini incorpora las mismas medidas de seguridad que GPT-4o. OpenAI, de acuerdo con su marco de preparación y compromisos voluntarios, realizó una cuidadosa evaluación mediante evaluaciones automatizadas y humanas. Más de 70 expertos externos en áreas como psicología social y desinformación probaron GPT-4o para identificar posibles riesgos. Actualmente, OpenAI ha solucionado estos problemas y planea compartir detalles en las próximas tarjetas de puntuación del sistema y de preparación de GPT-4o. Las conclusiones de estas evaluaciones de expertos ayudaron a mejorar la seguridad de GPT-4o y GPT-4o mini.

Disponibilidad y precios

GPT-4o mini está disponible ahora como modelo de texto e imagen en las API de asistente, API de finalización de chat y API por lotes. Los desarrolladores pagan 15 centavos de dólar por 1 millón de tokens de entrada y 60 centavos de dólar por 1 millón de tokens de salida (aproximadamente equivalente a 2500 páginas de un libro estándar). Planeamos lanzar la función de ajuste fino para GPT-4o mini en los próximos días.

En ChatGPT, los usuarios gratuitos, Plus y de equipos podrán acceder a GPT-4o mini a partir de hoy, reemplazando a GPT-3.5. Los usuarios empresariales también tendrán acceso a partir de la semana que viene, lo que se alinea con la misión de OpenAI de que todos puedan disfrutar de los beneficios de la IA.

Perspectivas de futuro

El equipo de OpenAI afirma: "En los últimos años, hemos sido testigos de un progreso notable en la inteligencia artificial, al mismo tiempo que los costos se han reducido drásticamente. Por ejemplo, desde el lanzamiento del modelo text-davinci-003, con funciones más limitadas, en 2022, el costo por token de GPT-4o mini ha disminuido en un 99%. Nos comprometemos a seguir reduciendo los costos y, al mismo tiempo, a mejorar las capacidades del modelo."

"Nuestra visión del futuro es que los modelos se integren a la perfección en cada aplicación y cada sitio web. GPT-4o mini allana el camino para que los desarrolladores creen y amplíen aplicaciones de IA potentes de forma más eficiente y económica. El futuro de la IA se está volviendo más accesible, fiable e integrado en nuestras experiencias digitales cotidianas, y estamos encantados de seguir liderando esta tendencia."