OpenAI lanza GPT-4o mini: ¡API con un 60% de descuento! El 'modelo económico' en el campo de la inteligencia

AIbase基地

Publicado elNoticias de IA · 10 minutos de lectura · Jul 19, 2024

297

¡OpenAI vuelve a sorprender! Su último lanzamiento, GPT-4o mini, se presenta como el modelo pequeño más "económico y práctico". Esto no es solo una actualización de modelo, sino el comienzo de una revolución inteligente. Hoy, desvelaremos los misterios de GPT-4o mini y veremos cómo hace que la inteligencia sea más "accesible".

QQ截图20240719092011.jpg

Más inteligente, más económico

La visión de OpenAI es hacer que la inteligencia esté en todas partes, y GPT-4o mini es la última práctica de esta visión. Este modelo no solo reduce drásticamente los costos, sino que también ofrece un rendimiento excelente. Su precio es de solo 15 centavos de dólar por millón de tokens de entrada y 60 centavos de dólar por millón de tokens de salida, un orden de magnitud más barato que los modelos de vanguardia anteriores, y más del 60% más barato que GPT-3.5 Turbo.

El bajo costo y la baja latencia de GPT-4o mini le permiten realizar una amplia gama de tareas, como llamar a varios modelos en serie o en paralelo (por ejemplo, llamar a varias API), pasar una gran cantidad de contexto al modelo (por ejemplo, toda una base de código o el historial de una conversación), o interactuar con los clientes a través de respuestas de texto en tiempo real (por ejemplo, un chatbot de atención al cliente).

Actualmente, GPT-4o mini admite API de texto e imágenes, y en el futuro también admitirá la entrada y salida de texto, imágenes, video y audio. El modelo tiene una ventana de contexto de 128K tokens, admite hasta 16K tokens de salida por solicitud y su fecha límite de conocimiento es octubre de 2023. Gracias al tokenizador mejorado compartido con GPT-4o, el procesamiento de texto que no sea en inglés ahora es más económico y eficiente.

Pequeño tamaño, gran inteligencia

GPT-4o mini supera a GPT-3.5 Turbo y a otros modelos pequeños en las pruebas de referencia académicas, tanto en inteligencia textual como en razonamiento multimodal. También admite el mismo rango de idiomas que GPT-4o y tiene un excelente rendimiento en las llamadas a funciones, lo que permite a los desarrolladores crear aplicaciones capaces de obtener datos o realizar operaciones con sistemas externos, y mejora el rendimiento del contexto largo en comparación con GPT-3.5 Turbo.

En las pruebas de referencia clave, GPT-4o mini obtuvo los siguientes resultados:

Tareas de razonamiento: En las tareas de razonamiento que involucran texto e imágenes, GPT-4o mini obtuvo una puntuación del 82,0%, mientras que Gemini Flash obtuvo un 77,9% y Claude Haiku un 73,8%.
Habilidades matemáticas y de codificación: En las tareas de razonamiento matemático y codificación, GPT-4o mini también obtuvo excelentes resultados. En la prueba MGSM (razonamiento matemático), obtuvo una puntuación del 87,0%, mientras que Gemini Flash obtuvo un 75,5% y Claude Haiku un 71,7%. En la prueba HumanEval (rendimiento de codificación), obtuvo una puntuación del 87,2%, mientras que Gemini Flash obtuvo un 71,5% y Claude Haiku un 75,9%.
Razonamiento multimodal: En MMMU (evaluación de razonamiento multimodal), GPT-4o mini obtuvo una puntuación del 59,4%, mientras que Gemini Flash obtuvo un 56,1% y Claude Haiku un 50,2%.

Medidas de seguridad integradas

La seguridad siempre ha sido fundamental en el desarrollo de los modelos de OpenAI. Durante la fase de preentrenamiento, OpenAI filtró la información que no quería que el modelo aprendiera o produjera, como discursos de odio, contenido para adultos, sitios web que recopilan principalmente información personal y correo basura. Después del entrenamiento, OpenAI utiliza técnicas como el aprendizaje por refuerzo con retroalimentación humana (RLHF) para que el comportamiento del modelo se ajuste a las políticas de OpenAI, mejorando la precisión y fiabilidad de las respuestas del modelo.

GPT-4o mini incorpora las mismas medidas de seguridad que GPT-4o. OpenAI, de acuerdo con su marco de preparación y compromisos voluntarios, realizó una cuidadosa evaluación mediante evaluaciones automatizadas y humanas. Más de 70 expertos externos en áreas como psicología social y desinformación probaron GPT-4o para identificar posibles riesgos. Actualmente, OpenAI ha solucionado estos problemas y planea compartir detalles en las próximas tarjetas de puntuación del sistema y de preparación de GPT-4o. Las conclusiones de estas evaluaciones de expertos ayudaron a mejorar la seguridad de GPT-4o y GPT-4o mini.

Disponibilidad y precios

GPT-4o mini está disponible ahora como modelo de texto e imagen en las API de asistente, API de finalización de chat y API por lotes. Los desarrolladores pagan 15 centavos de dólar por 1 millón de tokens de entrada y 60 centavos de dólar por 1 millón de tokens de salida (aproximadamente equivalente a 2500 páginas de un libro estándar). Planeamos lanzar la función de ajuste fino para GPT-4o mini en los próximos días.

En ChatGPT, los usuarios gratuitos, Plus y de equipos podrán acceder a GPT-4o mini a partir de hoy, reemplazando a GPT-3.5. Los usuarios empresariales también tendrán acceso a partir de la semana que viene, lo que se alinea con la misión de OpenAI de que todos puedan disfrutar de los beneficios de la IA.

Perspectivas de futuro

El equipo de OpenAI afirma: "En los últimos años, hemos sido testigos de un progreso notable en la inteligencia artificial, al mismo tiempo que los costos se han reducido drásticamente. Por ejemplo, desde el lanzamiento del modelo text-davinci-003, con funciones más limitadas, en 2022, el costo por token de GPT-4o mini ha disminuido en un 99%. Nos comprometemos a seguir reduciendo los costos y, al mismo tiempo, a mejorar las capacidades del modelo."

"Nuestra visión del futuro es que los modelos se integren a la perfección en cada aplicación y cada sitio web. GPT-4o mini allana el camino para que los desarrolladores creen y amplíen aplicaciones de IA potentes de forma más eficiente y económica. El futuro de la IA se está volviendo más accesible, fiable e integrado en nuestras experiencias digitales cotidianas, y estamos encantados de seguir liderando esta tendencia."

Diario de IA: La versión actualizada de Yuanbao de Tencent permite buscar imágenes y videos con una sola frase; WeChat Pay MCP se lanza; Google presenta Veo 3 en todo el mundo

¡Bienvenido al programa 【Diario de IA】! Aquí está su guía para explorar el mundo de la inteligencia artificial cada día. Cada día, le presentamos los temas más destacados en el campo de la IA, enfocándonos en desarrolladores para ayudarle a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA. Productos de IA recientes, haga clic para obtener más información: https://top.aibase.com/1. Yuanbao de Tencent mejora nuevamente: Una sola frase para buscar, imágenes y videos aparecerán inmediatamente, permitiendo un acceso más intuitivo a la información. La función actualizada de Yuanbao de Tencent hace que el acceso a la información sea más intuitivo y eficiente. Solo necesita hacer una pregunta con una frase para obtener información textual y visual.

Google presenta globalmente su nuevo modelo de generación de videos Veo 3

Google anunció oficialmente la puesta en marcha a nivel mundial de su último modelo de generación de videos Veo3. Esta noticia ha generado mucha expectativa entre los usuarios, y ahora Veo3 está disponible para los usuarios de Gemini en más de 159 países, ofreciendo una experiencia completamente nueva para crear videos. Las características del modelo de generación de videos Veo3 permiten a los usuarios generar videos de hasta ocho segundos a partir de simples instrucciones de texto. Según la descripción de Google, esta tecnología está diseñada especialmente para usuarios creativos, especialmente para los usuarios de redes sociales que cada vez demandan más contenido en forma de videos cortos.

Advertencia de Hitachi Energy: las fluctuaciones en la demanda eléctrica de los centros de inteligencia artificial podrían amenazar la estabilidad del suministro eléctrico mundial

Recientemente, el consejero delegado de Hitachi Energy, empresa fabricante líder de transformadores del mundo, Andreas Schierenbeck, señaló durante una entrevista con Financial Times que el aumento repentino de la demanda eléctrica por parte de grandes empresas tecnológicas al entrenar modelos de inteligencia artificial requiere que los gobiernos tomen medidas para limitar estas fluctuaciones y garantizar la estabilidad del suministro eléctrico. Nota: La imagen proviene de una fuente de licencia de Midjourney. Schierenbeck indicó que las fluctuaciones en la demanda eléctrica de los centros de datos de inteligencia artificial son extremadamente intensas,

Meta presenta un asistente de chat activo que hace que la IA vaya un paso adelante en la conversación

Recientemente, Meta está probando un nuevo tipo de asistente de chat que enviará mensajes activamente a los usuarios, en lugar de solo responder cuando el usuario inicia la conversación. Imagina que estás charlando con un amigo en Facebook Messenger o WhatsApp, y de repente, un asistente de chat de IA llamado "El maestro del magia cinematográfica" te envía un mensaje: ¡Espero que tengas un buen día! Me pregunto si has tenido alguna noticia recientemente.

Tencent Yuanbao se actualiza: una sola frase de búsqueda, imágenes y videos se presentan inmediatamente, la obtención de información es más intuitiva

El asistente inteligente Yuanbao anunció hoy una importante actualización en su función de búsqueda principal, lanzando una nueva característica llamada "con una sola frase puedes buscar más". Ahora, los usuarios solo necesitan hacer una pregunta sencilla y Yuanbao podrá coincidir inteligentemente y mostrar contenido de imágenes y canales de videos, haciendo que la obtención de información sea más rica e intuitiva que nunca. En el pasado, Yuanbao ya podía manejar fácilmente consultas sobre el clima, cotizaciones de acciones, búsquedas de ubicaciones y otras necesidades cotidianas. Esta actualización llevará la capacidad de búsqueda inteligente de Yuanbao a un nuevo nivel. Ya sea que desees aprender una nueva habilidad o resolver pequeños problemas de la vida diaria, Yuanbao podrá integrar texto

Cluely duplica sus ingresos anuales en una semana, alcanzando los 7 millones de dólares

La startup emergente Cluely, en pleno auge en Silicon Valley, anunció recientemente que sus ingresos anuales recurrentes (ARR) subieron rápidamente a unos 7 millones de dólares después del lanzamiento de su nuevo producto empresarial. Esta velocidad de crecimiento ha generado entusiasmo en el fundador Roy Lee, quien le dijo a TechCrunch: "Cada persona que tiene una reunión o entrevista está probando este producto." Cluely se dedica a utilizar la inteligencia artificial para analizar conversaciones en línea, proporcionando en tiempo real transcripciones de reuniones, información de fondo y sugerencias de preguntas, toda la información aparece silenciosamente en la pantalla del usuario.

JD Logistics presenta su camioneta ligera autónoma propia, JD Logistics VAN, con nivel de automatización L4 en carreteras públicas

En la reciente XVII Exposición Internacional de Tecnología y Equipo de Transporte, JD Logistics presentó por primera vez su producto de camioneta ligera autónoma desarrollado internamente: JD Logistics VAN. Esta camioneta ligera autónoma tiene un espacio de carga de 24 metros cúbicos, lo que la convierte en la camioneta ligera autónoma con mayor capacidad de carga en la industria logística actual, y podría reemplazar a los tradicionales camiones de 4.2 metros en环节 como el transporte de mercancías y el traslado entre estaciones. Según la información proporcionada, JD Logistics VAN tiene una autonomía de hasta 400 kilómetros cuando está completamente cargada y cuenta con la capacidad de automatización de nivel L4 en carreteras públicas. Esto significa que puede funcionar de manera autónoma.

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

OpenAI lanza GPT-4o mini: ¡API con un 60% de descuento! El 'modelo económico' en el campo de la inteligencia

AIbase基地

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas