OpenAI rompió con la tradición de código cerrado desde 2020 y presentó oficialmente dos nuevos modelos de lenguaje de código abierto, GPT-oss-120b y GPT-oss-20b. Este movimiento marca un importante giro en la estrategia comercial de esta empresa de IA y es la primera vez que la empresa regresa a la vía del código abierto desde la publicación de GPT-2.
Los dos nuevos modelos ya están disponibles en la plataforma de desarrolladores Hugging Face, donde pueden descargarse gratuitamente por los desarrolladores de todo el mundo. OpenAI afirma que estos modelos alcanzan un nivel "avanzado" en varias pruebas de referencia comparativas con otros modelos de código abierto.
Desde el punto de vista técnico, GPT-oss-120b muestra una sólida capacidad de rendimiento. En pruebas de capacidades fundamentales de razonamiento, casi iguala a los productos pagos de OpenAI, como o4-mini, y requiere hardware relativamente suave, solo necesitando una GPU de 80 GB para funcionar eficientemente. Esta configuración hace que sea altamente factible para aplicaciones empresariales.
GPT-oss-20b está diseñado específicamente para entornos con recursos limitados, alcanzando un nivel similar al de o3-mini en pruebas comunes. Más aún, este modelo puede funcionar de manera estable en dispositivos periféricos con solo 16 GB de memoria, ofreciendo una solución ideal para aplicaciones móviles, razonamiento local y desarrollo rápido de prototipos, reduciendo significativamente las barreras para implementar aplicaciones de IA.
En cuanto al diseño arquitectónico, OpenAI ha diseñado un mecanismo de colaboración en la nube para estos dos modelos de código abierto. Cuando los modelos de código abierto se enfrentan a tareas complejas que exceden su capacidad de procesamiento, como el procesamiento de imágenes, los desarrolladores pueden enviar las solicitudes a los modelos más poderosos de código cerrado de OpenAI, formando así un modo de trabajo colaborativo entre el local y la nube.
En cuanto a la licencia, OpenAI eligió la licencia de código abierto más permisiva del sector, la Apache 2.0. Esto significa que las empresas pueden usar libremente estos modelos con fines comerciales sin tener que pagar ninguna tarifa ni solicitar ningún permiso especial a OpenAI. Sin embargo, a diferencia de laboratorios de IA completamente transparentes como AI2, OpenAI no ha revelado públicamente el conjunto de datos de entrenamiento de los modelos.
El contexto detrás de esta iniciativa de código abierto es muy interesante. En los últimos años, OpenAI construyó su imperio comercial principalmente mediante una ruta tecnológica privativa, vendiendo acceso a capacidades de IA a empresas y desarrolladores a través de APIs, lo que generó una fuente considerable de ingresos. Sin embargo, en enero de este año, el CEO de OpenAI, Sam Altman, reconoció públicamente que la empresa estaba "del lado equivocado de la historia" en cuanto a la apertura de código.
Altman reiteró en un comunicado a TechCrunch la misión original de la empresa: "Desde su fundación en 2015, el objetivo de OpenAI ha sido garantizar el desarrollo de inteligencia artificial general que beneficie a toda la humanidad. Para ello, estamos contentos de ver que el mundo está construyendo una plataforma de IA de código abierto basada en los valores democráticos estadounidenses, que está disponible gratuitamente para todos y trae beneficios amplios."
Este giro estratégico no solo refleja una nueva valoración por parte de OpenAI sobre el valor de la comunidad de código abierto, sino también el cambio en el escenario competitivo actual de la industria de IA. A medida que la calidad de los modelos de IA de código abierto mejora constantemente y la ecosistema comunitario se vuelve cada vez más maduro, los modelos de código cerrado tradicionales enfrentan nuevos desafíos y oportunidades.





