AI2 lanza el modelo de lenguaje abierto OLMo, con un rendimiento comparable a Llama2 en varios aspectos

站长之家

Publicado elNoticias de IA · 2 minutos de lectura · Feb 2, 2024

AI2 ha lanzado el marco de modelos de lenguaje abierto OLMo, con el objetivo de impulsar la investigación y la experimentación con modelos de lenguaje a gran escala. Este marco proporciona código de entrenamiento, modelos y código de evaluación en Hugging Face y GitHub, permitiendo a la comunidad académica y a los investigadores colaborar en la ciencia de los modelos de lenguaje. Se pueden explorar temas como el impacto de nuevos subconjuntos de datos de preentrenamiento en el rendimiento posterior, así como nuevas técnicas de preentrenamiento y su estabilidad.

modelo de lenguaje marco abierto HuggingFace

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

Musk responde a la disolución del equipo Dojo de Tesla: desarrollar dos chips de IA al mismo tiempo no tiene sentido

El fundador de Tesla, Elon Musk, respondió públicamente recientemente en una plataforma de redes sociales a los rumores sobre la disolución del equipo del supercomputador Dojo, afirmando claramente que la empresa dejará de perseguir la estrategia de desarrollar simultáneamente dos chips de arquitectura diferente para la inteligencia artificial. Indicó que distribuir recursos para avanzar con el Dojo y el desarrollo paralelo de la nueva generación de chips de inteligencia artificial es ineficiente, y Tesla se enfocará ahora en investigar chips de inteligencia artificial de próxima generación como AI5 y AI6.

Aug 8, 2025

Amazon lanza la plataforma de modelos de IA más grande del mundo, Amazon Bedrock

Amazon Web Services (AWS) lanzó la plataforma Marketplace de modelos Amazon Bedrock, rompiendo el modelo de competencia con los mejores modelos de la industria de IA y promoviendo una estrategia de elección sobre todo lo demás. Esta plataforma integra varios modelos de IA como OpenAI y Anthropic, permitiendo a las empresas combinar libremente diferentes modelos según sus necesidades, logrando un efecto de 1+1>2. AWS construye la plataforma más grande de modelos de IA mediante las plataformas Bedrock y SageMaker, impulsando el desarrollo de aplicaciones de IA generativa y ayudando a las empresas a elegir los modelos más adecuados en lugar de los más potentes.

Aug 8, 2025

¡Baidu lanza una gran noticia! ¡Nuevo modelo de razonamiento y el modelo de alto rendimiento Wenxin 5.0 están a la vista!

百度 lanzará un nuevo modelo de inferencia antes de agosto de 2025 para competir con DeepSeek. También presentará el modelo "Wenxin 5.0", continuando su excelente rendimiento. Wenxin 4.5 superó a GPT4.5 con un costo del 1%, y el modelo X1 iguala a DeepSeek-R1 a mitad de precio. Baidu refuerza su innovación en IA para consolidar su posición en el mercado.....

Aug 8, 2025

La herramienta de programación de IA Augment Code anuncia el soporte para GPT-5 y introduce la función de selector de modelos

La empresa Augment anunció el lanzamiento de su nuevo modelo de inteligencia artificial, GPT-5, y por primera vez introdujo la función de selector de modelos, que permite a los usuarios elegir entre Claude Sonnet4 y GPT-5. Esta innovación marca un importante avance en el campo de la inteligencia artificial para Augment, ofreciendo a los usuarios mayor flexibilidad y opciones. En las pruebas internas de las últimas semanas, Augment realizó pruebas comparativas exhaustivas de ambos modelos, incluyendo edición de archivos únicos, reestructuración de múltiples archivos, generación de pruebas y manejo de grandes bibliotecas de código.

Aug 8, 2025

Nueva función de Google, entrenador de cámaras, disponible. La IA te ayudará a tomar fotos perfectas, ¡pero también podría afectar el arte fotográfico!

Aug 8, 2025

Se revela una grave vulnerabilidad de seguridad en el asistente de Google Gemini: los correos electrónicos y las invitaciones a calendario diarios pueden ser utilizados para llevar a cabo ataques

Aug 8, 2025

Nuevo cambio en la búsqueda de IA: Perplexity brinda soporte técnico a Truth Social de Trump, los resultados de búsqueda generan controversia

Aug 8, 2025

Los ingresos de Duolingo superan las expectativas y su acción sube un 30%; la estrategia de IA genera controversia pero crea un milagro de ingresos de mil millones de dólares

Aug 8, 2025

Tesla disuelve el equipo del superordenador Dojo y abandona el desarrollo propio de chips para optar por una colaboración con NVIDIA

Aug 8, 2025

Ideogram lanza la función de personaje: con una configuración única, se puede mantener el estilo del personaje uniforme en todas las imágenes

Aug 8, 2025

Product Finder

Product Submit

AI Models Finder

MCP Servers

MCP Client

MCP Inspector

Case Tutorials

Latest AI News

AI Daily Brief

AI2 lanza el modelo de lenguaje abierto OLMo, con un rendimiento comparable a Llama2 en varios aspectos

站长之家

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

Musk responde a la disolución del equipo Dojo de Tesla: desarrollar dos chips de IA al mismo tiempo no tiene sentido

Amazon lanza la plataforma de modelos de IA más grande del mundo, Amazon Bedrock

¡Baidu lanza una gran noticia! ¡Nuevo modelo de razonamiento y el modelo de alto rendimiento Wenxin 5.0 están a la vista!

La herramienta de programación de IA Augment Code anuncia el soporte para GPT-5 y introduce la función de selector de modelos

Nueva función de Google, entrenador de cámaras, disponible. La IA te ayudará a tomar fotos perfectas, ¡pero también podría afectar el arte fotográfico!

Se revela una grave vulnerabilidad de seguridad en el asistente de Google Gemini: los correos electrónicos y las invitaciones a calendario diarios pueden ser utilizados para llevar a cabo ataques

Nuevo cambio en la búsqueda de IA: Perplexity brinda soporte técnico a Truth Social de Trump, los resultados de búsqueda generan controversia

Los ingresos de Duolingo superan las expectativas y su acción sube un 30%; la estrategia de IA genera controversia pero crea un milagro de ingresos de mil millones de dólares

Tesla disuelve el equipo del superordenador Dojo y abandona el desarrollo propio de chips para optar por una colaboración con NVIDIA

Ideogram lanza la función de personaje: con una configuración única, se puede mantener el estilo del personaje uniforme en todas las imágenes