Mercury: Primer modelo de lenguaje de difusión LLM comercial, rápido y desplegable en móviles

AIbase基地

Publicado elNoticias de IA · 6 minutos de lectura · Feb 28, 2025

En el campo de la inteligencia artificial, una tecnología revolucionaria está surgiendo silenciosamente. Recientemente, Inception Labs anunció el lanzamiento de los modelos de lenguaje grandes de difusión (dLLMs) de la serie Mercury, una nueva generación de modelos de lenguaje diseñados para generar texto de alta calidad de forma rápida y eficiente. En comparación con los modelos de lenguaje grandes autorregresivos tradicionales, Mercury aumenta la velocidad de generación hasta 10 veces, alcanzando velocidades superiores a 1000 tokens por segundo en una tarjeta gráfica NVIDIA H100, una velocidad que antes solo se podía lograr con chips personalizados.

El primer producto de la serie Mercury, Mercury Coder, ya se ha presentado en una prueba pública. Este modelo se centra en la generación de código y muestra un rendimiento excepcional, superando a muchos modelos de optimización de velocidad existentes en varias pruebas de referencia de programación, como GPT-4o Mini y Claude3.5Haiku, además de ser casi 10 veces más rápido. Según los comentarios de los desarrolladores, el resultado de la finalización del código de Mercury es más popular; en las pruebas de C o p i l o t Arena, Mercury Coder Mini se encuentra entre los mejores en rendimiento y es uno de los modelos más rápidos.

La mayoría de los modelos de lenguaje actuales utilizan un método autorregresivo, es decir, generan tokens uno por uno de izquierda a derecha, lo que hace que el proceso de generación sea inevitablemente secuencial, con un alto costo de latencia y computación. Mercury, por otro lado, utiliza un método de generación "de grueso a fino", comenzando con ruido puro y pasando por varias etapas de "desruidificación" para refinar gradualmente la salida. Esto permite que el modelo Mercury realice el procesamiento paralelo de múltiples tokens durante la generación, lo que resulta en una mejor capacidad de razonamiento y respuestas más estructuradas.

Con el lanzamiento de la serie Mercury, Inception Labs ha demostrado el enorme potencial de los modelos de difusión en el campo de la generación de texto y código. A continuación, la empresa planea lanzar modelos de lenguaje para aplicaciones de chat, ampliando aún más las aplicaciones de los modelos de lenguaje de difusión. Estos nuevos modelos tendrán una capacidad de agente inteligente más potente, capaces de realizar planificaciones complejas y generaciones a largo plazo. Además, su alta eficiencia permite que funcionen bien incluso en dispositivos con recursos limitados, como teléfonos inteligentes y portátiles.

En general, el lanzamiento de Mercury marca un importante avance en la tecnología de inteligencia artificial, no solo mejorando significativamente la velocidad y la eficiencia, sino también ofreciendo soluciones de mayor calidad a la industria.

Presentación oficial: https://www.inceptionlabs.ai/news

Prueba en línea: https://chat.inceptionlabs.ai/

Puntos clave:
🌟 Se lanzan los modelos de lenguaje grandes de difusión (dLLMs) de la serie Mercury, con una velocidad de generación de hasta 1000 tokens por segundo.
🚀 Mercury Coder se centra en la generación de código y ofrece un rendimiento excepcional en las pruebas de referencia, superando a numerosos modelos existentes.
💡 La innovadora metodología de los modelos de difusión permite una generación de texto más eficiente y precisa, ofreciendo nuevas posibilidades para las aplicaciones de agentes inteligentes.

Baidu presenta de forma abierta el modelo de lenguaje WENXIN Grand Model 4.5, causando un gran impacto en el mercado de modelos grandes en China

Recientemente, Baidu anunció oficialmente la apertura de su serie de modelos WENXIN Grand Model 4.5, lanzando un total de diez modelos, incluyendo modelos de expertos mixtos (MoE) con parámetros de activación de 47B y 3B, así como modelos densos con parámetros de 0.3B. Esta apertura no solo incluye la publicación completa de los pesos de preentrenamiento, sino que también proporciona código de razonamiento, marcando un importante avance en el campo de los modelos grandes de Baidu. Estos nuevos modelos pueden descargarse y implementarse en plataformas como el foro PaddlePaddle Star River y Hugging Face, y además, la plataforma de modelos grandes Qianfan de Baidu Cloud también ofrece

Baidu presenta de forma destacada la serie de modelos WENXIN Grand Model 4.5, diez nuevos modelos se presentan!

Baidu ha lanzado oficialmente la serie de modelos WENXIN Grand Model 4.5 y los ha hecho completamente de código abierto. Los usuarios pueden experimentar inmediatamente esta tecnología más reciente mediante WENXIN YAN (https://yiyan.baidu.com). Esta serie de modelos incluye varias configuraciones de parámetros, como modelos de expertos mixtos (MoE) con parámetros activos de 47B y 3B, así como diseños de modelos densos con 0.3B parámetros, en total alcanzando diez modelos diferentes. En cuanto al entrenamiento y la inferencia, los modelos de la serie WENXIN 4.5 utilizan PaddlePaddle.

Los grandes modelos de la serie WENXIN de Baidu se han lanzado de código abierto en la plataforma PaddlePaddle, cubriendo varios modelos recientes

Recientemente, los grandes modelos de la serie WENXIN de Baidu se han lanzado de código abierto en la plataforma PaddlePaddle, incluyendo decenas de modelos recientes como ERNIE-4.5-VL-424B-A47B-Paddle y ERNIE-4.5-300B-A47B-Paddle. Aunque Baidu no ha anunciado activamente esta acción de código abierto, la información de actualización de la plataforma PaddlePaddle muestra que estas acciones se concentraron entre el 29 y el 30 de junio, siendo su última medida. Un informante interno confirmó: el sitio oficial...

Sorprendentes similitudes entre la optimización de búsquedas de modelos de lenguaje grandes y las estrategias tradicionales de SEO

Recientemente, el laboratorio de innovación de ERGO y ECODYNAMICS realizaron un estudio conjunto que analizó la forma en que se muestra el contenido relacionado con seguros en búsquedas impulsadas por inteligencia artificial. Este estudio cubrió más de 33.000 resultados de búsquedas de IA y 600 sitios web, explorando las preferencias de los modelos de lenguaje grandes (LLM), como ChatGPT, al procesar este tipo de contenido. El estudio descubrió que los LLM tienden a mostrar contenido fácil de leer, bien estructurado y de confianza, características que están estrechamente relacionadas con las estrategias tradicionales de SEO.

Los resultados del examen de ingreso a la universidad de Doubao AI alcanzaron la línea de admisión de Tsinghua y Pekín ¡683 puntos en ciencias sociales liderando a los modelos avanzados del mundo!

El equipo Seed de ByteDance reveló recientemente los asombrosos resultados de las pruebas generales del examen de ingreso a la universidad de 2025: el modelo Seed1.6-Thinking de Doubao obtuvo 683 puntos en ciencias sociales y 648 puntos en ciencias naturales en el examen de ingreso, alcanzando la línea de admisión de Tsinghua y Pekín, destacando significativamente en las pruebas de modelos de inteligencia artificial en el examen de ingreso a la universidad tanto en China como en el extranjero. Esta prueba utilizó los exámenes de la nueva versión nacional y las preguntas autónomas de Shandong. Doubao compitió con cinco modelos de inteligencia artificial de alto nivel, como Gemini 2.5 Pro de Google, DeepSeek R1 y OpenAI o3.

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

Mercury: Primer modelo de lenguaje de difusión LLM comercial, rápido y desplegable en móviles

AIbase基地

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

Revolución de los grandes modelos ¡Cómo Gemini 2.5 Pro está revolucionando la forma en que procesamos la información

Oracle se ve afectada por la nube y los grandes modelos, su precio sube a un nuevo máximo histórico

Baidu presenta de forma abierta el modelo de lenguaje WENXIN Grand Model 4.5, causando un gran impacto en el mercado de modelos grandes en China

Baidu presenta de forma destacada la serie de modelos WENXIN Grand Model 4.5, diez nuevos modelos se presentan!

Los grandes modelos de la serie WENXIN de Baidu se han lanzado de código abierto en la plataforma PaddlePaddle, cubriendo varios modelos recientes

Optimización de memoria VR! NVIDIA DLSS 4 hace que los juegos sean más fluidos, la memoria VR del modelo Transformer se reduce en un 20%

​Sorprendentes similitudes entre la optimización de búsquedas de modelos de lenguaje grandes y las estrategias tradicionales de SEO

Giant Network lanza una competición de finales AI-native para 'Among Us': tres grandes modelos nacionales entran en juego, creando un entretenimiento inteligente multifacético

¡Zuckerberg se encarga personalmente! Meta contrata a los tres expertos principales en IA de OpenAI con grandes sumas de dinero

Los resultados del examen de ingreso a la universidad de Doubao AI alcanzaron la línea de admisión de Tsinghua y Pekín ¡683 puntos en ciencias sociales liderando a los modelos avanzados del mundo!

Sorprendentes similitudes entre la optimización de búsquedas de modelos de lenguaje grandes y las estrategias tradicionales de SEO