La velocidad de generación de modelos grandes se convierte en un cuello de botella: el equipo de ex empleados de Google desarrolla el nuevo chip LPU

新硅

Publicado elNoticias de IA · 2 minutos de lectura · Feb 21, 2024

178

Groq es una empresa emergente de chips de IA fundada por antiguos empleados de Google. La compañía ha lanzado un chip de aceleración de IA llamado LPU, que utiliza innovaciones tecnológicas para acelerar significativamente la inferencia y la generación de modelos grandes, hasta 10 veces más rápido que las GPU. Esto se debe principalmente al uso de tecnología de almacenamiento SRAM de alta velocidad y a un diseño de arquitectura que reduce el acceso a la memoria. Los usuarios pueden ejecutar varios modelos grandes en LPU, como Llama y Mixtral. El lanzamiento de LPU ayudará a optimizar aún más el rendimiento de los modelos grandes o a mejorar la velocidad de respuesta de aplicaciones como asistentes de voz y escritura de IA.

Modelos grandes Chip Velocidad de generación

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

«Boletín de IA del 30 de junio»: Baidu libera al público la serie WENXIN Grand Model 4.5; Modelo de generación multimodal Qwen VLo de Tongyi Qianwen

¡Bienvenido a la sección Boletín de IA de AIbase! Tres minutos al día para conocer las principales noticias de IA de hoy, ayudándote a comprender las tendencias del sector de la IA y las aplicaciones de nuevos productos de IA. Más noticias de IA en: https://www.aibase.com/zh1. Baidu presenta con fuerza la serie WENXIN Grand Model 4.5, presentando diez nuevos modelos. Baidu presenta oficialmente la serie WENXIN Grand Model 4.5 y la libera completamente al público, incluyendo diez nuevos modelos con diversos ajustes de parámetros, entrenados y utilizados con el marco PaddlePaddle, con una tasa de uso de FLOPs del 47%, y tiene buenos resultados en tareas de texto múltiple

Jun 30, 2025

Meta contrata a OpenAI con 3.2 mil millones de dólares ¡La guerra por los talentos en IA explota! ¿El escenario del sector va a cambiar?

Jun 30, 2025

La primera supercomputadora de millones de millones de operaciones en Europa, JUPITER, entra en funcionamiento

Jun 30, 2025

Artículo de prueba

Jun 30, 2025

Artículo de prueba

Jun 30, 2025

Artículo de prueba

El proyecto interno de Xiaom "Bolsa de herramientas de IA" anunció recientemente el final de la fase de prueba interna y planea suspender el servicio a partir del 5 de julio de 2025. "Bolsa de herramientas de IA" es un importante proyecto de IA desarrollado internamente por Xiaomi, cuyo objetivo es explorar e integrar tecnologías de vanguardia en IA, ofreciendo una serie de funciones innovadoras y experiencias a los usuarios. Aunque las funciones y escenarios de aplicación específicos de la prueba interna no se han revelado completamente, su nombre indica que está posicionado como un conjunto de herramientas de IA multifuncionales. Durante la fase de prueba interna, "Bolsa de herramientas de IA" reunió a algunos empleados de Xiaom

Jun 30, 2025

Artículo de prueba

El proyecto de prueba interna de Xiaomi 'Caja de herramientas de IA' anunció recientemente el final fase de prueba y planea suspender sus servicios a partir del 5 de julio de 2025. 'Caja de herramientas de IA' es un proyecto importante de IA desarrollado internamente por Xiaomi, con el objetivo de explorar e integrar tecnologías punteras de IA para ofrecer a los usuarios una serie de funciones e experiencias innovadoras. Aunque los funcionamientos y escenarios específicos de la prueba no se han revelado completamente, su nombre sugiere que está orientado como un conjunto de herramientas de IA multifuncionales. En el período de prueba anterior, 'Caja de herramientas de IA' reunió a algunos empleados de Xiaomi

Jun 30, 2025

La función de la biblioteca de conocimientos de Zhihu se actualiza para integrar profundamente el contenido de la comunidad y crear una experiencia de preguntas y respuestas de IA inmersiva

Jun 30, 2025

Nuevo sistema de inteligencia artificial abierto OmniGen 2: integra generación de imágenes y texto como GPT-4o

Jun 30, 2025

Baidu presenta de forma abierta el modelo de lenguaje WENXIN Grand Model 4.5, causando un gran impacto en el mercado de modelos grandes en China

Recientemente, Baidu anunció oficialmente la apertura de su serie de modelos WENXIN Grand Model 4.5, lanzando un total de diez modelos, incluyendo modelos de expertos mixtos (MoE) con parámetros de activación de 47B y 3B, así como modelos densos con parámetros de 0.3B. Esta apertura no solo incluye la publicación completa de los pesos de preentrenamiento, sino que también proporciona código de razonamiento, marcando un importante avance en el campo de los modelos grandes de Baidu. Estos nuevos modelos pueden descargarse y implementarse en plataformas como el foro PaddlePaddle Star River y Hugging Face, y además, la plataforma de modelos grandes Qianfan de Baidu Cloud también ofrece

Jun 30, 2025

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

La velocidad de generación de modelos grandes se convierte en un cuello de botella: el equipo de ex empleados de Google desarrolla el nuevo chip LPU

新硅

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

«Boletín de IA del 30 de junio»: Baidu libera al público la serie WENXIN Grand Model 4.5; Modelo de generación multimodal Qwen VLo de Tongyi Qianwen

Meta contrata a OpenAI con 3.2 mil millones de dólares ¡La guerra por los talentos en IA explota! ¿El escenario del sector va a cambiar?

La primera supercomputadora de millones de millones de operaciones en Europa, JUPITER, entra en funcionamiento

Artículo de prueba

Artículo de prueba

Artículo de prueba

Artículo de prueba

La función de la biblioteca de conocimientos de Zhihu se actualiza para integrar profundamente el contenido de la comunidad y crear una experiencia de preguntas y respuestas de IA inmersiva

Nuevo sistema de inteligencia artificial abierto OmniGen 2: integra generación de imágenes y texto como GPT-4o

Baidu presenta de forma abierta el modelo de lenguaje WENXIN Grand Model 4.5, causando un gran impacto en el mercado de modelos grandes en China