Google lanza Titans: Avance en diseño biomimético con contexto de 2 millones de tokens

AIbase基地

Publicado elNoticias de IA · 3 minutos de lectura · Jan 21, 2025

163

El Instituto de Investigación de Google ha publicado recientemente la revolucionaria arquitectura de modelos "Titans", que mediante un diseño biomimético ha logrado una longitud de contexto innovadora de 2 millones de tokens, con planes de código abierto para la tecnología en el futuro.

La innovación central de esta arquitectura radica en la introducción de un módulo de memoria a largo plazo neuronal profunda, inspirado en el sistema de memoria humana. Titans combina ingeniosamente la capacidad de respuesta rápida de la memoria a corto plazo con la persistencia de la memoria a largo plazo, utilizando al mismo tiempo un mecanismo de atención para procesar el contexto inmediato, formando así un sistema de procesamiento de información eficiente.

Google (2)

Según Google, Titans muestra ventajas significativas en tareas de procesamiento de secuencias largas. Tanto en el modelado del lenguaje como en la predicción de series temporales, esta arquitectura ha logrado avances significativos. Más notable aún, en algunos escenarios de aplicación, Titans incluso supera a modelos como GPT-4, que tienen decenas de veces más parámetros.

Con el compromiso de Google de código abierto para la tecnología relacionada, la aparición de Titans podría aportar una nueva dirección al procesamiento de textos largos en el campo de la IA. Este diseño innovador, que integra principios de inteligencia biológica, demuestra la posibilidad de mejorar la eficiencia de procesamiento al tiempo que se reduce la cantidad de parámetros del modelo.

Titans Módulo de memoria a largo plazo neuronal profunda Mecanismo de atención GPT-4

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

Boletín diario de IA: OpenAI lanza tres nuevos modelos de voz; la búsqueda de Kuaishou integra completamente DeepSeek R1; Claude activa la función de búsqueda en línea

¡Bienvenido al apartado de "Boletín diario de IA"! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Cada día le presentamos los temas más relevantes del ámbito de la IA, enfocados en desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las aplicaciones innovadoras de productos de IA. Conozca los nuevos productos de IA aquí: https://top.aibase.com/1、OpenAI presenta el nuevo modelo de transcripción de voz gpt-4o-transcribe, con una precisión de voz a texto significativamente mejorada. OpenAI lanzó recientemente tres nuevos modelos de voz, a saber:

Mar 21, 2025

100

OpenAI lanza el nuevo modelo de transcripción de voz gpt-4o-transcribe: precisión mejorada en la conversión de voz a texto

Tras generar cierto interés en el campo de la IA de voz, OpenAI no ha dejado de explorar en este ámbito. El creador de ChatGPT vuelve a la carga con tres nuevos modelos de voz de desarrollo propio: gpt-4o-transcribe, gpt-4o-mini-transcribe y gpt-4o-mini-tts. El más destacado es gpt-4o-transcribe. Actualmente, estos nuevos modelos ya están...

Mar 21, 2025

150

OpenAI lanza GPT-4O-Audio-Preview: ¡El audio también puede "leer" las emociones!

OpenAI lidera una vez más la innovación en inteligencia artificial con el lanzamiento de su nuevo modelo gpt-4o-audio-preview. Este modelo no solo muestra una capacidad asombrosa en la generación y el análisis de voz, sino que también abre nuevas posibilidades para la interacción humano-máquina. Exploremos las características y las aplicaciones potenciales de este innovador modelo. Las funciones principales de gpt-4o-audio-preview se dividen en tres áreas: en primer lugar, su capacidad para generar respuestas de voz naturales y fluidas a partir de texto, proporcionando una solución ideal para asistentes de voz y atención al cliente virtual...

Oct 18, 2024

7.6k

清华与微软联手打造 Differential Transformer，提高 AI 注意力集中度，精度提升 30%！

Recientemente, los modelos de lenguaje grandes (LLM) han experimentado un rápido desarrollo, y los modelos Transformer han sido cruciales en este avance. El núcleo de Transformer es el mecanismo de atención, que actúa como un filtro de información, permitiendo que el modelo se centre en las partes más importantes de una oración. Pero incluso los poderosos Transformer pueden verse afectados por información irrelevante, como si estuvieras buscando un libro en una biblioteca y te vieras abrumado por una pila de libros irrelevantes, lo que reduce la eficiencia. Esta información irrelevante generada por el mecanismo de atención se conoce en la literatura como ruido de atención. Imagina que quieres...

Oct 10, 2024

4.0k

aiOla de Israel lanza Whisper Medusa, un modelo de reconocimiento de voz de código abierto un 50% más rápido

La empresa israelí de IA aiOla ha lanzado un modelo de reconocimiento de voz de código abierto llamado Whisper Medusa. Basado en un diseño de arquitectura mejorado que incorpora un mecanismo de atención múltiple, este modelo es un 50% más rápido que el modelo Whisper de OpenAI. Whisper Medusa logra esta mejora de velocidad prediciendo diez tokens en paralelo en lugar de uno a la vez, manteniendo al mismo tiempo el rendimiento. Su innovador método de entrenamiento utiliza aprendizaje con supervisión débil, congelando el sistema principal y utilizando...

Aug 7, 2024

2.2k

Nuevo modelo de OpenAI: gpt-4o-2024-08-06 y gpt-4o-mini con soporte para salida estructurada

OpenAI ha añadido una función de salida estructurada a su API, garantizando que la salida generada cumpla completamente con la estructura JSON predefinida. Esto mejora significativamente la fiabilidad de la API y la precisión de las aplicaciones. Esta función no solo define la estructura del JSON, sino que también asegura la exactitud de la salida. Simultáneamente, se ha reducido el precio; el coste de entrada se ha reducido a la mitad y el coste de salida en un tercio. La introducción de la salida estructurada resuelve las limitaciones del esquema JSON en cuanto a garantizar que la salida se ajuste a una estructura específica, mejorando notablemente el rendimiento del modelo en la salida estructurada. Gracias a innovaciones tecnológicas, como la limitación...

Aug 7, 2024

8.1k

OpenAI lanza el nuevo modelo gpt-4o-64k-output-alpha: GPT-4o API ahora admite hasta 64K de salida

El punto más destacado del nuevo modelo gpt-4o-64k-output-alpha de OpenAI es su capacidad para generar una salida de hasta 64K tokens a la vez, ideal para contenido extenso y detallado, cubriendo necesidades en escritura, programación y análisis de datos complejos. Sin embargo, esta funcionalidad incrementa el precio de la API, con un coste de 18 dólares por millón de tokens de salida, en comparación con los 6 dólares por millón de tokens de entrada. Esta medida busca compensar los altos costes computacionales y fomentar el uso responsable de esta potente herramienta. El modelo es una gran ayuda para la creación y la investigación.

Jul 31, 2024

3.6k

Meta presenta el mecanismo de atención S2A, mejorando la precisión de los modelos grandes hasta un 80.3%

El equipo de Meta presenta el mecanismo de atención S2A, que resuelve el problema de la correlación falsa en las respuestas de los modelos de lenguaje grandes. S2A mejora la capacidad de razonamiento del modelo a través del mecanismo de atención System2Attention. En los experimentos, S2A elimina el texto no relevante, reescribe el contexto y mejora significativamente la precisión de las respuestas. LeCun reconoce este mecanismo y afirma que ayuda a que los modelos de lenguaje grandes sean más capaces de razonar. El artículo describe detalladamente la implementación de S2A y su función en la mejora del rendimiento del modelo.

Nov 28, 2023

860

Meta presenta System2Attention, un mecanismo de atención que mejora la capacidad de razonamiento de los modelos de lenguaje

Los investigadores de Meta presentan System2Attention, que aborda los problemas de razonamiento en tareas complejas de los grandes modelos de lenguaje. System2Attention ajusta el mecanismo de atención para evitar que la atención suave se vea afectada por contextos irrelevantes, mejorando así la precisión del razonamiento. Los experimentos demuestran que S2A ofrece un mejor rendimiento en preguntas y respuestas de hechos, generación de argumentos y problemas matemáticos, y ha recibido el reconocimiento de Yann LeCun. Este mecanismo de atención innovador ofrece una nueva perspectiva para mejorar la capacidad de razonamiento de los modelos de lenguaje.

Nov 24, 2023

760

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General