¡Reflection 70B, el modelo que supera a GPT-4o y Claude 3.5 Sonnet!, un modelo excepcionalmente potente

AIbase基地

Publicado elNoticias de IA · 7 minutos de lectura · Sep 6, 2024

694

Matt Shumer, CEO de la startup de inteligencia artificial HyperWrite, anunció un hito importante: el lanzamiento de Reflection70B, un modelo basado en el modelo de código abierto Llama 3.1-70B Instruct de Meta. Este nuevo modelo no solo ha demostrado un rendimiento excepcional en pruebas comparativas de terceros, sino que también ha sido aclamado como "el modelo de IA de código abierto más potente del mundo".

Shumer compartió la noticia en la red social X, mostrando gráficos que demuestran que Reflection70B supera a la serie Meta Llama en varias pruebas, incluso alcanzando un rendimiento comparable al de los mejores modelos comerciales. Tras el anuncio, el sitio web de demostración de HyperWrite experimentó un aumento significativo en el tráfico, y el equipo está buscando actualmente más recursos de GPU para satisfacer la demanda de los usuarios.

La característica distintiva de Reflection70B es su tecnología de autocorrección. Shumer señala que los grandes modelos lingüísticos (LLM) existentes pueden cometer errores, pero a menudo carecen de la capacidad de autocorrección. Reflection70B garantiza la fiabilidad de las respuestas que proporciona al usuario revisando y evaluando su precisión después de generar el texto.

El modelo introduce varios símbolos especiales nuevos que permiten a los usuarios interactuar con él de una manera más estructurada. Durante el proceso de razonamiento, el modelo muestra su proceso de razonamiento dentro de etiquetas especiales, lo que permite la corrección de errores en tiempo real. En el sitio web de demostración, los usuarios pueden probar preguntas sencillas como "¿Cuántas letras 'r' hay en la palabra 'Strawberry'?" o "¿Qué número es mayor, 9.11 o 9.9?", y Reflection70B, tras un tiempo de procesamiento, proporciona la respuesta correcta.

Esta característica de Reflection70B lo hace ideal para tareas que requieren alta precisión. Al descomponer el proceso de razonamiento en varios pasos claramente definidos, aumenta la exactitud de los resultados. Ahora, Reflection70B está disponible para descargar a través del repositorio de código AI Hugging Face, y el acceso a la API se lanzará pronto a través del proveedor de servicios de GPU Hyperbolic Labs.

Además, HyperWrite está trabajando para integrar el modelo Reflection70B en su producto principal de asistente de escritura con IA, y se espera que lance una versión aún más potente, Reflection405B, la próxima semana. Shumer reveló que están explorando continuamente cómo aplicar mejor esta tecnología a sus productos reales.

El éxito de Reflection70B también se debe a la contribución de Glaive, una empresa que se centra en la generación de conjuntos de datos para casos de uso específicos, lo que aceleró enormemente el entrenamiento del modelo. La plataforma de Glaive puede generar rápidamente datos sintéticos de alta calidad, ayudando a las empresas a ajustar finamente los modelos de forma rápida y económica, resolviendo así uno de los principales cuellos de botella en el desarrollo de IA: la disponibilidad de datos de alta calidad y específicos para la tarea.

HyperWrite, una startup de IA con sede en Long Island, fue cofundada en 2020 por Shumer y Jason Kuperberg, y desde entonces ha estado explorando activamente el campo de la IA. Inicialmente una extensión de Chrome, se ha convertido en un asistente de IA capaz de manejar tareas más complejas, con una gran base de 2 millones de usuarios y reconocida con el premio "30Under30" de Forbes.

La última ronda de financiación de HyperWrite se reveló en marzo de 2023, obteniendo 2,8 millones de dólares de inversores como Madrona Venture Group. Estos fondos han apoyado el lanzamiento de nuevas funciones impulsadas por IA, convirtiendo el navegador web en un asistente virtual capaz de realizar diversas tareas, desde reservar vuelos hasta buscar candidatos en LinkedIn.

Shumer enfatiza que la precisión y la seguridad son siempre las prioridades de HyperWrite, especialmente al explorar tareas de automatización complejas. La plataforma también se monitorea y mejora continuamente a través de los comentarios de los usuarios para perfeccionar sus herramientas de asistente personal. Este enfoque cauteloso, al igual que el razonamiento y la reflexión estructurados integrados en Reflection70B, refleja el compromiso de Shumer con la precisión y la responsabilidad.

Dirección de descarga del modelo: https://huggingface.co/mattshumer/Reflection-Llama-3.1-70B

Kuaishou abre el modelo KAT-V1: Capacidad de pensamiento automático mejorada significativamente. La versión de 40B tiene un rendimiento cercano a R1-0528

Kuaishou abre el modelo de gran tamaño KAT-V1 con capacidad de pensamiento automático, que incluye dos versiones de 40B y 200B. La versión de 40B tiene un rendimiento cercano a DeepSeek-R1, y la versión de 200B supera a varios modelos de gama alta. El modelo utiliza de manera innovadora un esquema de entrenamiento híbrido de pensamiento largo y corto, y algoritmo de aprendizaje por refuerzo Step-SRPO. Puede ajustar automáticamente el modo de pensamiento según la complejidad del problema y resolver el problema del pensamiento excesivo. Basado en Qwen2.5-32B, mediante un marco de distilación heterogénea y una preentrenamiento con 10 millones de ejemplos, muestra un buen desempeño en campos como la ciencia y el código.

Figma Make ahora disponible para todos los usuarios: Diseño potenciado por IA, la eficiencia al alcance de la mano

Figma abre su herramienta de diseño AI Make, permitiendo prototipos con lenguaje natural. Funciones básicas gratuitas, pero versión completa requiere suscripción Full Seat. Incluye generación con imágenes de referencia, edición detallada y un sistema de créditos AI por nivel de membresía.....

Google afirma que los principios básicos de SEO siguen siendo aplicables siempre que el contenido de IA sea conforme

Expertos de Google destacan que la IA está integrada en búsquedas, pero los principios SEO siguen igual: 1) Estrategias SEO actuales aún aplican, 2) Google valora calidad, no origen del contenido, 3) Modelos como BERT afectan todo el proceso, 4) Resúmenes IA reducen clics a resultados tradicionales.....

Ali Wan 2.2 está a punto de lanzarse con un gran impacto: el modelo de generación de videos de código abierto desafía a Sora

Alibaba Cloud está a punto de lanzar la versión actualizada del modelo de generación de videos de AI Wan 2.2, logrando varios avances sobre Wan 2.1: 1) Mejora del rendimiento, soporte para resoluciones altas como 1080p/4K y generación de videos largos; 2) Nueva función de conversión de video a audio, mejorando la creación multimodal; 3) Optimización de los requisitos de hardware, ahora puede funcionar en dispositivos con 6 GB de VRAM; 4) Ampliación de los datos de entrenamiento hasta 1.500 millones de videos más 1.000 millones de imágenes; 5) Continuar con la estrategia de código abierto, utilizando la licencia Apache 2.0. Este modelo reforzará la posición líder de Alibaba en el campo de la generación de videos de IA.

Product Finder

Product Submit

AI Models Finder

MCP Servers

MCP Client

MCP Inspector

Case Tutorials

Latest AI News

AI Daily Brief

¡Reflection 70B, el modelo que supera a GPT-4o y Claude 3.5 Sonnet!, un modelo excepcionalmente potente

AIbase基地

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

Los alumnos de Zhejiang lanzan una herramienta para probar códigos de IA, un sitio web sin errores en 30 minutos

Kuaishou abre el modelo KAT-V1: Capacidad de pensamiento automático mejorada significativamente. La versión de 40B tiene un rendimiento cercano a R1-0528

Figma Make ahora disponible para todos los usuarios: Diseño potenciado por IA, la eficiencia al alcance de la mano

Nanyang Technological University colabora con el Laboratorio de IA de Shanghai para lanzar PhysX-3D, ¡inyectando un alma física en los modelos 3D generados por IA!

Google lanza una herramienta para construir aplicaciones de IA llamada Opal: cree aplicaciones de IA sin necesidad de código utilizando un lenguaje natural

Google afirma que los principios básicos de SEO siguen siendo aplicables siempre que el contenido de IA sea conforme

¿Adónde va el SEO en la era de la IA? Un experto de Google revela el futuro de la búsqueda, las reglas tradicionales aún son la base

Google lanza una guía web impulsada por IA que redefine la experiencia de búsqueda

Anthropic presenta un agente de auditoría para ayudar en las pruebas de alineación de modelos de IA

Ali Wan 2.2 está a punto de lanzarse con un gran impacto: el modelo de generación de videos de código abierto desafía a Sora