Matt Shumer, CEO de la startup de inteligencia artificial HyperWrite, anunció un hito importante: el lanzamiento de Reflection70B, un modelo basado en el modelo de código abierto Llama 3.1-70B Instruct de Meta. Este nuevo modelo no solo ha demostrado un rendimiento excepcional en pruebas comparativas de terceros, sino que también ha sido aclamado como "el modelo de IA de código abierto más potente del mundo".
Shumer compartió la noticia en la red social X, mostrando gráficos que demuestran que Reflection70B supera a la serie Meta Llama en varias pruebas, incluso alcanzando un rendimiento comparable al de los mejores modelos comerciales. Tras el anuncio, el sitio web de demostración de HyperWrite experimentó un aumento significativo en el tráfico, y el equipo está buscando actualmente más recursos de GPU para satisfacer la demanda de los usuarios.
La característica distintiva de Reflection70B es su tecnología de autocorrección. Shumer señala que los grandes modelos lingüísticos (LLM) existentes pueden cometer errores, pero a menudo carecen de la capacidad de autocorrección. Reflection70B garantiza la fiabilidad de las respuestas que proporciona al usuario revisando y evaluando su precisión después de generar el texto.
El modelo introduce varios símbolos especiales nuevos que permiten a los usuarios interactuar con él de una manera más estructurada. Durante el proceso de razonamiento, el modelo muestra su proceso de razonamiento dentro de etiquetas especiales, lo que permite la corrección de errores en tiempo real. En el sitio web de demostración, los usuarios pueden probar preguntas sencillas como "¿Cuántas letras 'r' hay en la palabra 'Strawberry'?" o "¿Qué número es mayor, 9.11 o 9.9?", y Reflection70B, tras un tiempo de procesamiento, proporciona la respuesta correcta.
Esta característica de Reflection70B lo hace ideal para tareas que requieren alta precisión. Al descomponer el proceso de razonamiento en varios pasos claramente definidos, aumenta la exactitud de los resultados. Ahora, Reflection70B está disponible para descargar a través del repositorio de código AI Hugging Face, y el acceso a la API se lanzará pronto a través del proveedor de servicios de GPU Hyperbolic Labs.
Además, HyperWrite está trabajando para integrar el modelo Reflection70B en su producto principal de asistente de escritura con IA, y se espera que lance una versión aún más potente, Reflection405B, la próxima semana. Shumer reveló que están explorando continuamente cómo aplicar mejor esta tecnología a sus productos reales.
El éxito de Reflection70B también se debe a la contribución de Glaive, una empresa que se centra en la generación de conjuntos de datos para casos de uso específicos, lo que aceleró enormemente el entrenamiento del modelo. La plataforma de Glaive puede generar rápidamente datos sintéticos de alta calidad, ayudando a las empresas a ajustar finamente los modelos de forma rápida y económica, resolviendo así uno de los principales cuellos de botella en el desarrollo de IA: la disponibilidad de datos de alta calidad y específicos para la tarea.
HyperWrite, una startup de IA con sede en Long Island, fue cofundada en 2020 por Shumer y Jason Kuperberg, y desde entonces ha estado explorando activamente el campo de la IA. Inicialmente una extensión de Chrome, se ha convertido en un asistente de IA capaz de manejar tareas más complejas, con una gran base de 2 millones de usuarios y reconocida con el premio "30Under30" de Forbes.
La última ronda de financiación de HyperWrite se reveló en marzo de 2023, obteniendo 2,8 millones de dólares de inversores como Madrona Venture Group. Estos fondos han apoyado el lanzamiento de nuevas funciones impulsadas por IA, convirtiendo el navegador web en un asistente virtual capaz de realizar diversas tareas, desde reservar vuelos hasta buscar candidatos en LinkedIn.
Shumer enfatiza que la precisión y la seguridad son siempre las prioridades de HyperWrite, especialmente al explorar tareas de automatización complejas. La plataforma también se monitorea y mejora continuamente a través de los comentarios de los usuarios para perfeccionar sus herramientas de asistente personal. Este enfoque cauteloso, al igual que el razonamiento y la reflexión estructurados integrados en Reflection70B, refleja el compromiso de Shumer con la precisión y la responsabilidad.
Dirección de descarga del modelo: https://huggingface.co/mattshumer/Reflection-Llama-3.1-70B