Noticias de IA

No te pierdas ningún momento de la innovación global en IA

IA Diario

Tendencias diarias de la industria de la IA en tres minutos

Cronología de la IA

Hitos de la industria de la IA

Al hardware

lista todos los productos de hardware AI.

Guía de Monetización de la IA

Últimos Casos

Compartiendo casos de monetización de IA

Colección de Imágenes

Casos de monetización de creación de imágenes con IA

Colección de Videos

Casos de monetización de creación de videos con IA

Colección de Audio

Casos de monetización de creación de audio con IA

Colección de Contenido

Casos de monetización de redacción de contenido con IA

Tutoriales de IA

Últimos Tutoriales

Compartiendo gratuitamente los últimos tutoriales de IA

Rankings de Productos de IA

Ranking de Productos de IA

Muestra el ranking de visitas totales de sitios web de IA

Ranking de Crecimiento de Tráfico de IA

Rastrea los sitios web de IA de más rápido crecimiento por tráfico

Ranking de Descenso de Tráfico de IA

Se centra en los sitios web de IA con descensos de tráfico significativos

Ranking Semanal de IA

Muestra el ranking semanal de visitas de sitios web de IA

Rankings de Países Populares

Estados Unidos

Sitios web de IA más populares entre los usuarios estadounidenses

China

Sitios web de IA más populares entre los usuarios chinos

India

Sitios web de IA más populares entre los usuarios indios

Brasil

Sitios web de IA más populares entre los usuarios brasileños

Rankings de Categorías Populares

Generación de Imágenes

Ranking total de visitas de sitios web de generación de imágenes con IA

Asistente Personal

Ranking total de visitas de sitios web de asistentes personales con IA

Generación de Personajes

Ranking total de visitas de sitios web de generación de personajes con IA

Generación de Videos

Ranking total de visitas de sitios web de generación de videos con IA

Rankings de Datos de Código Abierto Populares

Ranking de Proyectos de IA

Proyectos de IA populares en GitHub por estrellas totales

Ranking de Crecimiento de Proyectos de IA

Proyectos de IA populares en GitHub por tasa de crecimiento

Ranking de Desarrolladores de IA

Ranking de desarrolladores de IA populares en GitHub

Ranking de Organizaciones de IA

Ranking de organizaciones de IA populares en GitHub

Categorías de Código Abierto Populares

Deepseek

Proyectos de código abierto de Deepseek populares en GitHub

TTS

Proyectos de código abierto de TTS populares en GitHub

LLM

Proyectos de código abierto de LLM populares en GitHub

ChatGPT

Proyectos de código abierto de ChatGPT populares en GitHub

Biblioteca de Proyectos de Código Abierto de IA

Visión General

Visión general de los proyectos de código abierto de IA populares en GitHub

Biblioteca de productos Navegación de herramientas MCP

NVIDIA lanza Llama Nemotron Nano VL AI: líder en soluciones de procesamiento de documentos de alta precisión en OCRBench

AIbase基地

Publicado elNoticias de IA · 8 minutos de lectura · Jun 5, 2025

NVIDIA lanzó oficialmente el 3 de junio de 2025 el Llama Nemotron Nano VL, un modelo visual-lenguaje compacto optimizado para el procesamiento inteligente de documentos. Este modelo encabezó el ranking en la evaluación del benchmark OCRBench v2, destacándose por su capacidad excepcional para manejar documentos complejos, gráficos y cuadros de video. Con un rendimiento de inferencia eficiente y una forma flexible de implementación, Llama Nemotron Nano VL ofrece soluciones precisas de procesamiento de documentos desde la nube hasta dispositivos de borde para las empresas.

Llama Nemotron Nano VL: La herramienta compacta y eficiente para procesar documentos

Llama Nemotron Nano VL está basado en el arquitectura Llama3.1 de Meta y combina un codificador visual ligero CRadioV2-H. A pesar de tener solo 8 mil millones de parámetros (8B), este modelo muestra un excelente desempeño en tareas de comprensión de documentos. Soporta múltiples modalidades de entrada, cubriendo escenarios complejos como documentos multilínea, tablas escaneadas, informes financieros y diagramas técnicos, con una longitud de contexto de hasta 16K tokens, lo que lo hace ideal para el procesamiento de documentos largos y tareas de razonamiento multi-salto.

Su principal ventaja radica en el rendimiento eficiente de inferencia, utilizando la tecnología de cuantificación AWQ4bit, el modelo puede ejecutarse en una sola tarjeta NVIDIA RTX GPU o en dispositivos边缘 Jetson Orin, reduciendo significativamente los costos de implementación. Esto lo convierte en una elección ideal para empresas que necesitan ejecutar agentes de IA en entornos con recursos limitados.

Campeón en OCRBench v2, liderando la capacidad de análisis de documentos

Llama Nemotron Nano VL obtuvo la puntuación más alta en la evaluación OCRBench v2, superando a otros modelos visuales-lenguaje compactos. OCRBench v2 incluye más de 10,000 pares de preguntas-respuestas verificados manualmente, cubriendo documentos de áreas como finanzas, medicina, derecho y publicaciones científicas, incluidas pruebas de reconocimiento óptico de caracteres (OCR), análisis de tablas y razonamiento de gráficos.

Este modelo se destaca en la extracción de datos estructurados (como tablas y pares clave-valor) y en responder preguntas basadas en la disposición, mostrando una robustez particularmente fuerte en documentos no en inglés y escaneos de baja calidad. Esta alta precisión y capacidad de generalización le otorgan amplias posibilidades de uso en escenarios como preguntas automatizadas sobre documentos, OCR inteligente y extracción de información.

Implementación flexible, habilitando aplicaciones empresariales en múltiples escenarios

Llama Nemotron Nano VL admite una implementación flexible desde centros de datos hasta dispositivos de borde, compatibles con el marco TensorRT-LLM de NVIDIA, asegurando un funcionamiento eficiente en sistemas acelerados por GPU. Las empresas pueden personalizarlo a través de los microservicios de NVIDIA NeMo para adaptarlo a necesidades específicas, como análisis financiero, procesamiento de registros médicos o revisión de documentos legales.

Ahora bien, este modelo también soporta inferencia de imágenes individuales y video, aplicable a tareas como resumen de imágenes, análisis texto-imagen e interacción de preguntas-respuestas. Su carácter open-source (bajo la licencia NVIDIA Open Model License y la licencia de comunidad Llama3.1) permite usos comerciales, proporcionando a los desarrolladores libertad para construir agentes de IA personalizados.

Estrategia de NVIDIA en el campo de los agentes inteligentes

Llama Nemotron Nano VL es una parte importante de la familia de modelos Nemotron de NVIDIA, reflejando su compromiso continuo en el campo de los agentes inteligentes (Agentic AI). Al combinar la arquitectura Llama y las tecnologías optimizadas de NVIDIA, este modelo no solo mejora la eficiencia de la inferencia, sino que también establece un nuevo estándar en el procesamiento de documentos.

NVIDIA planea expandir aún más las funciones del modelo mediante el marco NeMo y los servicios micro NIM, apoyando más tareas multimodales, como búsqueda de video y generación de video físico-consciente. Esto indica que NVIDIA está trabajando en la construcción de un ecosistema integral desde el borde hasta la nube, brindando un fuerte apoyo a la transformación digital de las empresas.

El lanzamiento de Llama Nemotron Nano VL marca un nuevo avance en la aplicación empresarial de modelos visuales-lenguaje compactos. Su eficiencia y precisión abren nuevas posibilidades para el procesamiento automatizado de documentos, gestión del conocimiento y colaboración inteligente. AIbase continuará monitoreando los últimos desarrollos de NVIDIA en el campo de la IA, proporcionando a los lectores perspectivas técnicas de vanguardia.

Acceso: https://huggingface.co/nvidia/Llama-3.1-Nemotron-Nano-VL-8B-V1

LlamaNemotronNanoVL NVIDIA OCRBenchv2 MetaLlama3.1

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

¡Usuarios de Android con envidia! iOS 18.1 Beta de Apple: IA mejorada + grabación desbloqueada

Apple ha lanzado la versión beta de iOS 18.1, iPadOS 18.1 y macOS Sequoia 15.1 para desarrolladores, con la introducción de funciones de IA por primera vez, pero solo disponible en Estados Unidos. Los iPhone de China continental no pueden activarse por el momento. Las funciones principales incluyen una interfaz de Siri actualizada con coherencia contextual, respuestas y resúmenes inteligentes de correo electrónico, y búsqueda de lenguaje natural en la aplicación Fotos. Apple planea expandir gradualmente las funciones de IA en 2025. La instalación requiere unirse a una lista de espera a través de un dispositivo específico. Además, Apple ha lanzado iOS 18 con nuevas funciones.

Jul 30, 2024

9.6k

¡Envidia! ¡Algunos ya están probando GPT-5 y su rendimiento se ha disparado!

OpenAI está ofreciendo una versión de prueba de GPT-5 a sus clientes, con pruebas de equipo rojo en curso y un lanzamiento previsto para este verano. Los usuarios empresariales están experimentando la última versión de ChatGPT, con un salto cualitativo en el rendimiento y la capacidad del modelo para invocar agentes de IA para completar tareas. Altman ha revelado que GPT-5 mejorará significativamente en todos los aspectos y que los reguladores deben gestionar la IA para evitar que individuos o empresas controlen completamente la IAG. El lanzamiento de GPT-5 impulsará el crecimiento de los ingresos de OpenAI, con una mejora sustancial del rendimiento del modelo. Altman afirma que cambiará la historia de la humanidad.

Mar 21, 2024

470

¡Buenas noticias para los que envidian a GPTs! Hemos encontrado una alternativa gratuita

Poe permite a los usuarios experimentar fácilmente con múltiples modelos de IA para crear chatbots personalizados. Existe una gran cantidad de bots Prompt creados por usuarios comunes en la comunidad Poe. Poe lanzó un programa de ingresos por creación para alentar a los usuarios a crear contenido de IA que genere ganancias.

Nov 13, 2023

850