Noticias de IA

No te pierdas ningún momento de la innovación global en IA

IA Diario

Tendencias diarias de la industria de la IA en tres minutos

Cronología de la IA

Hitos de la industria de la IA

Al hardware

lista todos los productos de hardware AI.

Guía de Monetización de la IA

Últimos Casos

Compartiendo casos de monetización de IA

Colección de Imágenes

Casos de monetización de creación de imágenes con IA

Colección de Videos

Casos de monetización de creación de videos con IA

Colección de Audio

Casos de monetización de creación de audio con IA

Colección de Contenido

Casos de monetización de redacción de contenido con IA

Tutoriales de IA

Últimos Tutoriales

Compartiendo gratuitamente los últimos tutoriales de IA

Rankings de Productos de IA

Ranking de Productos de IA

Muestra el ranking de visitas totales de sitios web de IA

Ranking de Crecimiento de Tráfico de IA

Rastrea los sitios web de IA de más rápido crecimiento por tráfico

Ranking de Descenso de Tráfico de IA

Se centra en los sitios web de IA con descensos de tráfico significativos

Ranking Semanal de IA

Muestra el ranking semanal de visitas de sitios web de IA

Rankings de Países Populares

Estados Unidos

Sitios web de IA más populares entre los usuarios estadounidenses

China

Sitios web de IA más populares entre los usuarios chinos

India

Sitios web de IA más populares entre los usuarios indios

Brasil

Sitios web de IA más populares entre los usuarios brasileños

Rankings de Categorías Populares

Generación de Imágenes

Ranking total de visitas de sitios web de generación de imágenes con IA

Asistente Personal

Ranking total de visitas de sitios web de asistentes personales con IA

Generación de Personajes

Ranking total de visitas de sitios web de generación de personajes con IA

Generación de Videos

Ranking total de visitas de sitios web de generación de videos con IA

Rankings de Datos de Código Abierto Populares

Ranking de Proyectos de IA

Proyectos de IA populares en GitHub por estrellas totales

Ranking de Crecimiento de Proyectos de IA

Proyectos de IA populares en GitHub por tasa de crecimiento

Ranking de Desarrolladores de IA

Ranking de desarrolladores de IA populares en GitHub

Ranking de Organizaciones de IA

Ranking de organizaciones de IA populares en GitHub

Categorías de Código Abierto Populares

Deepseek

Proyectos de código abierto de Deepseek populares en GitHub

TTS

Proyectos de código abierto de TTS populares en GitHub

LLM

Proyectos de código abierto de LLM populares en GitHub

ChatGPT

Proyectos de código abierto de ChatGPT populares en GitHub

Biblioteca de Proyectos de Código Abierto de IA

Visión General

Visión general de los proyectos de código abierto de IA populares en GitHub

Biblioteca de productos Navegación de herramientas MCP

¡Solo 20 mil millones de parámetros! ByteDance lanza Seed1.5-VL, un modelo multimodal que consigue 38 SOTAs

AIbase基地

Publicado elNoticias de IA · 5 minutos de lectura · May 14, 2025

En la gira de innovación de AI FORCE LINK organizada en Shanghái por ByteDance, se lanzó oficialmente el último modelo multimodal de visión y lenguaje llamado Seed1.5-VL. Este modelo, con sus excepcionales capacidades de comprensión e inferencia multimodales, fue el centro de atención del evento y atrajo la atención de muchos expertos del sector y desarrolladores.

El rasgo destacado de Seed1.5-VL es su capacidad mejorada de comprensión e inferencia multimodales. En comparación con las versiones anteriores, Seed1.5-VL ha mejorado significativamente tanto en velocidad como en precisión en la localización visual y la inferencia. Además, la función adicional de comprensión de videos y agente multimodal hace que se desempeñe aún mejor al procesar tareas complejas.

Alta eficiencia con un costo reducido

A pesar de que los parámetros activados de Seed1.5-VL son solo 20B, su rendimiento ya está a la altura del Gemini2.5Pro. En 60 benchmarks públicos, Seed1.5-VL obtuvo resultados líderes en 38 tareas, especialmente en comprensión de videos, razonamiento visual y capacidades de agente multimodal, liderando la industria.

En términos de costos de inferencia, Seed1.5-VL también se destaca, con un costo de entrada de solo 0.003 yuanes por cada mil tokens y un costo de salida de solo 0.009 yuanes por cada mil tokens, lo que le otorga una excelente relación calidad-precio.

API fácil de integrar

Actualmente, Seed1.5-VL está disponible para acceso completo a través de la API de ByteDance. Los desarrolladores solo necesitan iniciar sesión y seleccionar "Doubao-1.5-thinking-vision-pro" para acceder rápidamente a sus capacidades y crear sus propios asistentes visuales de IA, sistemas de inspección, agentes interactivos o próximas cámaras inteligentes.

Para verificar el rendimiento real de Seed1.5-VL, los periodistas realizaron varias pruebas. Al cargar una imagen de estantería, Seed1.5-VL pudo identificar rápidamente productos específicos y calcular sus precios. En problemas complejos de razonamiento gráfico para empleados públicos, Seed1.5-VL demostró su potente capacidad de inferencia, capturando y deduciendo patrones en poco tiempo para completar tareas lógicas difíciles.

Seed1.5-VL, como el último modelo multimodal de la serie Seed, después de ser preentrenado en más de 3T tokens de datos multimodales, muestra un rendimiento excepcional en múltiples tareas como preguntas y respuestas de imágenes, comprensión de diagramas y razonamiento visual. Este modelo consta de tres componentes principales: el módulo de codificación visual SeedViT, un adaptador de perceptrón multicapa (MLP) para proyección de características visuales y un gran modelo de lenguaje basado en arquitectura MoE llamado Seed1.5-LLM.

Github: https://github.com/ByteDance-Seed/Seed1.5-VL
https://seed.bytedance.com/zh/tech/seed1_5_vl

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily