Notícias de IA

Não perca nenhum momento da inovação global em IA

IA Diário

Tendências diárias da indústria de IA em três minutos

Linha do Tempo da IA

Marcos da indústria de IA

Al hardware

lista todos os produtos de hardware AI.

Guia de Monetização de IA

Casos Recentes

Compartilhamento de casos de monetização de IA

Coleção de Imagens

Casos de monetização de criação de imagens por IA

Coleção de Vídeos

Casos de monetização de criação de vídeos por IA

Coleção de Áudios

Casos de monetização de criação de áudios por IA

Coleção de Conteúdo

Casos de monetização de escrita de conteúdo por IA

Tutoriais de IA

Tutoriais Recentes

Compartilhamento gratuito dos tutoriais de IA mais recentes

Rankings de Produtos de IA

Ranking de Produtos de IA

Mostra o ranking total de visitas de sites de IA

Ranking de Crescimento de Tráfego de IA

Rastreia os sites de IA de crescimento mais rápido por tráfego

Ranking de Queda de Tráfego de IA

Foco em sites de IA com quedas significativas de tráfego

Ranking Semanal de IA

Mostra o ranking semanal de visitas de sites de IA

Rankings de Países Populares

Estados Unidos

Sites de IA mais populares entre os usuários dos EUA

China

Sites de IA mais populares entre os usuários chineses

Índia

Sites de IA mais populares entre os usuários indianos

Brasil

Sites de IA mais populares entre os usuários brasileiros

Rankings de Categorias Populares

Geração de Imagens

Ranking total de visitas de sites de geração de imagens de IA

Assistente Pessoal

Ranking total de visitas de sites de assistentes pessoais de IA

Geração de Personagens

Ranking total de visitas de sites de geração de personagens de IA

Geração de Vídeos

Ranking total de visitas de sites de geração de vídeos de IA

Rankings de Dados de Código Aberto Populares

Ranking de Projetos de IA

Projetos de IA populares no GitHub por total de estrelas

Ranking de Crescimento de Projetos de IA

Projetos de IA populares no GitHub por taxa de crescimento

Ranking de Desenvolvedores de IA

Ranking de desenvolvedores de IA populares no GitHub

Ranking de Organizações de IA

Ranking de organizações de IA populares no GitHub

Categorias de Código Aberto Populares

Deepseek

Projetos de código aberto Deepseek populares no GitHub

TTS

Projetos de código aberto TTS populares no GitHub

LLM

Projetos de código aberto LLM populares no GitHub

ChatGPT

Projetos de código aberto ChatGPT populares no GitHub

Biblioteca de Projetos de Código Aberto de IA

Visão Geral

Visão geral dos projetos de código aberto de IA populares no GitHub

Biblioteca de produtos Navegação de ferramentas MCP

Apenas 20B parâmetros! ByteDance lança o modelo multi-modal Seed1.5-VL, obtendo 38 resultados SOTA

AIbase基地

Publicado emNotícias e Informações de IA · 4 minutos de leitura · May 14, 2025

No tour de inovação AI FORCE LINK promovido pelo Volcano Engine em Xangai, a ByteDance lançou oficialmente o seu mais recente modelo multimodal visual-linguagem — Seed1.5-VL. Este modelo chamou a atenção por sua notável capacidade de compreensão e推理 multimodal geral, tornando-se o ponto focal do evento e despertando o interesse de muitos especialistas e desenvolvedores do setor.

O principal destaque do Seed1.5-VL é sua capacidade aprimorada de compreensão e推理 multimodal. Em comparação com versões anteriores, o Seed1.5-VL apresenta uma melhoria significativa na velocidade e precisão de posicionamento visual e推理. Além disso, com a adição das funções de compreensão de vídeo e agente multimodal inteligente, ele se destaca ainda mais ao lidar com tarefas complexas.

Alto desempenho com baixo custo

Apesar de ter apenas 20 bilhões de parâmetros ativados, o Seed1.5-VL já alcançou um desempenho equivalente ao do Gemini2.5Pro. Entre 60 benchmarks públicos, o Seed1.5-VL obteve resultados state-of-the-art (SOTA) em 38 tarefas, especialmente em compreensão de vídeo,推理 visual e capacidades de agente multimodal, mantendo-se à frente da indústria.

No que diz respeito aos custos de inferência, o Seed1.5-VL também se destacou, com um preço de entrada de apenas 0,003 yuan por mil tokens e um custo de saída de 0,009 yuan por mil tokens, proporcionando uma excelente relação custo-benefício.

Acesso fácil via API

Atualmente, o Seed1.5-VL está totalmente disponível para acesso via API no Volcano Engine. Os desenvolvedores podem rapidamente chamar suas capacidades logando-se e selecionando "Doubao-1.5-thinking-vision-pro", criando seus próprios assistentes visuais, sistemas de inspeção, agentes interativos ou próximas gerações de câmeras inteligentes.

Para validar o desempenho real do Seed1.5-VL, os jornalistas realizaram diversos testes. Ao enviar uma imagem de prateleira, o Seed1.5-VL identificou rapidamente produtos específicos e calculou seus preços. Em questões de raciocínio gráfico complexas de concursos públicos, o Seed1.5-VL demonstrou sua poderosa capacidade de推理, capturando e derivando padrões em poucos segundos para concluir tarefas lógicas difíceis.

O Seed1.5-VL, como o mais recente modelo multimodal da série Seed, foi pré-treinado em mais de 3T tokens de dados multimodais, mostrando excelentes resultados em tarefas como perguntas e respostas visuais, interpretação de gráficos e推理 visual. O modelo é composto por três componentes principais: módulo de codificação visual SeedViT, adaptador de perceptron multicamadas (MLP) para projeção de características visuais e um grande modelo de linguagem baseado na arquitetura MoE, denominado Seed1.5-LLM.

GitHub: https://github.com/ByteDance-Seed/Seed1.5-VL
https://seed.bytedance.com/zh/tech/seed1_5_vl

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily