Information

Latest AI News

Explore AI Frontiers, Master Industry Trends

AI Daily Brief

Your Daily AI Brief - Never Miss What's Next

Information

AI Product Finder

Smart Product Discovery - Comprehensive Market Intelligence

AI Product Rankings

AI Product Power Rankings - Performance, Buzz & Trends

AI Product Submit

Submit Your AI Product - Amplify Reach & Drive Growth

Tools

AI Tools Directory

Discover The Best AI Websites & Tools

Information

AI Models Finder

Comprehensive AI Models Collection for All Your Development & Research Needs

LLM Leaderboard

AI LLM Power Rankings - Performance, Buzz & Trends

Model Providers

Discover Trusted AI Model Partners - Guaranteed Reliable Support

Submit Your Model

Submit Your Model Info & Services - Precision Marketing & User Targeting

Tools

Compare LLMs

Multi-Dimensional Large Model Comparison - Find Your Perfect Match

LLM Cost Calculator

Calculate AI Model Costs Accurately - Optimize Your Budget

LLM Arena

Multi-Model Real-Time Evaluation & Quick Output Comparison

Information

MCP Servers

Discover Popular AI-MCP Services - Find Your Perfect Match Instantly

MCP Client

Easy MCP Client Integration - Access Powerful AI Capabilities

MCP Case Tutorials

Master MCP Usage - From Beginner to Expert

MCP Ranking

Top MCP Service Performance Rankings - Find Your Best Choice

MCP Service Submission

Publish & Promote Your MCP Services

Tools

MCP Playground

Test MCP Services Freely - Quick Online Experience

MCP Inspector

Quick MCP Service Testing - Fast Deployment

GEO Services

Achieve Dominant Visibility in AI Search for Your Business or Brand with GEO Services

AI Search Visibility Checker

Detect brand's visibility on AI platforms

Tools

AI Model Compatibility Checker

Free PC Hardware Test for DeepSeek & Llama

Information

AI Dataset Collection

Large-scale datasets and benchmarks for training, evaluating, and testing models to measure

Tools

Intelligent Document Recognition

Comprehensive Text Extraction and Document Processing Solutions for Users

AI Tutorial

A Baidu lança o modelo Qianfan-VL, com modelos de diferentes tamanhos para atender às necessidades de diferentes cenários

AIbase基地

Publicado emNotícias e Informações de IA · 4 minutos de leitura · Sep 23, 2025

A equipe Qianfan da Baidu Cloud lançou oficialmente um novo modelo de compreensão visual —— Qianfan-VL, e o disponibilizou totalmente como código aberto! Essa série de modelos inclui três tamanhos diferentes: 3B, 8B e 70B, visando atender às necessidades de aplicações multimodais para empresas. Após otimização profunda, demonstram uma capacidade excepcional de compreensão visual.

O modelo Qianfan-VL não possui apenas habilidades básicas excelentes, mas também foi aprimorado para atender às demandas frequentes do setor, como reconhecimento óptico de caracteres (OCR) e aplicações em cenários educacionais, tornando-o mais eficaz no uso prático. Esse modelo foi desenvolvido com base em modelos de código aberto e realizou todo o processamento computacional na P800 Kunlun da Baidu, garantindo que o modelo possa processar dados e algoritmos complexos de forma eficiente graças à potente capacidade de cálculo.

Esse novo modelo tem três características notáveis. Primeiro, a escolha de múltiplos tamanhos permite que empresas e desenvolvedores de diferentes escalas encontrem soluções adequadas, os tamanhos 3B, 8B e 70B podem atender a diversas necessidades de aplicação. Segundo, os modelos 8B e 70B possuem capacidade de raciocínio, ativados por tokens especiais, podendo lidar com tarefas complexas como compreensão de gráficos, raciocínio visual e resolução de problemas matemáticos. Por fim, em OCR e compreensão de documentos, apresenta desempenho excelente, podendo identificar com precisão manuscritos e layouts complexos, bem como extrair informações estruturadas.

Nos testes de benchmark, a série de modelos Qianfan-VL demonstrou capacidades gerais excelentes e desempenho superior em tarefas específicas. Seja na compreensão visual ou em perguntas e respostas em áreas especializadas, esse modelo mostrou precisão e desempenho impressionantes em diversos testes. Em particular, na área de OCR e compreensão de documentos, sua capacidade de reconhecimento em todos os cenários e análise de documentos complexos fornece soluções de alta precisão para aplicações corporativas.

Além disso, a capacidade de resolver problemas matemáticos do Qianfan-VL também merece destaque, os modelos 8B e 70B demonstram desempenho superior ao lidar com tarefas de raciocínio complexo, combinando informações visuais e conhecimento externo. Em cenários práticos, ele pode extrair informações importantes e realizar análise de dados, ajudando as empresas a tomar decisões inteligentes.

O lançamento do Qianfan-VL marca uma grande conquista da Baidu na área de compreensão visual. Esperamos que sua aplicação prática em diversos setores provoque uma nova onda.

NovaspalavrasemIA BaiduIntelligentCloud Qianfan-VL Modelodecompreensãovisual

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily

Notícias de IA Relacionadas Recomendadas

Diário de AI: Gemini 3.0 Pro da Google lançado em pequena escala; A Eshi Technology concluiu uma financiamento de 1 bilhão de yuans na série B+; a Baidu lançou o modelo de análise de documentos PaddleOCR-VL

O Gemini 3.0 Pro da Google começa a ser enviado em pequena escala, reforçando as capacidades de raciocínio e multimídia, e está previsto para ser oficialmente lançado até o final do mês. A equipe do DeepMind está gradualmente fornecendo atualizações aos usuários, melhorando o desempenho da IA.

Oct 17, 2025

Jornal AI: ByteDance lança modelo de grande dimensão Doubao 1.6; A Aishitech conclui uma rodada de financiamento B+ de 100 milhões de yuans; a Baidu lança o modelo de análise de documentos PaddleOCR-VL

ByteDance lança modelo Doubao 1.6, primeiro doméstico com profundidade de pensamento ajustável, otimizando eficiência e qualidade, incluindo versão leve para empresas.....

Oct 17, 2025

A Baidu lança o modelo de análise de documentos PaddleOCR-VL, líder global, redefinindo o cenário da tecnologia OCR!

PaddleOCR-VL da Baidu, com 0.9B parâmetros, lidera o OmniBenchDoc V1.5 com 92.6 pontos. Reconhece texto, escrita manual, tabelas, fórmulas e gráficos com precisão.....

Oct 17, 2025

O modelo multimodal LLaVA-OneVision-1.5 totalmente aberto supera o Qwen2.5-VL

A comunidade open-source lançou o modelo multimodal LLaVA-OneVision-1.5, com avanços técnicos. Evoluiu em dois anos para processar imagens e vídeos, oferecendo arquitetura de treinamento eficiente e reprodutível.....

Oct 17, 2025

Strella recebe 14 milhões de dólares em financiamento para impulsionar a inovação na tecnologia de entrevistas de inteligência artificial e pesquisa de clientes

Strella, startup de IA para pesquisa de clientes, levantou US$14 milhões em Série A, liderado por Bessemer Venture Partners. Fundadoras com experiência em consultoria e produtos.....

Oct 17, 2025

Modelo de IA C2S-Scale 27B para Caminhos de Tratamento do Câncer desenvolvido em parceria com o Google DeepMind e a Universidade de Yale

Google DeepMind e Yale criaram o modelo C2S-Scale27B com 2,7B de parâmetros, baseado no Gemma, para analisar células e interações cancerígenas. Validado em células vivas, oferece novas abordagens terapêuticas.....

Oct 17, 2025

O Pinterest lança uma ferramenta de limitação de conteúdo de IA: os usuários podem personalizar a redução de imagens geradas por IA

Pinterest lança ferramenta para limitar conteúdo gerado por IA no feed, respondendo a críticas sobre excesso de imagens artificiais.....

Oct 17, 2025

Anthropic lança o sistema Claude Skills que suporta a criação automática de planilhas e apresentações e módulos personalizados

Anthropic lança sistema modular de 'habilidades' para o modelo Claude, transformando prompts complexos em componentes modulares e portáteis.....

Oct 17, 2025

Integração profunda do Claude com o Microsoft 365 Aumento da produtividade empresarial!

Anthropic lança conector para Microsoft 365, integrando Claude AI a aplicativos como SharePoint, Outlook e Teams para melhorar produtividade e comunicação.....

Oct 17, 2025

Thriller! Médico americano usa ferramentas de IA para pesquisar venenos, causando paralisia ao marido

Médica escolar nos EUA usou IA para envenenar marido, deixando-o paralítico. Caso destaca riscos do uso criminoso de inteligência artificial.....

Oct 16, 2025

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services​

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

A Baidu lança o modelo Qianfan-VL, com modelos de diferentes tamanhos para atender às necessidades de diferentes cenários

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

Diário de AI: Gemini 3.0 Pro da Google lançado em pequena escala; A Eshi Technology concluiu uma financiamento de 1 bilhão de yuans na série B+; a Baidu lançou o modelo de análise de documentos PaddleOCR-VL

Jornal AI: ByteDance lança modelo de grande dimensão Doubao 1.6; A Aishitech conclui uma rodada de financiamento B+ de 100 milhões de yuans; a Baidu lança o modelo de análise de documentos PaddleOCR-VL

A Baidu lança o modelo de análise de documentos PaddleOCR-VL, líder global, redefinindo o cenário da tecnologia OCR!

O modelo multimodal LLaVA-OneVision-1.5 totalmente aberto supera o Qwen2.5-VL

Strella recebe 14 milhões de dólares em financiamento para impulsionar a inovação na tecnologia de entrevistas de inteligência artificial e pesquisa de clientes

Modelo de IA C2S-Scale 27B para Caminhos de Tratamento do Câncer desenvolvido em parceria com o Google DeepMind e a Universidade de Yale

O Pinterest lança uma ferramenta de limitação de conteúdo de IA: os usuários podem personalizar a redução de imagens geradas por IA

Anthropic lança o sistema Claude Skills que suporta a criação automática de planilhas e apresentações e módulos personalizados

Integração profunda do Claude com o Microsoft 365 Aumento da produtividade empresarial!

Thriller! Médico americano usa ferramentas de IA para pesquisar venenos, causando paralisia ao marido

GEO Services