Classificação de Avaliação de Multimídia SuperCLUE para Agosto: Gemini-2.5-Pro em primeiro lugar

AIbase基地

Publicado emNotícias e Informações de IA · 2 minutos de leitura · Aug 29, 2025

No ranking do benchmark de modelo multimodal de linguagem visual chinês (SuperCLUE-VLM) lançado em 28 de agosto, o Gemini-2.5-Pro obteve a pontuação total de 74,99 e ficou em primeiro lugar, enquanto o GPT-5 (high) da OpenAI obteve 68,59 pontos e ficou em segundo lugar.

Esse benchmark foi construído com base nas características das cenas chinesas, envolvendo três dimensões principais: conhecimento básico, raciocínio visual e aplicação visual, visando fornecer padrões objetivos e justos para o desenvolvimento de modelos multimodais de linguagem visual.

O teste abrangeu 15 modelos multimodais, incluindo Claude-Opus-4.1, Gemini-2.5-Pro, GPT-5 (high), ERNIE-4.5-Turbo-VL, Doubao-Seed-1.6-thinking, hunyuan-t1-vision e Qwen-V1-Max-Latest, abrangendo os principais modelos nacionais e internacionais.

Finalmente, o Gemini-2.5-Pro obteve a pontuação total de 74,99 e ficou em primeiro lugar, enquanto o GPT-5 (high) da OpenAI obteve 68,59 pontos e ficou em segundo lugar. O ERNIE-4.5-Turbo-VL da Baidu ficou empatado com outros modelos nacionais, demonstrando uma forte competitividade no mercado.

SuperCLUE-VLM Gemini-2.5-Pro GPT-5 Modelo de Linguagem Multimídia

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily

Notícias de IA Relacionadas Recomendadas

A equipe de IA da Xiaomi se une à Pekin para publicar um novo artigo. A jovem gênio que o Lei Xun contratou com salário alto participou da pesquisa

Xiaomi e Universidade de Pequim publicaram artigo acadêmico no arXiv. A autora Luo Fuli, nascida em 1995, formada na Universidade Normal de Pequim, atua no Instituto de Linguística Computacional da Universidade de Pequim.....

Oct 17, 2025

Hospital Tsinghua Changgong e a Beijing Electronics & Digital Intelligence colaboram no desenvolvimento do primeiro modelo de grande porte em farmacologia nacional: foco na avaliação da segurança do uso de medicamentos em grupos populacionais especiais

O Hospital Tsinghua Changgong em Pequim colaborou com a Beijing Electronics & Digital Intelligence para desenvolver o primeiro modelo de grande porte voltado exclusivamente à farmacologia no país, utilizando a inteligência artificial para otimizar os processos farmacêuticos, aumentando a eficiência e precisão na avaliação da segurança dos medicamentos para grupos populacionais específicos, como idosos, crianças e mulheres grávidas, enfrentando os desafios da rápida atualização da informação sobre medicamentos e a complexidade das diferenças individuais.

Oct 17, 2025

A criação de música com IA se torna um trabalho complementar para programadores: o single ultrapassa 2 milhões de reproduções e a receita com direitos autorais chega a vários milhares de yuans

Em 2025, as ferramentas de criação de música com IA se tornam populares, mudando o cenário da indústria. Em janeiro, um jogador de Genshin Impact usou o Suno para criar uma música com 6,4 milhões de reproduções, gerando discussões sobre a capacidade de criação com IA. Programadores se tornaram um grupo ativo, com Yapie completando uma música temática em poucas horas usando várias ferramentas em março.

Oct 17, 2025

OpenAI suspende a geração de vídeo de Martin Luther King pela Sora para proteger a imagem de figuras históricas

OpenAI suspendeu geração de retratos de Martin Luther King Jr. pelo Sora após pedido da sua herança. Empresa enfatiza equilíbrio entre liberdade de expressão e controle de imagem por figuras públicas e famílias.....

Oct 17, 2025

Equipe de Li Feifei lança RTFM: geração em tempo real do mundo 3D com uma placa H100

Equipe de Fei-Fei Li lança modelo RTFM que gera e interage com mundos 3D em tempo real em uma única GPU H100, mantendo persistência, consistência 3D e efeitos como reflexos/sombras, avançando da teoria para aplicação prática.....

Oct 17, 2025

Uma frase muda o potencial de criação da IA: estudo descobre que dicas simples podem aumentar significativamente a diversidade na saída

Um grupo de universidades, incluindo a Stanford, propôs um método chamado "amostragem linguística", que pede ao modelo para gerar 5 respostas e suas probabilidades nas dicas, aumentando efetivamente a diversidade criativa na IA generativa. Este método é aplicável tanto a modelos de linguagem quanto a imagens, estimulando uma saída criativa mais rica.

Oct 17, 2025

Chongqing reforça a regulamentação e remove mais de 10 produtos de IA irregulares para garantir a segurança da tecnologia

Chongqing combate abuso de IA, retirando 10+ produtos ilegais como 'prescrições por IA'. Tecnologia traz riscos como desinformação e segurança de dados, reforçando a necessidade de regulamentação.....

Oct 17, 2025

Diário de AI: Gemini 3.0 Pro da Google lançado em pequena escala; A Eshi Technology concluiu uma financiamento de 1 bilhão de yuans na série B+; a Baidu lançou o modelo de análise de documentos PaddleOCR-VL

O Gemini 3.0 Pro da Google começa a ser enviado em pequena escala, reforçando as capacidades de raciocínio e multimídia, e está previsto para ser oficialmente lançado até o final do mês. A equipe do DeepMind está gradualmente fornecendo atualizações aos usuários, melhorando o desempenho da IA.

Oct 17, 2025

Jornal AI: ByteDance lança modelo de grande dimensão Doubao 1.6; A Aishitech conclui uma rodada de financiamento B+ de 100 milhões de yuans; a Baidu lança o modelo de análise de documentos PaddleOCR-VL

ByteDance lança modelo Doubao 1.6, primeiro doméstico com profundidade de pensamento ajustável, otimizando eficiência e qualidade, incluindo versão leve para empresas.....

Oct 17, 2025

A empresa de vídeo AI Aishitech concluiu uma rodada de financiamento B+ de 100 milhões de yuans: ARR ultrapassa 40 milhões de dólares e tem mais de 100 milhões de usuários

Aishitech concluiu rodada B+ de 100 milhões de yuans. Receita anual recorrente supera US$40 milhões, com 100 milhões de usuários registrados e 16 milhões de MAU. Crescimento de 10x desde novembro de 2024.....

Oct 17, 2025

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

Classificação de Avaliação de Multimídia SuperCLUE para Agosto: Gemini-2.5-Pro em primeiro lugar

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

A equipe de IA da Xiaomi se une à Pekin para publicar um novo artigo. A jovem gênio que o Lei Xun contratou com salário alto participou da pesquisa

Hospital Tsinghua Changgong e a Beijing Electronics & Digital Intelligence colaboram no desenvolvimento do primeiro modelo de grande porte em farmacologia nacional: foco na avaliação da segurança do uso de medicamentos em grupos populacionais especiais

A criação de música com IA se torna um trabalho complementar para programadores: o single ultrapassa 2 milhões de reproduções e a receita com direitos autorais chega a vários milhares de yuans

OpenAI suspende a geração de vídeo de Martin Luther King pela Sora para proteger a imagem de figuras históricas

Equipe de Li Feifei lança RTFM: geração em tempo real do mundo 3D com uma placa H100

Uma frase muda o potencial de criação da IA: estudo descobre que dicas simples podem aumentar significativamente a diversidade na saída

Chongqing reforça a regulamentação e remove mais de 10 produtos de IA irregulares para garantir a segurança da tecnologia

Diário de AI: Gemini 3.0 Pro da Google lançado em pequena escala; A Eshi Technology concluiu uma financiamento de 1 bilhão de yuans na série B+; a Baidu lançou o modelo de análise de documentos PaddleOCR-VL

Jornal AI: ByteDance lança modelo de grande dimensão Doubao 1.6; A Aishitech conclui uma rodada de financiamento B+ de 100 milhões de yuans; a Baidu lança o modelo de análise de documentos PaddleOCR-VL

A empresa de vídeo AI Aishitech concluiu uma rodada de financiamento B+ de 100 milhões de yuans: ARR ultrapassa 40 milhões de dólares e tem mais de 100 milhões de usuários

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services​

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

Classificação de Avaliação de Multimídia SuperCLUE para Agosto: Gemini-2.5-Pro em primeiro lugar

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

A equipe de IA da Xiaomi se une à Pekin para publicar um novo artigo. A jovem gênio que o Lei Xun contratou com salário alto participou da pesquisa

Hospital Tsinghua Changgong e a Beijing Electronics & Digital Intelligence colaboram no desenvolvimento do primeiro modelo de grande porte em farmacologia nacional: foco na avaliação da segurança do uso de medicamentos em grupos populacionais especiais

A criação de música com IA se torna um trabalho complementar para programadores: o single ultrapassa 2 milhões de reproduções e a receita com direitos autorais chega a vários milhares de yuans

OpenAI suspende a geração de vídeo de Martin Luther King pela Sora para proteger a imagem de figuras históricas

Equipe de Li Feifei lança RTFM: geração em tempo real do mundo 3D com uma placa H100

Uma frase muda o potencial de criação da IA: estudo descobre que dicas simples podem aumentar significativamente a diversidade na saída

Chongqing reforça a regulamentação e remove mais de 10 produtos de IA irregulares para garantir a segurança da tecnologia

Diário de AI: Gemini 3.0 Pro da Google lançado em pequena escala; A Eshi Technology concluiu uma financiamento de 1 bilhão de yuans na série B+; a Baidu lançou o modelo de análise de documentos PaddleOCR-VL

Jornal AI: ByteDance lança modelo de grande dimensão Doubao 1.6; A Aishitech conclui uma rodada de financiamento B+ de 100 milhões de yuans; a Baidu lança o modelo de análise de documentos PaddleOCR-VL

A empresa de vídeo AI Aishitech concluiu uma rodada de financiamento B+ de 100 milhões de yuans: ARR ultrapassa 40 milhões de dólares e tem mais de 100 milhões de usuários

GEO Services