Notícias de IA

Não perca nenhum momento da inovação global em IA

IA Diário

Tendências diárias da indústria de IA em três minutos

Linha do Tempo da IA

Marcos da indústria de IA

Al hardware

lista todos os produtos de hardware AI.

Guia de Monetização de IA

Casos Recentes

Compartilhamento de casos de monetização de IA

Coleção de Imagens

Casos de monetização de criação de imagens por IA

Coleção de Vídeos

Casos de monetização de criação de vídeos por IA

Coleção de Áudios

Casos de monetização de criação de áudios por IA

Coleção de Conteúdo

Casos de monetização de escrita de conteúdo por IA

Tutoriais de IA

Tutoriais Recentes

Compartilhamento gratuito dos tutoriais de IA mais recentes

Rankings de Produtos de IA

Ranking de Produtos de IA

Mostra o ranking total de visitas de sites de IA

Ranking de Crescimento de Tráfego de IA

Rastreia os sites de IA de crescimento mais rápido por tráfego

Ranking de Queda de Tráfego de IA

Foco em sites de IA com quedas significativas de tráfego

Ranking Semanal de IA

Mostra o ranking semanal de visitas de sites de IA

Rankings de Países Populares

Estados Unidos

Sites de IA mais populares entre os usuários dos EUA

China

Sites de IA mais populares entre os usuários chineses

Índia

Sites de IA mais populares entre os usuários indianos

Brasil

Sites de IA mais populares entre os usuários brasileiros

Rankings de Categorias Populares

Geração de Imagens

Ranking total de visitas de sites de geração de imagens de IA

Assistente Pessoal

Ranking total de visitas de sites de assistentes pessoais de IA

Geração de Personagens

Ranking total de visitas de sites de geração de personagens de IA

Geração de Vídeos

Ranking total de visitas de sites de geração de vídeos de IA

Rankings de Dados de Código Aberto Populares

Ranking de Projetos de IA

Projetos de IA populares no GitHub por total de estrelas

Ranking de Crescimento de Projetos de IA

Projetos de IA populares no GitHub por taxa de crescimento

Ranking de Desenvolvedores de IA

Ranking de desenvolvedores de IA populares no GitHub

Ranking de Organizações de IA

Ranking de organizações de IA populares no GitHub

Categorias de Código Aberto Populares

Deepseek

Projetos de código aberto Deepseek populares no GitHub

TTS

Projetos de código aberto TTS populares no GitHub

LLM

Projetos de código aberto LLM populares no GitHub

ChatGPT

Projetos de código aberto ChatGPT populares no GitHub

Biblioteca de Projetos de Código Aberto de IA

Visão Geral

Visão geral dos projetos de código aberto de IA populares no GitHub

Biblioteca de produtos Navegação de ferramentas MCP

Novo método de prompt visual SoM aprimora a precisão e o detalhamento do GPT-4V

站长之家

Publicado emNotícias e Informações de IA · 2 minutos de leitura · Oct 23, 2023

Novo método de prompt visual melhora o desempenho do GPT-4V

Pesquisadores apresentaram um novo método de prompt visual chamado SoM, que aprimora o desempenho do modelo multimodal GPT-4V da OpenAI em tarefas visuais de grão fino. O SoM utiliza um modelo de segmentação interativo para dividir a imagem em diferentes regiões e adicionar marcadores a cada uma delas. Dessa forma, o GPT-4V consegue entender melhor os objetos e as relações espaciais na imagem, superando o desempenho de modelos especializados e outros modelos multimodais de código aberto em diversas tarefas visuais. Esta pesquisa demonstra o potencial do GPT-4V em tarefas visuais de grão fino.

GPT-4V Prompt Visual Modelo Multimodal

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily

Notícias de IA Relacionadas Recomendadas

Qwen VLo, o modelo de compreensão e geração multimodal unificado da Tongyi Qianwen

Recentemente, o modelo de linguagem multimodal Qwen VLo foi oficialmente lançado, alcançando avanços significativos na compreensão e geração de conteúdo de imagem, oferecendo aos usuários uma nova experiência de criação visual. Segundo informações divulgadas, o Qwen VLo realizou uma atualização abrangente com base nas vantagens dos modelos anteriores da série Qwen-VL. Esse modelo não apenas consegue entender claramente o "mundo", mas também pode realizar uma recriação de alta qualidade com base em essa compreensão, realmente realizando uma transição da percepção para a geração. Os usuários agora podem acessar o Qwen Chat (chat.qwen.ai)

Jun 28, 2025

Grande! O primeiro modelo de grande escala de código aberto para o oceano da China, Cangyuan, é lançado, ajudando a impulsionar a era da inteligência marinha!

O primeiro modelo de grande escala de código aberto no setor marinho da China, OceanGPT (Cangyuan), foi oficialmente lançado em Hangzhou, Zhejiang. Esse resultado inovador foi liderado pelo Laboratório Nacional de Tecnologia de Percepção Precisa do Mar da Universidade de Zhejiang, marcando um importante passo na área de tecnologia marinha da China. O OceanGPT possui a capacidade básica de responder perguntas sobre conhecimentos marinhos, podendo interpretar dados multimodais como imagens sonar e mapas de observação marinha através de linguagem natural. Essa capacidade permite que o OceanGPT se destaque ao lidar com dados marinhos complexos. Esse modelo também adota

Jun 27, 2025

460

Diário de IA de 27 de junho: Tencent libera o modelo Mistral-A13B leve; Ke Ling AI lança função de efeito sonoro para vídeo

Bem-vindo ao programa AIbase 【Diário de IA】! Três minutos por dia para conhecer os principais eventos do dia em IA, ajudando-o a compreender as tendências da indústria de IA e aplicações inovadoras de produtos de IA. Para mais notícias sobre IA, acesse: https://www.aibase.com/zh1. Modelo Mistral-A13B leve da Tencent 1 placa de GPU de médio ou baixo desempenho pode ser implantado A Tencent lançou um novo membro da família de modelos Mistral, o modelo Mistral-A13B, que utiliza uma arquitetura Mistral (MoE), com um tamanho total de parâmetros de 80 bilhões, e parâmetros ativos de 13 bilhões.

Jun 27, 2025

O modelo de grande escala Huan Yuan-A13B da Tencent é aberto e pode ser implantado com uma única placa de GPU de gama média

A Tencent lançou oficialmente e abriu o novo membro da família de modelos grandes Huan Yuan - o modelo Huan Yuan-A13B. Este modelo utiliza uma arquitetura baseada em Mixture of Experts (MoE), com um tamanho total de parâmetros de 80 bilhões, sendo 13 bilhões de parâmetros ativos. Ele mantém o desempenho dos modelos de código aberto de ponta, ao mesmo tempo reduzindo significativamente a latência de inferência e os custos computacionais, oferecendo assim uma solução mais econômica para desenvolvedores individuais e pequenas e médias empresas.

Jun 27, 2025

OpenAI lança novo modelo da API Deep Research: o3/o4-mini-deep research

Jun 27, 2025

Notícia importante! Google libera o modelo multimídia Gemma3n de código aberto, que pode funcionar em dispositivos móveis com desempenho de inteligência artificial da nuvem

Jun 27, 2025

FLUX.1 Kontext [dev] da Black Forest impressiona com código aberto: edição de imagem comparável ao GPT-4o

A Black Forest Labs anunciou oficialmente que seu novo modelo de edição de imagem FLUX.1Kontext [dev] agora está com código aberto, gerando grande atenção na comunidade de IA. Este modelo, o mais recente membro da série FLUX.1, é elogiado por suas poderosas capacidades de edição de imagem e desempenho eficiente, sendo considerado uma alternativa de código aberto comparável ao GPT-4o. O FLUX.1Kontext [dev] baseia-se em uma arquitetura de transformador de coincidência de fluxo com 1,2 bilhão de parâmetros, projetada especificamente para tarefas de edição de imagem e suporta hardware de uso pessoal.

Jun 27, 2025

Atualização importante da OpenAI: API do modelo de pesquisa aprofundada está disponível, função de busca em páginas da web reduzida significativamente

A OpenAI anunciou oficialmente o acesso à API do seu modelo de pesquisa aprofundada, oferecendo aos desenvolvedores um conjunto poderoso de ferramentas, incluindo pesquisa automática em páginas da web, análise de dados, MCP (Protocolo de Comunicação de Modelos) e execução de código. Os modelos disponibilizados incluem as versões de pesquisa aprofundada do o3 e o4-mini, que já estavam em uso no ChatGPT, agora os desenvolvedores podem chamá-los diretamente por meio da API. Esses modelos são especialmente adequados para tarefas complexas que exigem obtenção de informações atualizadas e raciocínio avançado. Em termos de expansão de funcionalidades, o3,

Jun 27, 2025

O recurso de código aberto chegou! FLUX.1 Kontext [dev] desafia o GPT-4o e entra em uma nova era de edição de imagens

Jun 27, 2025

New Oriental lança seu primeiro produto educacional de IA original - New Oriental AI 1x1, revolucionando o modelo tradicional de estudo

A New Oriental anunciou oficialmente hoje seu primeiro produto educacional de IA original voltado para consumidores - o New Oriental AI 1x1, que não é apenas uma grande ruptura nos métodos de ensino, mas também marca um passo crucial na estratégia de posicionamento da New Oriental em "educação + IA". A principal força competitiva do New Oriental AI 1x1 é oferecer uma experiência de aprendizagem 1x1 com interação frequente. O professor de IA consegue realmente reproduzir o cenário de aprendizagem, realizando interações reais e perguntas e respostas verdadeiras. Além disso, o professor de IA possui paciência, responsabilidade, domina o ensino e pode fornecer feedbacks imediatos, além de elogios e motivação aos alunos.

Jun 26, 2025