Diário de AI: Gemini 3.0 Pro da Google lançado em pequena escala; A Eshi Technology concluiu uma financiamento de 1 bilhão de yuans na série B+; a Baidu lançou o modelo de análise de documentos PaddleOCR-VL

站长之家

Publicado emNotícias e Informações de IA · 11 minutos de leitura · Oct 17, 2025

Bem-vindo ao programa "AI Daily"! Aqui é o seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os conteúdos mais recentes do setor de IA, focando nos desenvolvedores, ajudando-o a compreender as tendências tecnológicas e conhecer as aplicações inovadoras de produtos de IA.

Produtos de IA novos Clique para saber mais:https://app.aibase.com/zh

1. O Gemini 3.0 Pro da Google começa a ser distribuído em pequena escala: capacidade de raciocínio aprimorada, lançamento oficial pode ocorrer até o final do mês

A equipe do DeepMind da Google começou a distribuir o modelo Gemini 3.0 Pro para alguns usuários. Esse modelo tem melhorias nas capacidades de raciocínio e processamento multimídia e está planejado para ser oficialmente lançado no final deste mês.

【Resumo da AiBase:】
🧠 O Gemini 3.0 Pro introduz uma arquitetura de raciocínio Deep Think, melhorando a capacidade de lidar com tarefas complexas de múltiplas etapas.
🌐 Suporta vários formatos de entrada, como texto, imagem, áudio e vídeo, podendo gerar código completo de front-end.
🚀 A Google planeja lançar uma versão leve chamada Flash, atendendo às necessidades de dispositivos móveis e cálculo nas bordas.

2. Baidu lança o modelo PaddleOCR-VL, líder mundial na análise de documentos, redefinindo o cenário da tecnologia OCR!

O modelo PaddleOCR-VL lançado pela Baidu se destaca na área de análise de documentos, tornando-se um novo padrão na tecnologia OCR graças à sua eficiência, suporte a múltiplos idiomas e alta precisão na identificação.

【Resumo da AiBase:】
🌍 Suporta 109 idiomas, adequado para várias tarefas de processamento de documentos.
⚙️ Parâmetros principais são apenas 0,9B, permitindo cálculos eficientes e identificação precisa.
🚀 A velocidade de inferência foi significativamente melhorada, superando outros modelos principais.

3. A empresa de vídeos de IA Aishitech completa financiamento de 100 milhões de yuans na rodada B+: ARR ultrapassa 40 milhões de dólares, usuários acima de 100 milhões

A Aishitech alcançou avanços notáveis no campo de geração de vídeos de IA, completando o financiamento de 100 milhões de yuans na rodada B+ e atingindo marcos importantes, como ultrapassar o ARR de 40 milhões de dólares e ter mais de 100 milhões de usuários registrados. Sua estratégia de produto e inovação tecnológica oferecem forte competitividade ao mercado.

【Resumo da AiBase:】
🚀 A Aishitech completou o financiamento B+ de 100 milhões de yuans, mostrando o reconhecimento e apoio do mercado de capital.
📈 Receita anual recorrente (ARR) ultrapassou 40 milhões de dólares, com mais de 100 milhões de usuários.
💡 Inovações tecnológicas contínuas, a versão PixVerse V5 melhora a eficiência de geração e a qualidade dos vídeos, introduzindo a função de assistente de criação por Agent.

4. Anthropic lança a funcionalidade 'skills' do Claude: aumentando a eficiência do trabalho com IA

A Anthropic lançou uma nova funcionalidade chamada 'skills' para o Claude AI, visando aumentar a utilidade da IA em cenários de trabalho. Essa funcionalidade fornece instruções, scripts e recursos em formato de pasta, permitindo que o Claude processe tarefas específicas de forma mais eficiente, como documentos Excel ou diretrizes da marca. Os usuários também podem criar habilidades personalizadas e usá-las em várias plataformas. Essa funcionalidade corresponde ao AgentKit da OpenAI, marcando um passo adiante na indústria de IA em direção à praticidade.

【Resumo da AiBase:】
🌟 A Anthropic lançou a funcionalidade 'skills' do Claude, aumentando a utilidade da IA no trabalho.
🛠️ Os usuários podem criar habilidades personalizadas, para que o Claude se adapte melhor a cenários específicos de trabalho.
🚀 Essa iniciativa coincide com os novos recursos lançados pela OpenAI, como o AgentKit, indicando que a indústria de IA continua se movendo em direção à praticidade.

5. A Pinterest lança ferramenta de controle de conteúdo de IA: os usuários podem personalizar a redução de imagens geradas por IA

A Pinterest lançou uma nova ferramenta de controle de conteúdo, permitindo que os usuários limitem a proporção de conteúdo gerado por IA em sua linha do tempo, em resposta à insatisfação dos usuários. A plataforma introduziu rótulos de modificação de IA e ofereceu configurações escolhidas pelos usuários, tentando equilibrar inovação de IA e experiência do usuário.

【Resumo da AiBase:】
🖼️ Os usuários podem personalizar a redução da exibição de imagens geradas por IA.
🤖 A Pinterest introduziu rótulos de modificação de IA para identificar conteúdo gerado por IA.
🌐 A Pinterest busca um equilíbrio entre tecnologia de IA e experiência do usuário.

6. LLaVA-OneVision-1.5, modelo multissensorial totalmente aberto, supera o modelo Qwen2.5-VL

LLaVA-OneVision-1.5 é um modelo multissensorial aberto, capaz de lidar com diferentes entradas, como imagens e vídeos, e se destacou em diversos testes de benchmark, superando o modelo Qwen2.5-VL.

【Resumo da AiBase:】
🧠 O LLaVA-OneVision-1.5 é um novo modelo multissensorial, capaz de lidar com diferentes formas de entrada, como imagens e vídeos.
📈 O processo de treinamento divide-se em três etapas, visando melhorar eficientemente a capacidade de compreensão visual e linguística do modelo.
🏆 No benchmarking, o LLaVA-OneVision-1.5 se saiu bem, superando o modelo Qwen2.5-VL.
Detalhes: https://github.com/EvolvingLMMs-Lab/LLaVA-OneVision-1.5 https://huggingface.co/lmms-lab/LLaVA-OneVision-1.5-8B-Instruct

7. Modelo de geração de vídeo da OpenAI Sora 2 entra na plataforma Microsoft Azure: preço de US$ 0,1 por segundo, entra na fase de pré-visualização pública

A Microsoft anunciou que o modelo de geração de vídeo Sora 2 da OpenAI está disponível na versão internacional do Azure AI Foundry, entrando na fase de pré-visualização pública, marcando o início da aplicação comercial de ferramentas de IA generativa de vídeo.

【Resumo da AiBase:】
🎥 O Sora2 é um modelo de geração de vídeo multimídia, suportando entrada de texto, imagem e vídeo para gerar novos conteúdos de vídeo.
💰 Preço de US$ 0,1 por segundo, usando um modelo de cobrança por duração de geração, adequado para uso em massa por usuários corporativos.
🌐 O Sora2 está disponível apenas na versão internacional do Azure AI Foundry, os usuários da China não conseguem acessá-lo diretamente no momento.

8. O buscador de viagens Kayak lança modo "AI": planejamento e reserva de viagens mais fáceis

A Kayak lançou um novo "modo AI", que ajuda os usuários a pesquisar, planejar e reservar viagens através de um chatbot integrado. Essa funcionalidade usa a tecnologia ChatGPT para fornecer resultados de pesquisa com mais contexto e suporta perguntas abertas para obter sugestões de viagem.

【Resumo da AiBase:】
🌍 A Kayak lançou o "modo AI", permitindo que os usuários planejem e reservem viagens facilmente por meio de um chatbot.
🗣️ Essa funcionalidade permite fazer perguntas sobre sugestões de viagem e comparar serviços de viagem, fornecendo informações precisas com a tecnologia ChatGPT.
📅 O "modo AI" inicialmente suporta apenas inglês, mas será expandido para mais idiomas e plataformas posteriormente, incluindo funções de solicitação por voz.

O time VitaBench da LongCat da Meituan apresenta: um novo padrão de avaliação para agentes inteligentes

O time LongCat da Meituan apresenta o padrão VitaBench para avaliação de agentes inteligentes, focando em cenários de vida frequentes como pedidos de entrega, refeições em restaurantes e viagens turísticas. Esse padrão constrói um ambiente de interação com 66 ferramentas, abrangendo operações complexas como compra de ingressos e reservas, fornecendo uma infraestrutura importante para o desenvolvimento de agentes inteligentes em cenários reais.

Nexos.ai, uma nova estrela da IA na Europa, obtém 30 milhões de euros em financiamento para ajudar as empresas a adotar com segurança a IA

A empresa de startups de IA lituana Nexos.ai completou uma rodada de financiamento sêxtupla de 30 milhões de euros, liderada pelo Index Ventures e pelo Evantic Capital. A empresa se dedica a ajudar as empresas a adotar com segurança ferramentas de IA, resolvendo os riscos de vazamento de dados que podem surgir quando os funcionários usam modelos de linguagem grandes.

Diário de IA: Alibaba Quark revela o Projeto C; Veo 3.1 adicionará funcionalidades de edição precisa de vídeo; Anthropic lança versão web do Claude Code

A Alibaba Quark lançou o 'Projeto C', expandindo seu foco em aplicações de IA de conversa, visando diretamente o Dou Bao da ByteDance, com o objetivo de fortalecer sua competição no negócio de IA. Este projeto se concentra nos desenvolvedores, promovendo tendências tecnológicas e aplicações de produtos inovadores, ajudando os usuários a compreenderem melhor as dinâmicas do campo de IA.

Vídeo de uma só vez! O Google Veo 3.1 vai lançar uma função de edição precisa de vídeo, tão realista que é difícil distinguir o falso do verdadeiro

O Google Veo3.1 apresenta uma função revolucionária de "edição precisa", que permite adicionar ou remover elementos de vídeo facilmente, mantendo a integridade e a autenticidade original do vídeo. Esta tecnologia é capaz de lidar com detalhes complexos, como sombras e interações ambientais, oferecendo aos criadores maior liberdade e impulsionando a transformação da IA de vídeo de geração para pós-produção profissional, alcançando otimização completa.

O mercado de IaaS de IA da China no primeiro semestre de 2025 atinge 19,87 bilhões de yuans, crescendo 122,4% em relação ao ano anterior

Relatório da IDC mostra que o mercado de IaaS de IA da China no primeiro semestre de 2025 atinge 19,87 bilhões de yuans, aumentando drasticamente 122,4%. Entre eles, o IaaS de IA Generativa se destaca, com um valor de 16,68 bilhões de yuans e crescimento de 219,3%; enquanto o mercado de IaaS de outras tecnologias de IA diminui em 14,1% para 3,19 bilhões de yuans. Os provedores de nuvem continuam a investir fortemente em infraestrutura de IA.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

Diário de AI: Gemini 3.0 Pro da Google lançado em pequena escala; A Eshi Technology concluiu uma financiamento de 1 bilhão de yuans na série B+; a Baidu lançou o modelo de análise de documentos PaddleOCR-VL

站长之家

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

Surpresa! O CEO da Vercel diz que o Kimi K2 superou o GPT-5 em precisão em 50% nas aplicações de IA!

Poe lança função de classificação, atualizações em tempo real sobre o sucesso de modelos de IA e aplicativos populares

Competição de investimento com modelos de IA! O DeepSeek obteve ganhos de mais de 14%, enquanto o Gemini 2.5 Pro sofreu uma perda de quatro décimos

O Google AI Research apresenta DeepSomatic: Modelo de identificação de variações genéticas em células cancerosas

O time VitaBench da LongCat da Meituan apresenta: um novo padrão de avaliação para agentes inteligentes

Nexos.ai, uma nova estrela da IA na Europa, obtém 30 milhões de euros em financiamento para ajudar as empresas a adotar com segurança a IA

Diário de IA: Alibaba Quark revela o Projeto C; Veo 3.1 adicionará funcionalidades de edição precisa de vídeo; Anthropic lança versão web do Claude Code

Vídeo de uma só vez! O Google Veo 3.1 vai lançar uma função de edição precisa de vídeo, tão realista que é difícil distinguir o falso do verdadeiro

Dicionário Youdao AI de Tradução Simultânea ultrapassa 20 milhões de usuários

O mercado de IaaS de IA da China no primeiro semestre de 2025 atinge 19,87 bilhões de yuans, crescendo 122,4% em relação ao ano anterior

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services​

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

Diário de AI: Gemini 3.0 Pro da Google lançado em pequena escala; A Eshi Technology concluiu uma financiamento de 1 bilhão de yuans na série B+; a Baidu lançou o modelo de análise de documentos PaddleOCR-VL

站长之家

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

Surpresa! O CEO da Vercel diz que o Kimi K2 superou o GPT-5 em precisão em 50% nas aplicações de IA!

Poe lança função de classificação, atualizações em tempo real sobre o sucesso de modelos de IA e aplicativos populares

Competição de investimento com modelos de IA! O DeepSeek obteve ganhos de mais de 14%, enquanto o Gemini 2.5 Pro sofreu uma perda de quatro décimos

O Google AI Research apresenta DeepSomatic: Modelo de identificação de variações genéticas em células cancerosas

O time VitaBench da LongCat da Meituan apresenta: um novo padrão de avaliação para agentes inteligentes

Nexos.ai, uma nova estrela da IA na Europa, obtém 30 milhões de euros em financiamento para ajudar as empresas a adotar com segurança a IA

Diário de IA: Alibaba Quark revela o Projeto C; Veo 3.1 adicionará funcionalidades de edição precisa de vídeo; Anthropic lança versão web do Claude Code

Vídeo de uma só vez! O Google Veo 3.1 vai lançar uma função de edição precisa de vídeo, tão realista que é difícil distinguir o falso do verdadeiro

Dicionário Youdao AI de Tradução Simultânea ultrapassa 20 milhões de usuários

O mercado de IaaS de IA da China no primeiro semestre de 2025 atinge 19,87 bilhões de yuans, crescendo 122,4% em relação ao ano anterior

GEO Services