Bem-vindo ao programa "Diário de IA"! Aqui é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias, apresentamos para você os conteúdos mais recentes do setor de IA, focando nos desenvolvedores, ajudando-o a compreender as tendências tecnológicas e conhecer aplicações inovadoras de produtos de IA.
Produtos de IA novos clicar para obter mais informações:https://top.aibase.com/
1. A Kunlun Wanyi lança oficialmente o modelo SkyReels-A3: fotos podem sincronizar com o áudio
O modelo SkyReels-A3 da empresa Kunlun Wanyi é baseado no modelo de difusão de vídeo DiT, permitindo a criação de personagens digitais conduzidas por áudio. Esse modelo permite que pessoas em imagens ou vídeos estáticos falem ou cantem de acordo com o conteúdo do áudio, e suporta mudanças nas falas e controle de câmera, oferecendo soluções tecnológicas eficientes e convenientes para anúncios, transmissões ao vivo e vídeos musicais.
【Resumo da AiBase:】
📷 O SkyReels-A3 pode transformar pessoas em imagens ou vídeos estáticos em performances dinâmicas com base no áudio.
🎥 Suporta saídas de vídeo de até 60 segundos por cena, e suporta múltiplas cenas com duração ilimitada, atendendo às diferentes necessidades criativas.
🔄 Oferece 8 parâmetros de câmera pré-definidos, ajustáveis em intensidade, proporcionando efeitos profissionais de câmera.
Link detalhado: https://skyworkai.github.io/skyreels-a3.github.io/
2. A xAI, de Musk, anuncia que o modelo de IA Grok 4 será gratuito para sempre
A empresa xAI anunciou que o modelo de inteligência artificial Grok4 estará disponível gratuitamente para usuários globais, fornecendo ferramentas avançadas de IA.
【Resumo da AiBase:】
🤖 O modelo de inteligência artificial Grok4 estará disponível gratuitamente para usuários globais.
⚙️ Oferece modos Auto e Expert, atendendo às diferentes necessidades dos usuários.
🌐 A disponibilidade gratuita pode impulsionar a divulgação e aplicação da tecnologia de IA.
3. A Open AI lança um guia de palavras-chave para o GPT-5: desbloqueie uma nova fronteira de programação e multimídia
O artigo explica detalhadamente o modelo GPT-5 da Open AI e seu guia oficial de palavras-chave, destacando melhorias em tarefas complexas, programação e interação multimídia. O guia fornece estratégias de otimização, como ajustar a força do raciocínio, controlar a inclinação de comportamento do agente e usar introduções de ferramentas, ajudando os usuários a maximizar o potencial do GPT-5.
【Resumo da AiBase:】
🧠 O GPT-5 melhorou o desempenho em tarefas de agentes, geração de código e seguimento de instruções com um design preciso de palavras-chave.
💻 Suporta a geração de interfaces front-end, depuração de grandes bases de código e combinação com a API Responses para aumentar a eficiência na geração de código.
🖼️ Introduziu funcionalidades de interação multimídia, incluindo processamento de texto, imagem e voz, bem como configurações personalizadas, aumentando sua utilidade.
Detalhes: https://cookbook.openai.com/examples/gpt-5/gpt-5_prompting_guide
4. A pesquisa do Baidu no PC tem totalmente acesso à função de busca de IA
A pesquisa do Baidu no PC tem totalmente acesso a uma série de funções de IA, transformando a entrada tradicional de informações em um centro de tarefas. Os módulos "caixa dupla inteligente super" e "área de trabalho" adicionados integraram ferramentas de leitura de IA, escrita de IA e PPT de IA, melhorando a eficiência de busca e a experiência de trabalho dos usuários. Além disso, o número de usuários ativos mensais da busca de IA do Baidu ultrapassou 322 milhões, mantendo-se em primeiro lugar no setor de busca de IA doméstica.
【Resumo da AiBase:】
🧠 A pesquisa do Baidu no PC tem totalmente acesso às funções de IA, melhorando a experiência de busca dos usuários.
🛠️ O novo módulo "área de trabalho" integra ferramentas de leitura, escrita e PPT de IA.
📈 Usuários ativos mensais atingiram 322 milhões, o Baidu lidera o setor de busca de IA nacional.
5. O Windows 11 Copilot adota gratuitamente o GPT-5, com restrições de uso muito menores do que o ChatGPT
A Microsoft anunciou que o aplicativo Copilot nos sistemas Windows 11 e Windows 10 agora suporta o modo inteligente GPT-5. Essa função é implementada por meio da tecnologia de roteamento Web, permitindo que os usuários ativem o modo inteligente sem atualizações, e as restrições de uso são mais flexíveis do que as do ChatGPT.
【Resumo da AiBase:】
🌟 O Copilot agora suporta o modo inteligente GPT-5, oferecendo uma experiência de usuário mais fluida.
💬 Em comparação com o ChatGPT, as restrições de uso do Copilot são mais flexíveis, aumentando a liberdade.
🖥️ Os usuários podem acessar gratuitamente o Copilot e o GPT-5 por meio de etapas simples, facilitando o acesso à informação.
6. Superação da OpenAI! O modelo médico Baichuan-M2 da Baichuan Intelligence se torna o líder global
O modelo de grande dimensão médico aberto Baichuan-M2 da Baichuan Intelligence obteve 60,1 pontos na avaliação HealthBench, superando o modelo gpt-oss120b da OpenAI e liderando outros modelos de grande dimensão abertos internacionalmente. Após processamento extremamente leve, o modelo pode ser implantado em uma única placa, reduzindo significativamente os custos para instituições médicas. Além disso, a capacidade de resolver problemas médicos complexos do Baichuan-M2 é equivalente à do GPT-5, demonstrando um forte potencial de aplicação.
【Resumo da AiBase:】
🌟 O Baichuan-M2 obteve 60,1 pontos na avaliação HealthBench, tornando-se o modelo médico aberto líder global.
💡 O modelo foi tratado com leveza, podendo ser implantado em uma única placa, reduzindo significativamente os custos para instituições médicas.
🚀 A capacidade do Baichuan-M2 em lidar com problemas médicos complexos é equivalente à do GPT-5, possuindo um amplo potencial de aplicação.
Detalhes: https://huggingface.co/baichuan-inc/Baichuan-M2-32B
7. A Apple anuncia que o GPT5 entrará no iOS 26: o iOS 26 integrará o ChatGPT5
A Apple anunciou que integrará o modelo ChatGPT-5 no sistema iOS 26, que será lançado no próximo mês. Isso melhorará significativamente o desempenho do Apple Intelligence e trará uma série de novos recursos, como tradução em tempo real e otimização de pesquisa de conteúdo. Os usuários poderão usar esses recursos sem uma conta da OpenAI, mas associar uma conta dará acesso a mais benefícios.
【Resumo da AiBase:】
🧠 O ChatGPT-5 será integrado ao iOS 26, melhorando o desempenho do Apple Intelligence.
🌐 Novo recurso de tradução em tempo real, melhorando a experiência de comunicação entre idiomas.
💰 Associar uma conta da OpenAI dará acesso a ofertas de assinatura, proporcionando mais opções.
8. A Google lança BlenderFusion: um novo framework revolucionário para edição e geração de visão 3D
A Google lançou o BlenderFusion, um framework inovador destinado a melhorar as capacidades de edição e geração de visão 3D, fornecendo ferramentas intuitivas e eficientes para designers e criadores.
【Resumo da AiBase:】
🎨 O BlenderFusion integra ferramentas avançadas de edição 3D e modelos de difusão, realizando eficientemente a edição e geração de visão 3D.
🛠️ O fluxo de trabalho do framework inclui três etapas: camadas, edição e composição, permitindo que os usuários editem objetos 3D e gerem imagens finais facilmente.
📈 A Google's BlenderFusion, ao otimizar o modelo, melhorou a capacidade de lidar com cenários complexos, ajudando designers a realizar suas criatividades.
Detalhes: https://blenderfusion.github.io/
9. O modelo TTS pequeno Kitten TTS: apenas 15 milhões de parâmetros
O Kitten TTS é um modelo de texto para fala (TTS) de baixo peso, com apenas 15 milhões de parâmetros e volume inferior a 25 MB, adequado para implantação em diversos dispositivos. Ele suporta execução sem GPU e pode realizar síntese de voz de alta qualidade em CPUs comuns, fornecendo guias simples de instalação e uso, facilitando que os usuários comecem rapidamente.
【Resumo da AiBase:】
🐱 O Kitten TTS é um modelo TTS de baixo peso, com volume inferior a 25 MB, adequado para diversos dispositivos.
⚡ O modelo suporta execução sem GPU, garantindo que os usuários possam realizar síntese de voz de alta qualidade em CPUs comuns.
🚀 O Kitten TTS já fornece guias simples de instalação e uso, permitindo que os usuários iniciem rapidamente e gerem áudio.
Detalhes: https://huggingface.co/KittenML/kitten-tts-nano-0.1
10. O modelo visual MiniCPM-V 4.0, mais fluido no dispositivo móvel
O MiniCPM-V 4.0, a versão mais recente da série MiniCPM-V, destaca-se em compreensão visual, processamento de várias imagens e vídeos, obtendo uma pontuação alta de 69,0 na avaliação OpenCompass, superando vários modelos concorrentes. Desenhado especificamente para dispositivos móveis, o modelo possui resposta rápida e não apresenta problema de aquecimento, além de oferecer várias formas de uso e ferramentas abertas, facilitando o início para os usuários.
【Resumo da AiBase:】
🌟 O MiniCPM-V4.0 obteve 69,0 pontos na avaliação OpenCompass, superando vários modelos concorrentes.
📱 Esse modelo foi projetado especificamente para dispositivos móveis, com resposta rápida e sem problemas de aquecimento.
📚 Aplicativo aberto para iOS e guia detalhado de uso, permitindo que os usuários iniciem mais facilmente.
Detalhes: https://huggingface.co/openbmb/MiniCPM-V-4
11. Relatório da Stripe: Economia de IA cresce aceleradamente, velocidade de receita supera três vezes a de SaaS
O relatório mais recente da Stripe revela o rápido desenvolvimento da economia de IA, incluindo a velocidade de crescimento das receitas, expansão do mercado global e inovação nos modelos de negócios. O relatório afirma que as empresas de IA atingem marcos de receita com velocidade muito maior do que empresas de tecnologia anteriores, e possuem uma "genética global" inata.
【Resumo da AiBase:】
🚀 As empresas de IA atingem marcos de receita com velocidade muito maior do que empresas de SaaS tradicionais, levando apenas 11,5 meses para atingir US$ 1 milhão de receita anual.