Bem-vindo ao quadro de notícias do 【IA Diário】! Aqui é o seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos as principais notícias da área de IA, com foco nos desenvolvedores, ajudando você a entender as tendências tecnológicas e conhecer aplicações inovadoras de IA.

Produtos de IA novos e interessantes clicando para saber mais:https://top.aibase.com/

1. Equipe do Bilibili lança o modelo de geração de vídeo de animação AniSora de código aberto

A equipe do Bilibili lançou o modelo de geração de vídeos de animação AniSora, que preencheu uma lacuna técnica no campo da geração de vídeos de animação, permitindo a criação de vídeos em várias estilos de animação.

image.png

[Resumo do AiBase:]

😊 O AniSora permite a geração de vídeos de várias estilos de animação com um clique, incluindo séries de episódios e animações originais chinesas.

🌟 Introduz o módulo de máscara temporal, suportando a geração de vídeos a partir de imagens, interpolação de quadros e direcionamento local de imagens, melhorando a qualidade da geração.

🏆 Após testes rigorosos, a consistência entre personagens e movimentos atingiu o padrão SOTA (melhor resultado atualmente disponível), mostrando um desempenho excepcional.

2. OpenAI lança novo assistente de programação Codex

Como desenvolvedor, fiquei muito entusiasmado com o lançamento do Codex pela OpenAI. O Codex não apenas reduz significativamente o tempo de desenvolvimento, mas também se integra perfeitamente ao GitHub, aumentando enormemente a produtividade. Ele gera código compatível com preferências humanas por meio de aprendizado por reforço, exibindo uma capacidade de auto-delegação impressionante.

image.png

[Resumo do AiBase:]

🚀 O assistente inteligente Codex foi lançado pela OpenAI, capaz de concluir tarefas complexas de desenvolvimento em 30 minutos.

🔗 O Codex se integra perfeitamente ao GitHub, suportando processamento paralelo de múltiplas tarefas, aumentando consideravelmente a produtividade dos desenvolvedores.

🤖 O Codex foi treinado por aprendizado por reforço, garantindo que o código gerado seja compatível com as preferências dos desenvolvedores humanos.

3. Google Search lança o experimento AI Mode, explorando uma nova experiência de perguntas inteligentes

O Google lançou uma função experimental chamada "Modo IA", que oferece uma experiência de perguntas inteligentes por texto, voz e imagem, incentivando os usuários a fornecer feedback para otimizar continuamente o serviço.

image.png

[Resumo do AiBase:]

🌟 Suporta perguntas por texto, voz e imagem, proporcionando uma experiência de resposta mais inteligente.

🔍 Permite aprofundar explorações por meio de perguntas adicionais, obtendo informações e links relevantes adicionais.

🔒 Valoriza a privacidade do usuário, tomando medidas para proteger os dados e incentivando o feedback dos usuários.

Link detalhado: https://support.google.com/websearch/answer/16011537?visit_id=638832352895396136-3267382421&p=aimodeavailability&rd=1#aimodeavailability

4. ChatGPT integrará o protocolo MCP, ajudando empresas a acessar diversos serviços de IA

O ChatGPT está prestes a suportar o protocolo MCP, que permite sua integração sem problemas com serviços de IA de terceiros, proporcionando uma experiência de usuário mais personalizada. As empresas podem usar esse protocolo para otimizar seus fluxos de trabalho, aumentar a eficiência e melhorar a qualidade das decisões.

image.png

[Resumo do AiBase:]

🌟 O protocolo MCP visa padronizar a interação entre modelos de linguagem grande e sistemas externos, sendo semelhante a uma "interface USB-C" para aplicações de IA.

⚙️ Os usuários podem personalizar a adição de ferramentas, preenchendo nome, URL e descrição, integrando o ChatGPT a aplicativos pessoais.

💼 O MCP oferece às empresas a capacidade de compartilhar dados sob demanda, otimizando fluxos de trabalho e promovendo tomadas de decisão inteligentes.

5. Laboratório Tongyi da Alibaba apresenta o ZeroSearch: permitindo que grandes modelos realizem “buscas” sem APIs

O ZeroSearch é um novo framework que, por meio de aprendizado por reforço e pequenos conjuntos de dados rotulados, permite que grandes modelos de linguagem simulem mecanismos de busca, melhorando suas capacidades de recuperação e inferência, enquanto reduz dependências de mecanismos de busca reais e custos de treinamento.

image.png

[Resumo do AiBase:]

✨ O ZeroSearch utiliza aprendizado por reforço e pequenos conjuntos de dados rotulados para permitir que grandes modelos gerem documentos de alta qualidade sem depender de mecanismos de busca reais, fortalecendo suas capacidades de inferência.

📚 O framework usa um método de aprendizado progressivo, começando com documentos de alta qualidade e passando para documentos de menor qualidade, melhorando a capacidade do modelo para lidar com tarefas de busca complexas.

🌟 Nos testes de conjuntos de dados de perguntas e respostas, o ZeroSearch superou métodos tradicionais, destacando-se tanto em tarefas de perguntas simples quanto de perguntas multi-pulos.

6. Stability AI e Arm lançam AI de geração de áudio de nível móvel: criando 11 segundos de áudio estéreo em 7 segundos

A Stability AI e a Arm lançaram um modelo pequeno de áudio aberto, capaz de gerar 11 segundos de áudio estéreo de alta qualidade em 7 segundos, com otimizações que permitem execução fluída em dispositivos móveis. Baseado na técnica de comparação relativa adversária, reduziu significativamente o número de parâmetros, tornando-o adequado para hardware de consumo.

image.png

[Resumo do AiBase:]

Tecnologia inovadora permite a geração de áudio em apenas 7 segundos, proporcionando uma capacidade de síntese de áudio quase em tempo real.

A arquitetura do modelo foi otimizada em três partes, adaptada para dispositivos móveis, suportando diversas tarefas de geração de áudio.

Os dados de treinamento foram cuidadosamente selecionados, garantindo conformidade legal, mas ainda é mais adequado para entradas em inglês no momento.

7. Qwen lança série de modelos de modelagem de preferências WorldPM

O time Qwen lançou a série de modelos WorldPM, incluindo o WorldPM-72B e suas versões derivadas, alcançando avanços na modelagem de preferências por meio de treinamentos em larga escala, oferecendo aos desenvolvedores um caminho eficiente para otimização.

image.png

[Resumo do AiBase:]

🌍 O WorldPM foi treinado com 15 milhões de dados de preferências, validando que a modelagem de preferências segue a lei de escala, melhorando o desempenho do modelo no aprendizado supervisionado.

🌐 A série de modelos foi publicada como open source, reduzindo a barreira tecnológica e ajudando desenvolvedores globais a melhorar a eficiência na otimização do modelo.

🌟 Fortalece a neutralidade de estilo, superando viéses subjetivos, demonstrando vantagens significativas nas tarefas de codificação e matemática.

Link detalhado: https://huggingface.co/Qwen/WorldPM-72B

8. OpenAI revela o GPT-5: integrando vários produtos em um só

Jerry Tworek compartilhou no Reddit as últimas atualizações sobre o GPT-5, que irá integrar o Codex, Operator, Deep Research e Memory, simplificando o fluxo de operações do usuário. O Codex aumentou a eficiência de programação em três vezes e a OpenAI planeja usar essa ferramenta para ajudar os desenvolvedores iniciantes a aprender mais rápido.

image.png

[Resumo do AiBase:]

🌟 O GPT-5 integra o Codex, Operator, Deep Research e Memory, eliminando a necessidade de alternar entre ferramentas.

💻 O Codex aumentou a eficiência de programação três vezes, sendo ideal para desenvolvedores que lidam com problemas rotineiros.

👨‍💻 A OpenAI planeja usar o Codex para ajudar desenvolvedores iniciantes a aprender programação rapidamente, aumentando a capacidade geral dos desenvolvedores humanos.

9. ListenHub: Ferramenta de geração de podcasts baseada em IA agora está oficialmente disponível

O ListenHub é uma ferramenta de geração de podcast baseada em IA que suporta chinês e inglês, proporcionando uma experiência personalizada de podcast. Ganhou popularidade graças à sua velocidade de geração eficiente e interface amigável, adequada para usuários comuns e criadores de conteúdo. Oferece planos gratuitos e premium, com foco na experiência móvel.

image.png

[Resumo do AiBase:]

🌟 Utiliza tecnologia de IA para gerar conteúdo relacionado aos interesses do usuário, abrangendo temas como tecnologia, história e sociedade.

⚡️ A velocidade de geração é rápida, concluída em 1-5 minutos, ideal para pessoas ocupadas e criadores de conteúdo.

📱 Suporta uso em várias plataformas e dispositivos móveis, com opções gratuitas e premium para atender às necessidades diversificadas.

Link detalhado: https://listenhub.ai/zh

10. Navegador QQ evolui para navegador de IA: Lançamento do QBot com 5 novas capacidades de IA

O navegador QQ evoluiu para um navegador de IA e lançou o QBot, proporcionando uma experiência de navegação mais inteligente, incluindo funções como pesquisa, leitura, tradução, escrita e auxílio ao trabalho.

image.png

[Resumo do AiBase:]

🚀 O QBot suporta perguntas multimodais, respondendo precisamente a qualquer tipo de questão e oferecendo acompanhamento inteligente 24/7.

📚 Ferramentas de leitura inteligentes resumem rapidamente o conteúdo da página e geram mapas mentais, aumentando a eficiência na manipulação de informações.

💼 No ambiente de trabalho, o QBot fornece ferramentas multifuncionais como edição de documentos, tradução e escrita, ajudando a aumentar a eficiência do trabalho.

11. Assistente de Modelagem Matemática MathModelAgent

O MathModelAgent é uma ferramenta inteligente projetada especificamente para modelagem matemática, capaz de automatizar todo o processo, desde a análise do problema até a construção do modelo, a escrita de código e a redação do artigo, mostrando o profundo potencial da IA no campo acadêmico e técnico.

image.png

[Resumo do AiBase:]

Análise e modelagem de problemas: o agente de modelagem pode analisar rapidamente problemas matemáticos e gerar modelos matemáticos lógicos.

Geração de código e depuração: o agente de código tem um módulo de reflexão integrado, gerando código de alta qualidade e depurando-o em tempo real usando um interpretador local.

Redação automática de artigos: o agente de redação gera automaticamente um artigo acadêmico de formato normativo com base nos resultados da modelagem e cálculos.

12. GenSpark lança o primeiro Agentic Download Agent global, revolucionando a experiência de gerenciamento de arquivos

Estou muito entusiasmado com a ferramenta Agentic Download Agent lançada pela GenSpark. Ela realmente automatiza e torna inteligente o gerenciamento de arquivos e processamento de informações, simplificando significativamente meu fluxo de trabalho. Seja para pesquisa acadêmica ou trabalho cotidiano, essa ferramenta me permite me concentrar em questões mais importantes.