Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais assuntos do campo de IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.

Novos produtos de IA Clique para saber mais: https://top.aibase.com/

1、Kunlun Wanwei lança código aberto do SkyReels-V2: modelo de geração de filmes de duração ilimitada

A equipe SkyReels da Kunlun Wanwei lançou o SkyReels-V2, o primeiro modelo de geração de filmes de duração ilimitada do mundo baseado em um framework de difusão forçada. O modelo, através da combinação de modelos de linguagem grandes multimodais e aprendizado por reforço, melhora significativamente a qualidade e a eficiência da geração de vídeo. O SkyReels-V2 não apenas alcança um avanço tecnológico, mas também expande os cenários de aplicação, incluindo geração de histórias e imagem para vídeo, demonstrando seu amplo potencial na produção de conteúdo criativo.

image.png

【Resumo AiBase:】

🚀 SkyReels-V2 é o primeiro modelo de geração de filmes de duração ilimitada do mundo a usar um framework de difusão forçada, marcando uma nova fase na tecnologia de geração de vídeo.

🎬 O modelo apresenta excelente desempenho na coordenação de dinâmica de movimento, qualidade visual e duração do vídeo, suportando a geração de vídeos de alta qualidade de movimento e alta consistência.

📊 Na avaliação de desempenho, o SkyReels-V2 superou os modelos de comparação em várias dimensões-chave, demonstrando sua excelente obediência a instruções e consistência de vídeo.

Link de detalhes:https://github.com/SkyworkAI/SkyReels-V2

2、iFlytek StarFire X1 totalmente atualizado: buscando competir com a OpenAI no campo da IA

Em 21 de abril, a iFlytek lançou seu mais recente modelo de inteligência artificial, o iFlytek StarFire X1, com o objetivo de competir com o o1 da OpenAI e o DeepSeek R1. O modelo apresenta excelente desempenho em várias áreas, especialmente nos setores de educação, saúde e justiça. Apesar de seus parâmetros de modelo serem menores, o efeito geral é comparável ao dos líderes do setor. Além disso, o modelo unificado "pensamento rápido, pensamento lento" do iFlytek StarFire X1 oferece aos usuários uma maneira flexível de pensar, reduzindo a barreira para as empresas usarem IA.

image.png

【Resumo AiBase:】

✨ O iFlytek StarFire X1 melhorou a capacidade de generalização do modelo através de dados de cenários complexos, aplicável a setores como educação, saúde e justiça.

💡 Apesar de ter menos parâmetros de modelo do que produtos similares, o efeito geral é comparável ao dos líderes do setor, mostrando uma forte competitividade.

🔧 A nova cadeia de ferramentas de otimização personalizada do modelo suporta várias opções de personalização, simplificando o processo de implantação de aplicativos de IA para empresas.

3、A tecnologia Yushu anuncia que a primeira competição mundial de luta de robôs humanoides começará em 2025

A tecnologia Yushu realizará a primeira competição mundial de luta de robôs humanoides em 2025, mostrando a tecnologia de ponta e o charme da luta de robôs. Os robôs humanoides G1 participantes passaram por treinamento de alta intensidade, mostrando flexibilidade excepcional e forte capacidade de combate, especialmente sua capacidade impressionante de retornar rapidamente à batalha após serem derrubados. Este evento não é apenas uma reunião de tecnologia, mas também impulsionará o desenvolvimento da inteligência artificial e da robótica, atraindo a atenção de entusiastas da tecnologia em todo o mundo.

image.png

【Resumo AiBase:】

🤖 De maio a junho de 2025, a tecnologia Yushu realizará a primeira competição mundial de luta de robôs humanoides em Hangzhou, apresentando um espetáculo visual sem precedentes.

💪 Os robôs humanoides G1 passaram por treinamento de algoritmos de alta intensidade e depuração de hardware, mostrando flexibilidade excepcional e forte capacidade de soco.

📺 A competição será transmitida ao vivo pela CCTV em toda a rede, e os espectadores testemunharão em primeira mão o confronto de ponta da luta de robôs.

4、O espaço Coze, da empresa Kouzi, inicia oficialmente o teste beta

A nova plataforma de colaboração de escritório de IA da ByteDance, "Kouzi Space", entrou na fase de teste beta, com o objetivo de melhorar a eficiência de colaboração entre usuários e agentes de IA. A plataforma possui várias funções inovadoras, como análise automática das necessidades do usuário, decomposição de tarefas e chamada de ferramentas, podendo gerar relatórios de resultados completos. Além disso, a plataforma introduziu um ecossistema de agentes especialistas, permitindo que os usuários escolham especialistas em diferentes campos para análise aprofundada, ajudando a obter mais insights.

image.png

【Resumo AiBase:】

🤖 O espaço Kouzi oferece serviços abrangentes, suportando a colaboração eficiente entre usuários e agentes de IA, analisando automaticamente as necessidades e decompondo as tarefas.

📊 Introduzindo um ecossistema de agentes especialistas, os usuários podem escolher agentes em campos profissionais para análise aprofundada e geração de relatórios.

🔧 Suporta integração de extensão MCP, inicialmente suportando várias ferramentas, e no futuro permitirá que os usuários publiquem MCP personalizados.

5、O Google lança o modelo Gemma 3 QAT: até mesmo uma placa gráfica 3090 pode controlá-lo facilmente

Recentemente, o Google lançou uma nova versão da série Gemma3, especialmente o modelo Gemma327B otimizado com treinamento de quantização consciente (QAT), reduzindo significativamente as necessidades de memória, permitindo que os usuários executem modelos grandes em GPUs de consumo localmente. A tecnologia QAT integra operações de quantização durante o treinamento, reduzindo a perda de desempenho e melhorando o desempenho do modelo em dispositivos menores.

image.png

【Resumo AiBase:】

💡 A necessidade de memória do modelo Gemma327B otimizado para QAT foi reduzida de 54 GB para 14,1 GB, e os usuários podem executá-lo em GPUs de consumo.

⚙️ Após 5000 etapas de treinamento QAT, a perplexidade do modelo diminuiu 54%, mantendo uma operação eficiente em dispositivos menores.

🌐 Várias ferramentas para desenvolvedores, como Ollama, LM Studio e MLX, já suportam o modelo Gemma3QAT, oferecendo uma melhor experiência ao usuário.

6、A Intel lança código aberto do AI Playground, permitindo que placas gráficas Intel Arc usem vários modelos de IA

A Intel anunciou o lançamento oficial do código aberto de seu software de IA generativa, o AI Playground, marcando um passo importante na promoção da popularização da tecnologia de IA generativa e da colaboração da comunidade. O AI Playground é uma ferramenta otimizada para GPUs Intel Arc e placas gráficas integradas, suportando vários modelos de IA generativa, permitindo que os usuários gerem imagens de IA localmente e garantam a privacidade dos dados.

image.png

【Resumo AiBase:】

🛠️ O AI Playground é uma ferramenta de IA poderosa que suporta vários modelos de IA generativa, incluindo modelos de difusão de imagens e modelos de linguagem grandes, garantindo a privacidade de dados locais.

🌍 O AI Playground de código aberto é lançado sob a licença MIT, incentivando desenvolvedores a baixar, personalizar e contribuir com código livremente, reduzindo a barreira de desenvolvimento e promovendo a colaboração da comunidade.

🚀 A iniciativa de código aberto da Intel é considerada um avanço importante no campo da IA generativa e espera-se que impulsione o desenvolvimento de mais soluções de IA baseadas em hardware Intel.

Link de detalhes:https://github.com/intel/AI-Playground

7、Lançamento do robô Reachy2: interação natural, preço de US$ 70.000

A Hugging Face, através da aquisição da Pollen Robotics, lançou o robô humanoide de código aberto Reachy2, marcando um marco importante na combinação de robôs humanoides e IA generativa. Com sua aparência amigável, sensores avançados e características de código aberto, o Reachy2 rapidamente se tornou o foco de atenção dos principais laboratórios do mundo. O robô não apenas promoveu a popularização da robótica, mas também forneceu oportunidades de inovação de baixo custo para pesquisa em IA e robótica, mostrando o enorme potencial do mercado futuro de robôs humanoides.

image.png

【Resumo AiBase:】

🤝 Reachy2 é um robô humanoide de código aberto lançado pela Hugging Face após a aquisição da Pollen Robotics, com preço de US$ 70.000.

🛠️ O robô é equipado com sensores avançados e operação remota de RV, suportando programação e personalização flexíveis, promovendo a democratização da tecnologia robótica.

📈 A previsão de mercado é que o tamanho do mercado de robôs humanoides atingirá US$ 1,7 trilhão até 2050. O modelo de código aberto do Reachy2 fornece oportunidades de inovação para pesquisa e educação.

8、A ByteDance Research lança código aberto do ChatTS-14B: compreensão nativa e raciocínio ao longo do tempo

A equipe de pesquisa da ByteDance lançou o ChatTS-14B, um modelo de linguagem grande de 14 bilhões de parâmetros projetado especificamente para dados de séries temporais, com o objetivo de reduzir a barreira de uso da análise de séries temporais por meio de uma interface de linguagem natural. O código aberto do modelo gerou ampla atenção, marcando um grande avanço na combinação de análise de séries temporais e IA generativa. O ChatTS-14B não apenas fornece pesos de modelo, mas também inclui documentação de uso detalhada e um repositório de código, ajudando os desenvolvedores em aplicativos em áreas como finanças e saúde.

image.png

【Resumo AiBase:】

📊 ChatTS-14B é um modelo de linguagem de 14 bilhões de parâmetros, projetado especificamente para compreensão e raciocínio de dados de séries temporais.

🌐 O ChatTS-14B de código aberto permite que até mesmo usuários não profissionais processem facilmente tarefas de séries temporais por meio de linguagem natural, reduzindo a barreira de uso.

🚀 O lançamento do modelo marca um avanço estratégico da ByteDance no campo da IA, impulsionando a ampla aplicação da análise de séries temporais.

Link de detalhes:https://huggingface.co/bytedance-research/ChatTS-14B

9、A Figma impulsiona a revolução da IA: desenvolvimento de um criador de aplicativos inteligentes e uma ferramenta de criação de sites

A Figma está se posicionando ativamente no campo da inteligência artificial, planejando lançar um criador de aplicativos de IA e uma ferramenta de criação de sites Figma Sites. Essas novas ferramentas visam gerar aplicativos e sites rapidamente por meio de linguagem natural e recursos de design existentes, reduzindo a barreira de desenvolvimento e permitindo que designers sem formação técnica construam facilmente aplicativos funcionais. Essas inovações da Figma não apenas melhoram o nível de inteligência do design e do desenvolvimento, mas também podem redefinir os modelos de colaboração do setor, apesar da concorrência de plataformas como Webflow e Wix.

image.png

【Resumo AiBase:】

🛠️ A Figma lança um criador de aplicativos de IA, suportando várias formas de entrada e reduzindo a barreira de desenvolvimento.

🌐 A ferramenta Figma Sites ajudará os usuários a gerar sites utilizáveis diretamente a partir de projetos de design, expandindo o ecossistema de design.

🤖 A Figma usa o modelo Claude Sonnet para melhorar o nível de inteligência, podendo remodelar os modelos de colaboração de design e desenvolvimento.

10、O MCP do Microsoft MarkItDown pode converter Word, Excel e outros formatos em formato Markdown

Na era digital, o MCP (Model Context Protocol) do Microsoft MarkItDown trouxe mudanças revolucionárias para o processamento de documentos. A ferramenta suporta vários formatos de arquivo, como PDF, Word, PowerPoint, etc., e pode convertê-los eficientemente em formato Markdown, facilitando muito a análise de texto e o uso de modelos de linguagem grandes.

image.png

【Resumo AiBase:】

📄 **Suporte multiformato**: Suporta vários formatos de arquivo, como PDF, Word, PowerPoint, atendendo às necessidades de diferentes cenários.

🔍 **Manutenção inteligente da estrutura do documento**: Durante a conversão, a estrutura principal do documento é inteligentemente reconhecida e mantida, garantindo que as informações estejam completas e intactas.

⚙️ **Função de extensão de plug-in**: Suporta plug-ins de terceiros, e os usuários podem expandi-los de acordo com suas necessidades para atender aos requisitos de processamento de documentos específicos.

Link de detalhes:https://github.com/microsoft/markitdown