Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os destaques do campo de IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.
Novos produtos de IA clique para saber mais: https://top.aibase.com/
1、O Douyin integra o Doubao AI, e o ByteDance inicia uma estratégia de ecossistema de IA superpoderosa
O aplicativo Douyin está testando a integração do Doubao AI, marcando a aceleração do ByteDance na construção de seu ecossistema de IA. Ao abrir acesso na interface de vídeos curtos e na lista de mensagens, o Douyin visa quebrar as barreiras entre produtos de IA e plataformas de tráfego, melhorando as capacidades de IA e atraindo mais tráfego de usuários. O ByteDance também está promovendo várias linhas de negócios de produtos de IA internamente, demonstrando um ecossistema abrangente de produtos de IA.
【AiBase destaca:】
📱 O Douyin está testando a integração do Doubao AI, abrindo dois acessos estratégicos para melhorar as capacidades de IA e o tráfego de usuários.
💡 O ByteDance está promovendo várias linhas de produtos de IA internamente, cobrindo várias áreas e mostrando um ecossistema de produtos de IA abrangente.
🏆 As grandes empresas de internet dão grande importância à aplicação da tecnologia de IA no ecossistema de conteúdo, abrindo uma nova era de ecossistemas de serviços de IA.
2、União de forças! O Jimem integra o DeepSeek: da frase de comando à pintura em uma etapa
A colaboração entre Jimem e DeepSeek trouxe grande conveniência aos entusiastas de pintura de IA. Com a função de geração inteligente de frases de comando do DeepSeek, os usuários não precisam mais se preocupar com a inspiração criativa. Basta inserir suas necessidades para obter frases de comando precisas e gerar imagens de alta qualidade. Essa inovação colaborativa não apenas melhora a eficiência criativa, mas também torna o processo de pintura mais suave e agradável.
【AiBase destaca:】
🖌️ O Jimem integra o DeepSeek, fornecendo uma função de geração inteligente de frases de comando para resolver os problemas de criação dos usuários.
✨ Os usuários precisam apenas inserir necessidades simples, e o DeepSeek gerará frases de comando detalhadas e precisas, melhorando a eficiência criativa.
🌟 As frases de comando geradas pelo DeepSeek são de alta qualidade e podem efetivamente guiar a IA a gerar imagens de alta qualidade, com bom feedback do usuário.
3、O modo de voz do Grok está totalmente aberto: 11 modos lançados, com legendas integradas, tornando-se uma ferramenta poderosa para o aprendizado de inglês
O assistente de IA Grok da xAI abriu oficialmente seu aguardado modo de voz para todos os usuários, trazendo 11 modos exclusivos de interação por voz e a função de legendas de voz. Essa atualização não apenas aprimora a experiência interativa do usuário, mas também fornece uma nova ferramenta de aprendizado para alunos de inglês. Os usuários reagiram entusiasticamente a essa atualização. Embora atualmente suporte apenas inglês, a expressividade diversificada e a fluidez do Grok já receberam altas avaliações dos usuários, e a expectativa pela expansão do suporte a idiomas está crescendo.
【AiBase destaca:】
🎤 O modo de voz do Grok agora está aberto a todos os usuários, oferecendo 11 estilos exclusivos de interação, incluindo 2 modos com restrição 18+.
📚 O recurso de legendas de voz adicionado ajuda os usuários a entender melhor o conteúdo, tornando-se uma ferramenta prática para o aprendizado de inglês.
🌍 Os usuários elogiaram a fluidez e a expressão emocional do Grok, esperando que ele suporte mais idiomas no futuro.
4、A vivo reorganiza e ajusta sua estrutura, criando um novo departamento de IA e mudando o treinamento de grandes modelos para o lado do cliente
A vivo recentemente fez ajustes importantes em sua estrutura organizacional, criando um novo departamento de IA, mostrando seu investimento contínuo e planejamento estratégico na área de inteligência artificial. O novo departamento se concentrará no treinamento de grandes modelos no lado do cliente e suspenderá a avaliação de comercialização, refletindo a importância da vivo para o desenvolvimento de longo prazo da tecnologia de IA. Além disso, a vivo lançou o DeepSeek-R1, melhorando o nível de inteligência do assistente de IA e promovendo ainda mais a melhoria da experiência do usuário.
【AiBase destaca:】
🆕 A vivo estabeleceu um novo departamento de IA, marcando o investimento contínuo e o planejamento estratégico da empresa em tecnologia de inteligência artificial.
📉 Devido à intervenção administrativa, a vivo decidiu suspender temporariamente a avaliação de comercialização de grandes modelos de IA e suspender o investimento de capital.
🚀 O DeepSeek-R1 recém-lançado melhorou o nível de inteligência do assistente de IA, e a experiência do usuário melhorou significativamente.
5、Nova tecnologia Fast3R: realiza a reconstrução 3D de milhares de imagens com um único clique, com velocidade impressionante!
O Fast3R é uma tecnologia inovadora de reconstrução 3D multi-perspectiva que pode processar até 1500 imagens em uma única propagação direta, melhorando significativamente a velocidade de reconstrução. Em comparação com o método tradicional DUSt3R, o Fast3R utiliza uma arquitetura baseada em Transformer para processar informações de visualização em paralelo, eliminando o complexo processo de alinhamento, melhorando a velocidade de inferência e reduzindo o acúmulo de erros.
【AiBase destaca:】
🌟 A tecnologia Fast3R pode processar até 1500 imagens em uma única propagação direta, aumentando significativamente a velocidade de reconstrução 3D.
⚡ A arquitetura Transformer do Fast3R suporta processamento paralelo, eliminando o complexo processo de alinhamento dos métodos tradicionais.
🚀 Em comparação com o DUSt3R, o Fast3R apresenta vantagens significativas em termos de tempo e uso de memória, sendo adequado para aplicativos de reconstrução 3D em larga escala.
Link para detalhes:https://fast3r-3d.github.io/
6、Uma bomba no campo da criação musical! O DiffRhythm explode no mercado: músicas de IA de 10 segundos, acompanhamento vocal com um único clique!
O lançamento do DiffRhythm marca uma nova era na criação musical. Ele usa um modelo de difusão para gerar música automaticamente de ponta a ponta. Os usuários precisam apenas inserir letras e estilo para obter uma música completa em apenas 10 segundos. O DiffRhythm não apenas gera acompanhamento, mas também pode criar letras automaticamente, combinando-as perfeitamente com a melodia, subvertendo o modo tradicional de criação musical e abrindo uma nova era para a criação musical de IA.
【AiBase destaca:】
🎤 O DiffRhythm usa um modelo de difusão para realizar a criação musical de ponta a ponta. Os usuários precisam apenas inserir letras e estilo para gerar uma música completa.
⚡ A velocidade de geração é extremamente rápida, levando apenas 10 segundos para completar uma música de 4 minutos e 45 segundos, 50 vezes mais rápido que os métodos tradicionais.
🎼 Possui um poderoso modelo de linguagem grande que pode criar letras automaticamente e combiná-las perfeitamente com a melodia, subvertendo completamente o método tradicional de composição.
Link para detalhes:https://huggingface.co/spaces/ASLP-lab/DiffRhythm
7、A Microsoft lança o modelo de imagem ART de código aberto, que pode gerar imagens transparentes de várias camadas
Na área de geração de imagens, a tecnologia "Anonymous Region Transformer" (ART) desenvolvida por pesquisadores da Microsoft revolucionou a forma como os usuários interagem com modelos de geração. Através do layout de regiões anônimas, o ART pode gerar imagens transparentes de várias camadas diretamente a partir de prompts de texto globais e introduzir um mecanismo de recorte de região por camada, melhorando significativamente a eficiência de geração, 12 vezes mais rápido que os métodos tradicionais.
【AiBase destaca:】
🌟 O ART pode gerar imagens transparentes de várias camadas diretamente a partir de prompts de texto globais e layout de regiões anônimas.
⚡️ Usando um mecanismo de recorte de região por camada, a eficiência de geração de imagens é significativamente melhorada, 12 vezes mais rápido que os métodos tradicionais.
💡 Um novo autocodificador de alta qualidade suporta o controle e a geração precisos de imagens transparentes de várias camadas, promovendo a criação de conteúdo interativo.
Link para detalhes:https://art-msra.github.io/
8、Ferramenta de mapa mental de IA MindMapper: gere mapas mentais interativos apenas com um link
Na era da explosão de informações, o aplicativo Mind Mapper tornou-se um assistente poderoso para organizar pensamentos. Ele pode transformar as ideias do usuário em mapas mentais vívidos. Basta inserir um URL, link de vídeo do YouTube ou prompt de texto para gerar rapidamente um mapa mental interativo.
【AiBase destaca:】
🖥️ O Mind Mapper pode transformar ideias em mapas mentais vívidos, suportando a entrada de URLs, links de vídeo e prompts de texto.
🎨 Usando a tecnologia Mermaid.js, os mapas mentais não são apenas bonitos, mas também possuem funções de interação dinâmica, permitindo que os usuários obtenham facilmente informações detalhadas.
📤 Fornece a função de download de mapas mentais como imagens PNG, facilitando o compartilhamento de conhecimento e inspiração.
Link para detalhes:https://github.com/misbahsy/MindMapper
9、Lei Jun aparece no primeiro corredor de representantes: a Xiaomi aplicará as mais recentes tecnologias de IA em todos os terminais
Na primeira "passagem de representantes" da terceira sessão da 14ª Assembleia Popular Nacional, Lei Jun, fundador da Xiaomi, respondeu a perguntas de repórteres, discutindo profundamente o papel da Xiaomi na indústria de manufatura e a direção da inovação tecnológica. Ele enfatizou que a indústria de manufatura é a base do país e que a Xiaomi aumentará seus investimentos em P&D, especialmente na área de inteligência artificial, para melhorar a experiência tecnológica dos consumidores e contribuir para a modernização chinesa.
【AiBase destaca:】
🏭 A indústria de manufatura é a base para a nação, e a Xiaomi seguirá firmemente o caminho da inovação tecnológica e do desenvolvimento de alta qualidade.
💰 A Xiaomi planeja investir 105 bilhões de yuans em P&D entre 2021 e 2025, com uma previsão de investimento de 30 bilhões de yuans em 2025, sendo que os negócios relacionados à IA representam um quarto do total.
🌍 A Xiaomi está comprometida em aplicar as mais recentes tecnologias de IA em áreas como telefones celulares, automóveis e casas inteligentes, melhorando sua influência no mercado global.
10、A iPoetry Technology conclui a rodada de financiamento A5, visando novas alturas na área de geração de vídeo de IA
A iPoetry Technology anunciou recentemente que concluiu a rodada de financiamento A5, com investimento exclusivo da Jingya Capital, com um valor superior a 400 milhões de yuans, tornando-se uma empresa estrela na área de geração de vídeo de IA. Fundada em 2023 pelo ex-chefe de tecnologia visual do ByteDance, Wang Chang Hu, a empresa possui uma forte equipe de fundo e rapidamente conquistou o favor de vários investidores. Este financiamento será usado para acelerar a pesquisa e desenvolvimento e a introdução de talentos, com o objetivo de construir modelos e aplicativos de geração de vídeo de IA líderes.
【AiBase destaca:】
📈 A iPoetry Technology concluiu a rodada de financiamento A5, com um valor superior a 400 milhões de yuans, tornando-se uma empresa estrela na área de geração de vídeo de IA.
🌍 Seu produto PixVerse possui mais de 40 milhões de usuários e 15 milhões de usuários ativos mensais, com tecnologia líder.
💼 A empresa planeja acelerar o desenvolvimento de modelos e a introdução de talentos de alto nível, expandindo ativamente os serviços para empresas do setor B, enfrentando desafios de comercialização.