Bem-vindo ao programa "AI Daily"! Aqui é o seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos aos nossos leitores os conteúdos mais recentes e relevantes do setor de IA, focando nos desenvolvedores, ajudando-o a compreender as tendências tecnológicas e conhecer aplicações inovadoras de produtos de IA.
Produtos de IA novos clique para saber mais:https://top.aibase.com/
1. ByteDance lança modelo de interpretação simultânea ponto a ponto Seed LiveInterpret 2.0
A equipe Seed da ByteDance lançou sua nova criação - Seed LiveInterpret 2.0, que atinge um nível líder na qualidade de tradução entre chinês e inglês, possui baixa latência e função de cópia de voz em tempo real, melhorando significativamente a naturalidade e fluidez das comunicações interlinguísticas.
【Resumo do AiBase:】
🚀 O Seed LiveInterpret 2.0 alcança uma taxa de precisão de tradução próxima à de intérpretes humanos e possui uma latência extremamente baixa, apenas 3 segundos.
🎙️ Suporta a função de cópia de voz em tempo real, sem a necessidade de amostras de voz prévias para sintetizar a "voz original" na tradução.
📊 Na avaliação profissional, o Seed LiveInterpret 2.0 se saiu bem nas tarefas de tradução entre chinês e inglês, obtendo pontuação muito superior a outros sistemas.
Link detalhado: https://arxiv.org/pdf/2507.17527
2. API de busca do Mistral AI lançada: preço de 3 centavos, oferece capacidade de busca multimodal
O Mistral AI lançou oficialmente sua API de busca, fornecendo aos desenvolvedores uma nova opção alternativa ao Bing Search API. A API tem preço de 0,03 yuan por consulta, suporta busca multimodal e não exige limites de uso, facilitando a integração rápida.
【Resumo do AiBase:】
✅ A API de busca do Mistral AI foi lançada oficialmente, oferecendo aos desenvolvedores uma nova opção de busca.
💡 Preço de 0,03 yuan por consulta, competitivo no mercado, suporta busca multimodal.
🚀 Os desenvolvedores podem testar imediatamente, sem processo de solicitação complexo, aumentando a eficiência de integração.
3. Lovart AI versão final globalmente lançada: redefinição da experiência criativa com design inteligente em toda a cadeia
O artigo descreve o lançamento global da versão final do Lovart AI, destacando sua inovação como o primeiro agente de design inteligente, e como redefine os padrões da indústria de design por meio de interação por linguagem natural e capacidades completas de design. O artigo também menciona suas novas funcionalidades ChatCanvas e o "Star Flow Agent" adaptado ao mercado chinês, destacando seu impacto profundo na indústria do design.
【Resumo do AiBase:】
🎨 O Lovart AI fornece serviços de geração de ativos visuais de alta qualidade por meio de interação por linguagem natural e capacidades completas de design.
🧠 Nova funcionalidade ChatCanvas suporta conversas em múltiplas etapas e ajustes em tempo real de layout e cores, aumentando a eficiência criativa.
🇨🇳 O "Star Flow Agent" otimizado para o mercado chinês suporta semântica chinesa e estética de estilo nacional, ajudando criadores locais a criar com eficiência.
4. Equipe de Li Mu lança Higgs Audio v2, inaugurando uma nova era na síntese de voz
A Higgs Audio v2 lançada pela equipe de Li Mu representa uma grande conquista na área de síntese de voz, com funções como geração de diálogos multilíngues, ajuste automático de ritmo e clonagem de voz. O modelo foi treinado com 10 milhões de horas de dados de voz e se saiu bem em vários testes, tornando-se um padrão da indústria.
【Resumo do AiBase:】
🔥 A Higgs Audio v2 suporta geração de diálogos multilíngues e clonagem de voz, realizando tarefas complexas.
📊 Na avaliação EmergentTTS-Eval, a Higgs Audio v2 se saiu bem em emoção e categorias de perguntas.
🚀 Suporta chat de voz em tempo real e criação de conteúdo de áudio, aplicável a cenários como apresentadores virtuais e assistentes de voz.
5. Sora2 surge: OpenAI quer recuperar posição de liderança no campo de vídeos de IA generativa
O artigo apresenta o Sora2, sucessor do modelo de texto para vídeo da OpenAI, enquanto menciona a popularização do Veo3 da Google. Isso indica que a competição no setor de vídeos de IA generativa será ainda mais acirrada.
【Resumo do AiBase:】
🚀 A OpenAI está desenvolvendo ativamente o Sora2 para enfrentar a concorrência do Veo3 da Google.
💡 O Sora2 ainda não foi divulgado publicamente, mas pode haver mais informações nas próximas semanas.
🌐 O Veo3 da Google já está disponível gratuitamente para estudantes universitários e pode ser experimentado através do Google Cloud.
6. OpenAI e Oracle se unem para expandir o projeto Stargate, que já criou milhares de empregos
A OpenAI firmou um novo acordo com a Oracle, ampliando a capacidade dos centros de dados dos EUA do projeto Stargate para 4,5 gigawatts, com capacidade total superior a 5 gigawatts. Isso marca um passo importante para a OpenAI alcançar seu objetivo de 10 gigawatts até 2029. O projeto visa promover os Estados Unidos como força dominante no desenvolvimento de inteligência artificial global e atraiu várias empresas de tecnologia e investidores internacionais.
【Resumo do AiBase:】
🔥 A capacidade do projeto Stargate foi expandida para mais de 5 gigawatts, com o objetivo de atingir 10 gigawatts até 2029.
🤝 A OpenAI se uniu a várias empresas de tecnologia, incluindo a Oracle, para impulsionar o projeto, que deverá criar mais de 100.000 empregos.
💰 O projeto recebeu mais de 19 bilhões de dólares em financiamento, atraindo investidores de diversos países.
7. Google Photos adiciona recursos de IA: fotos se tornam animações em instantes, geração de vídeos com um toque
O Google Photos lançou vários novos recursos baseados em IA, incluindo transformação de fotos estáticas em vídeos dinâmicos e ferramentas criativas para converter fotos em diferentes estilos artísticos. Esses recursos visam melhorar a experiência criativa dos usuários e continuar a otimizar os produtos de forma experimental.
【Resumo do AiBase:】
📷 A função de transformação de foto em vídeo usa o modelo Veo2, permitindo que fotos estáticas se tornem vídeos dinâmicos de 6 segundos.
🎨 A função Remix é impulsionada pelo Imagen AI, convertendo fotos comuns em estilos artísticos como anime e quadrinhos.
📌 O Google adicionou uma página 'Criar' no aplicativo Photos, integrando diversas ferramentas criativas, oferecendo uma experiência de criação completa.
8. YouTube Shorts vai lançar novos efeitos de IA: fotos se tornam vídeos em instantes!
O YouTube anunciou que abrirá uma série de funções revolucionárias de IA geradora para criadores de Shorts, incluindo conversão de imagens em vídeos e efeitos de IA. Essas ferramentas conseguem transformar fotos estáticas em vídeos dinâmicos, oferecendo várias opções criativas, reduzindo significativamente a barreira de criação e aumentando a atração do conteúdo.
【Resumo do AiBase:】
📷 A função de conversão de imagem em vídeo permite que fotos estáticas ganhem vida em 6 segundos, aumentando a eficiência da criação de vídeos curtos.
🎨 Efeitos de IA podem transformar desenhos ou selfies em obras de arte elegantes, estimulando a inspiração dos criadores.
🎥 O novo gerador de vídeos Veo3 produzirá áudio simultaneamente, fornecendo uma solução completa para a criação.
9. Google lança modelo Aeneas: abre novos caminhos para a interpretação de textos antigos
O modelo Aeneas lançado pelo Google fornece uma nova abordagem para a interpretação de inscrições antigas, acelerando o trabalho dos historiadores na recuperação, identificação e datação dessas inscrições por meio de tecnologias de inteligência artificial, além de poder ser expandido para outras línguas antigas e materiais, aumentando significativamente a eficiência e profundidade da pesquisa histórica.
【Resumo do AiBase:】
🧠 O modelo Aeneas foi lançado pela DeepMind do Google, destinado a ajudar historiadores a entender textos antigos.
🗣️ O modelo consegue analisar a similaridade de textos antigos, preencher lacunas e aliviar a carga dos pesquisadores históricos.
📜 O Aeneas transforma textos em "digitais históricos", ajudando historiadores a interpretar inscrições no contexto mais amplo.
Link detalhado: https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/
10. GitHub Spark surge: crie aplicativos Web com uma frase, marcando uma nova era para o desenvolvimento de IA!
O GitHub Spark permite que desenvolvedores e não desenvolvedores construam rapidamente aplicações Web personalizadas por meio de tecnologia de processamento de linguagem natural, reduzindo significativamente a barreira da programação e oferecendo novas possibilidades para o desenvolvimento de microaplicações.
【Resumo do AiBase:】
🌟 O GitHub Spark permite que os usuários descrevam suas necessidades por meio de linguagem natural e gerem rapidamente aplicações Web completas.
🚀 Fornece ambiente de execução totalmente gerenciado, suporta implantação em um clique e adaptação PWA, simplificando o processo de desenvolvimento.
🔧 Suporta seleção de múltiplos modelos, integrando-se profundamente à ecossistema do GitHub, aumentando a eficiência do desenvolvimento.
Link detalhado: https://github.blog/changelog/2025-07-23-github-spark-in-public-preview-for-cop ilot-pro-subscribers/
11. HUAWEI M-Pencil Pro lançado: 699 yuans, suporte para ativar a assistente inteligente Xiaoyi com um toque
O Huawei lançou uma nova caneta digital, a HUAWEI M-Pencil Pro, com preço de 699 yuans, que possui sensibilidade de 16384 níveis, função de rotação lateral e várias opções de pontas, além de suporte a entrada rápida de funções de IA e funcionalidade de localização precisa de Starlight, trazendo uma experiência de criação mais conveniente e real para os criadores.
【Resumo do AiBase:】
✨ A HUAWEI M-Pencil Pro possui sensibilidade de 16384 níveis, detectando precisamente mudanças de pressão, melhorando a sensação real de criação.
💡 A tecla inteligente na extremidade da caneta adota o design de luz pulsante da Harmonized Star Ring, permitindo ativar a assistente inteligente Xiaoyi com um toque, aumentando a praticidade operacional.
📍 A função de localização precisa de Starlight suporta localização precisa dentro de 50 metros, resolvendo o problema de perda da caneta digital.