Bem-vindo à seção 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais assuntos do campo da IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.
Novos produtos de IA Clique para saber mais: https://top.aibase.com/
1. OpenAI lança oficialmente o Sora, usuários do ChatGPT Pro podem gerar vídeos ilimitados com duração máxima de 20 segundos
A OpenAI lançou o Sora Turbo, uma IA de geração de vídeo, durante o evento "ship-mas". Ele permite a geração de vídeos de 20 segundos em 1080p, utilizando texto, imagens ou vídeos como entrada, com diversas opções de estilo e edição. A plataforma destaca a expressão criativa e a segurança de conteúdo, permitindo que os usuários explorem vídeos de outros criadores.
【Resumo AiBase:】
🌟 O Sora Turbo suporta a geração de vídeos de até 20 segundos em resolução 1080p.
🎨 Os usuários podem usar várias ferramentas para criar vídeos.
🔒 Todos os vídeos gerados incluem marca d'água e metadados C2PA para garantir a segurança.
Link para mais detalhes: https://sora.com/
2. A Zhihu AI lança o modelo multi-modal gratuito GLM-4V-Flash: aumento na precisão do processamento de imagens
A Beijing Zhihu Huazhang Technology Co., Ltd. lançou sua primeira API multi-modal gratuita, o GLM-4V-Flash, com o objetivo de melhorar a precisão do processamento de imagens e reduzir a barreira de entrada para desenvolvedores. O modelo suporta vários idiomas e possui vários recursos avançados de processamento de imagens, como geração de descrições de imagens e perguntas e respostas visuais, podendo fornecer soluções precisas para setores específicos.
【Resumo AiBase:】
🌐 O GLM-4V-Flash é a primeira API multi-modal gratuita, suportando 26 idiomas e reduzindo a barreira de entrada para desenvolvedores.
📊 Possui recursos avançados como geração de descrições de imagens, classificação e raciocínio visual, sendo aplicável a diversos setores.
🚀 Este modelo já demonstrou eficácia significativa em setores como mídia social, educação e beleza.
Link para mais detalhes: https://www.bigmodel.cn/console/trialcenter
3. Assistente de código de IA da Tencent Cloud lançado, baseado no modelo de linguagem grande HunYuan
O assistente de código de IA lançado pela Tencent Cloud visa ajudar programadores a melhorar a eficiência de desenvolvimento, prevendo e fornecendo sugestões de código. Usando o modelo de linguagem grande HunYuan, ele consegue entender profundamente o contexto do código, fornecendo sugestões precisas de preenchimento de código, superando os métodos tradicionais de correspondência de palavras-chave. Ele não apenas se adapta ao estilo de codificação do programador, mas também demonstra fortes capacidades de assistência de codificação em vários cenários-chave, como geração de expressões regulares, geração rápida de páginas da web e interpretação clara de códigos complexos.
【Resumo AiBase:】
⚙️ O assistente de código de IA, através de uma compreensão profunda do contexto do código, fornece sugestões precisas de preenchimento de código, melhorando significativamente a eficiência do desenvolvimento.
📈 Este assistente pode aprender o estilo de codificação do programador, fornecendo preenchimento de código personalizado, adequado aos hábitos individuais.
🔍 Através do modelo de linguagem grande HunYuan, o assistente de código de IA demonstra capacidades poderosas em vários cenários, incluindo a geração de expressões regulares e a adaptação rápida a novas especificações de interface.
4. O modelo de IA KeLing API V1.5 adiciona o modo padrão std, o modelo V1.0 adiciona pincel de movimento
A Beijing Kuaishou Technology Co., Ltd. lançou recentemente o modo padrão do modelo KeLing AI API V1.5 e a função "pincel de movimento" do modelo V1.0. Essas atualizações visam melhorar a experiência do usuário, aumentando a flexibilidade e a eficiência da criação artística. O modelo V1.5 oferece uma opção de custo-benefício com seu desempenho excelente e velocidade de processamento rápida, enquanto a nova função do modelo V1.0 permite que os usuários especifiquem trajetórias de movimento para pessoas ou objetos em imagens, proporcionando controle de movimento mais preciso e representações mais vívidas.
【Resumo AiBase:】
✨ O modo padrão do modelo V1.5 oferece desempenho excelente e velocidade de processamento rápida, melhorando a experiência do usuário.
🖌️ A função "pincel de movimento" adicionada ao modelo V1.0 permite que os usuários especifiquem trajetórias de movimento, permitindo controle preciso.
🌟 Novas funções enriquecem as funcionalidades do KeLing AI, trazendo possibilidades inovadoras para a criação de artes visuais.
5. O modelo multi-modal de grande escala Shusheng · Wanxiang InternVL2.5 é de código aberto, com desempenho comparável ao GPT-4o
O modelo Shusheng · Wanxiang InternVL2.5, lançado pelo laboratório de IA de Xangai, alcançou uma precisão superior a 70% em benchmarks de compreensão multi-modal, tornando-se o primeiro modelo de código aberto comparável a modelos comerciais como GPT-4o e Claude-3.5-Sonnet. O modelo melhorou seu desempenho através da técnica de raciocínio de pensamento em cadeia, demonstrando forte escalabilidade em tempo de teste e capacidade de raciocínio multidisciplinar em vários campos.
【Resumo AiBase:】
🚀 O modelo InternVL2.5 atingiu uma precisão superior a 70% em benchmarks de compreensão multi-modal, apresentando um desempenho excepcional.
📈 Através da técnica de raciocínio de pensamento em cadeia, o modelo alcançou uma melhoria de desempenho de 3,7 pontos percentuais, demonstrando forte escalabilidade.
🌐 A natureza de código aberto permite que pesquisadores e desenvolvedores acessem e utilizem livremente o modelo, impulsionando o desenvolvimento da tecnologia de IA multi-modal.
Link para mais detalhes: https://www.modelscope.cn/collections/InternVL-25-fbde6e47302942
6. Swift Ventures lança índice de empresas de IA, definindo padrões claros para investimentos em inteligência artificial
A Swift Ventures lançou um novo índice de empresas de inteligência artificial, com o objetivo de ajudar investidores a identificar empresas listadas que realmente investem em tecnologia de IA. O índice analisou milhares de dados e descobriu que, embora empresas mencionem frequentemente a IA em seus relatórios financeiros, poucas investem em larga escala. As 90 empresas atualmente rastreadas se destacam em pesquisa de IA e densidade de talentos, com uma taxa de crescimento anual muito superior à média do mercado.
【Resumo AiBase:】
📊 Este índice acompanha cerca de 90 empresas, classificando-as com base em investimentos em pesquisa de IA, densidade de talentos e receita de IA.
💡 Empresas que investem em pesquisa de IA têm uma margem bruta média duas vezes maior do que as que não investem, mostrando uma correlação positiva entre pesquisa e lucratividade.
🚀 Algumas empresas discretas têm um desempenho excepcional na área de IA, com taxas de crescimento anual superiores a 50%, indicando que a transformação da IA ultrapassou as grandes empresas de tecnologia.
7. Salto quântico surpreendente! O chip Willow do Google resolve em 5 minutos um cálculo que levaria 13,8 bilhões de anos, deixando até mesmo a OpenAI impressionada
O chip quântico Willow do Google alcançou um avanço histórico no campo da computação quântica, reduzindo com sucesso uma tarefa de cálculo que levaria 10^25 anos em um computador tradicional para apenas 5 minutos, demonstrando o enorme potencial da tecnologia quântica. Através de um design de engenharia refinado, o Willow aumentou o número de qubits e, simultaneamente, reduziu significativamente os erros de cálculo, impulsionando o progresso da computação quântica.
【Resumo AiBase:】
⚡ O chip Willow alcançou controle de erro abaixo do limite na computação quântica, com uma redução significativa na taxa de erro.
⏱️ Velocidade de cálculo surpreendente: uma tarefa de 10^25 anos leva apenas 5 minutos, demonstrando o enorme potencial da computação quântica.
🔒 O avanço do Willow levanta preocupações sobre a segurança de criptografia, especialmente a ameaça potencial a criptomoedas como o Bitcoin.
8. Boa notícia para os solteiros! Chegou a IA de RPG de VR, nova descoberta da Universidade Tecnológica de Nanyang em "criar pessoas", que canta, dança, interage e ainda conversa com você!
Uma equipe de pesquisa da Universidade Tecnológica de Nanyang, em Cingapura, lançou a tecnologia de IA chamada SOLAMI, capaz de criar personagens virtuais 3D realistas, com interação em tempo real, compreensão de voz e resposta de movimento. A tecnologia utiliza aprendizado profundo para transformar a voz e os movimentos do usuário em uma linguagem compreensível para os personagens virtuais, proporcionando uma experiência de interação natural e fluida. O SOLAMI também possui uma interface de VR, permitindo que os usuários interajam cara a cara com os personagens virtuais através de dispositivos de VR.
【Resumo AiBase:】
🎮 SOLAMI é uma estrutura de modelagem visual-linguagem-ação social de ponta a ponta, permitindo interação natural entre usuário e personagem virtual.
📊 O conjunto de dados SynMSI sintético fornece dados abundantes de conversação e ação para treinamento, resolvendo o problema da falta de dados.
🌐 A interface de VR imersiva do SOLAMI permite que os usuários interajam com personagens virtuais de forma imersiva, melhorando a experiência social.
Link para mais detalhes: https://solami-ai.github.io/
9. X declara oficialmente que o novo gerador de imagens de IA Aurora será lançado para todos os usuários nesta semana
Recentemente, a rede social X (anteriormente Twitter) lançou o novo gerador de imagens Aurora, treinado com bilhões de amostras e com capacidade de gerar imagens de alta qualidade. Embora inicialmente tenha sido removido, agora foi relançado e planeja ser disponibilizado para todos os usuários em uma semana. O Aurora consegue renderizar com precisão detalhes visuais do mundo real, embora testes tenham revelado que as imagens geradas ocasionalmente apresentam fusões não naturais e falta de detalhes.
【Resumo AiBase:】
✨ Aurora é um novo gerador de imagens desenvolvido pela xAI, com capacidade de renderização em nível fotográfico.
🌍 Atualmente disponível em alguns países, com previsão de lançamento para todos os usuários em uma semana.
🔍 Testes revelaram que as imagens geradas pelo Aurora às vezes apresentam fusões não naturais e falta de detalhes em pessoas.
Link para mais detalhes: https://x.ai/blog/grok-image-generation-release
10. Reddit lança recurso de perguntas e respostas com IA, mas os usuários não aprovam!
O Reddit lançou recentemente um novo recurso chamado "Reddit Answers", com o objetivo de melhorar a experiência de pesquisa do usuário por meio de perguntas e respostas com IA. No entanto, embora o recurso possa fornecer respostas com base em posts e comentários da plataforma, o feedback dos usuários não tem sido positivo, com muitos considerando que a prioridade deveria ser a melhoria do mecanismo de busca. O recurso está atualmente em teste com um número limitado de usuários nos EUA e ainda não foi lançado na plataforma Android.
【Resumo AiBase:】
🔍 O novo recurso "Reddit Answers" está em teste com usuários limitados nos EUA, com o objetivo de melhorar a experiência de busca.
🤖 O recurso utiliza posts e comentários da plataforma Reddit para fornecer perguntas e respostas com IA.
😟 A recepção dos usuários tem sido morna, com muitos expressando insatisfação com a prioridade dada à melhoria do mecanismo de busca.
11. Tesla Tao Lin: manterá a rota de direção autônoma puramente visual
A vice-presidente da Tesla, Tao Lin, reafirmou a determinação da empresa em manter a rota puramente visual em sua tecnologia de direção autônoma. Ela enfatizou que apenas a combinação de câmeras e redes neurais visuais pode simular melhor os hábitos de direção humana, alcançando uma direção autônoma totalmente segura e inteligente. O chip AI4 da Tesla já está equipado em todos os modelos à venda, com um aumento significativo na capacidade de processamento, marcando que a empresa está preparada em termos de hardware para a direção autônoma completa.
【Resumo AiBase:】
🔍 A Tesla mantém sua abordagem de direção autônoma totalmente visual, considerando-a a solução mais segura e inteligente.
💡 A tecnologia de direção autônoma emprega um modelo de linguagem grande de ponta a ponta, alcançando todo o processo, da entrada de fótons à saída de decisão.
📈 Todos os modelos à venda estão equipados com o chip AI4 mais recente, com aumento de 5 vezes na capacidade de processamento, preparando o terreno para a direção autônoma completa.
12. Recuperação surpreendente! A nova administração da Stability AI elimina dívidas e alcança crescimento de três dígitos em seis meses
Sob a liderança do novo CEO, Prem Akkaraju, a Stability AI, após seis meses de esforços, alcançou um crescimento de três dígitos em seus negócios e eliminou todas as suas dívidas. Akkaraju destacou a saúde do balanço patrimonial da empresa e focou no rápido desenvolvimento de APIs e serviços de licenciamento. A formação da nova equipe administrativa atraiu o retorno de investidores que haviam se retirado, sinalizando uma perspectiva positiva para a empresa.
【Resumo AiBase:】
💼 O novo CEO da Stability AI, Prem Akkaraju, afirma que a empresa alcançou um crescimento de três dígitos em seus negócios e está livre de dívidas.
📈 A nova equipe administrativa completou a recuperação em seis meses, atraindo o retorno de investidores que haviam se retirado.
🎥 O renomado diretor James Cameron se juntou ao conselho de administração da Stability AI, demonstrando uma retomada da confiança do setor.
13. Zhiyuan lança o modelo de geração 3D See3D para aprendizado de vídeo sem anotações