Bem-vindo à seção 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais assuntos do campo da IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.

Novos produtos de IA Clique para saber mais: https://top.aibase.com/

1. OpenAI lança oficialmente o Sora, usuários do ChatGPT Pro podem gerar vídeos ilimitados com duração máxima de 20 segundos

A OpenAI lançou o Sora Turbo, uma IA de geração de vídeo, durante o evento "ship-mas". Ele permite a geração de vídeos de 20 segundos em 1080p, utilizando texto, imagens ou vídeos como entrada, com diversas opções de estilo e edição. A plataforma destaca a expressão criativa e a segurança de conteúdo, permitindo que os usuários explorem vídeos de outros criadores.

image.png

【Resumo AiBase:】 

🌟 O Sora Turbo suporta a geração de vídeos de até 20 segundos em resolução 1080p.

🎨 Os usuários podem usar várias ferramentas para criar vídeos.

🔒 Todos os vídeos gerados incluem marca d'água e metadados C2PA para garantir a segurança.

Link para mais detalhes: https://sora.com/

2. A Zhihu AI lança o modelo multi-modal gratuito GLM-4V-Flash: aumento na precisão do processamento de imagens

A Beijing Zhihu Huazhang Technology Co., Ltd. lançou sua primeira API multi-modal gratuita, o GLM-4V-Flash, com o objetivo de melhorar a precisão do processamento de imagens e reduzir a barreira de entrada para desenvolvedores. O modelo suporta vários idiomas e possui vários recursos avançados de processamento de imagens, como geração de descrições de imagens e perguntas e respostas visuais, podendo fornecer soluções precisas para setores específicos.

【Resumo AiBase:】

🌐 O GLM-4V-Flash é a primeira API multi-modal gratuita, suportando 26 idiomas e reduzindo a barreira de entrada para desenvolvedores.

📊 Possui recursos avançados como geração de descrições de imagens, classificação e raciocínio visual, sendo aplicável a diversos setores.

🚀 Este modelo já demonstrou eficácia significativa em setores como mídia social, educação e beleza.

Link para mais detalhes: https://www.bigmodel.cn/console/trialcenter

3. Assistente de código de IA da Tencent Cloud lançado, baseado no modelo de linguagem grande HunYuan

O assistente de código de IA lançado pela Tencent Cloud visa ajudar programadores a melhorar a eficiência de desenvolvimento, prevendo e fornecendo sugestões de código. Usando o modelo de linguagem grande HunYuan, ele consegue entender profundamente o contexto do código, fornecendo sugestões precisas de preenchimento de código, superando os métodos tradicionais de correspondência de palavras-chave. Ele não apenas se adapta ao estilo de codificação do programador, mas também demonstra fortes capacidades de assistência de codificação em vários cenários-chave, como geração de expressões regulares, geração rápida de páginas da web e interpretação clara de códigos complexos.

微信截图_20241210085836.png

【Resumo AiBase:】

⚙️ O assistente de código de IA, através de uma compreensão profunda do contexto do código, fornece sugestões precisas de preenchimento de código, melhorando significativamente a eficiência do desenvolvimento.

📈 Este assistente pode aprender o estilo de codificação do programador, fornecendo preenchimento de código personalizado, adequado aos hábitos individuais.

🔍 Através do modelo de linguagem grande HunYuan, o assistente de código de IA demonstra capacidades poderosas em vários cenários, incluindo a geração de expressões regulares e a adaptação rápida a novas especificações de interface.

4. O modelo de IA KeLing API V1.5 adiciona o modo padrão std, o modelo V1.0 adiciona pincel de movimento

A Beijing Kuaishou Technology Co., Ltd. lançou recentemente o modo padrão do modelo KeLing AI API V1.5 e a função "pincel de movimento" do modelo V1.0. Essas atualizações visam melhorar a experiência do usuário, aumentando a flexibilidade e a eficiência da criação artística. O modelo V1.5 oferece uma opção de custo-benefício com seu desempenho excelente e velocidade de processamento rápida, enquanto a nova função do modelo V1.0 permite que os usuários especifiquem trajetórias de movimento para pessoas ou objetos em imagens, proporcionando controle de movimento mais preciso e representações mais vívidas.

image.png

【Resumo AiBase:】

✨ O modo padrão do modelo V1.5 oferece desempenho excelente e velocidade de processamento rápida, melhorando a experiência do usuário.

🖌️ A função "pincel de movimento" adicionada ao modelo V1.0 permite que os usuários especifiquem trajetórias de movimento, permitindo controle preciso.

🌟 Novas funções enriquecem as funcionalidades do KeLing AI, trazendo possibilidades inovadoras para a criação de artes visuais.

5. O modelo multi-modal de grande escala Shusheng · Wanxiang InternVL2.5 é de código aberto, com desempenho comparável ao GPT-4o

O modelo Shusheng · Wanxiang InternVL2.5, lançado pelo laboratório de IA de Xangai, alcançou uma precisão superior a 70% em benchmarks de compreensão multi-modal, tornando-se o primeiro modelo de código aberto comparável a modelos comerciais como GPT-4o e Claude-3.5-Sonnet. O modelo melhorou seu desempenho através da técnica de raciocínio de pensamento em cadeia, demonstrando forte escalabilidade em tempo de teste e capacidade de raciocínio multidisciplinar em vários campos.

image.png

【Resumo AiBase:】

🚀 O modelo InternVL2.5 atingiu uma precisão superior a 70% em benchmarks de compreensão multi-modal, apresentando um desempenho excepcional.

📈 Através da técnica de raciocínio de pensamento em cadeia, o modelo alcançou uma melhoria de desempenho de 3,7 pontos percentuais, demonstrando forte escalabilidade.

🌐 A natureza de código aberto permite que pesquisadores e desenvolvedores acessem e utilizem livremente o modelo, impulsionando o desenvolvimento da tecnologia de IA multi-modal.

Link para mais detalhes: https://www.modelscope.cn/collections/InternVL-25-fbde6e47302942

6. Swift Ventures lança índice de empresas de IA, definindo padrões claros para investimentos em inteligência artificial

A Swift Ventures lançou um novo índice de empresas de inteligência artificial, com o objetivo de ajudar investidores a identificar empresas listadas que realmente investem em tecnologia de IA. O índice analisou milhares de dados e descobriu que, embora empresas mencionem frequentemente a IA em seus relatórios financeiros, poucas investem em larga escala. As 90 empresas atualmente rastreadas se destacam em pesquisa de IA e densidade de talentos, com uma taxa de crescimento anual muito superior à média do mercado.

【Resumo AiBase:】

📊 Este índice acompanha cerca de 90 empresas, classificando-as com base em investimentos em pesquisa de IA, densidade de talentos e receita de IA.

💡 Empresas que investem em pesquisa de IA têm uma margem bruta média duas vezes maior do que as que não investem, mostrando uma correlação positiva entre pesquisa e lucratividade.

🚀 Algumas empresas discretas têm um desempenho excepcional na área de IA, com taxas de crescimento anual superiores a 50%, indicando que a transformação da IA ultrapassou as grandes empresas de tecnologia.

7. Salto quântico surpreendente! O chip Willow do Google resolve em 5 minutos um cálculo que levaria 13,8 bilhões de anos, deixando até mesmo a OpenAI impressionada

O chip quântico Willow do Google alcançou um avanço histórico no campo da computação quântica, reduzindo com sucesso uma tarefa de cálculo que levaria 10^25 anos em um computador tradicional para apenas 5 minutos, demonstrando o enorme potencial da tecnologia quântica. Através de um design de engenharia refinado, o Willow aumentou o número de qubits e, simultaneamente, reduziu significativamente os erros de cálculo, impulsionando o progresso da computação quântica.

image.png

【Resumo AiBase:】

⚡ O chip Willow alcançou controle de erro abaixo do limite na computação quântica, com uma redução significativa na taxa de erro.

⏱️ Velocidade de cálculo surpreendente: uma tarefa de 10^25 anos leva apenas 5 minutos, demonstrando o enorme potencial da computação quântica.

🔒 O avanço do Willow levanta preocupações sobre a segurança de criptografia, especialmente a ameaça potencial a criptomoedas como o Bitcoin.

8. Boa notícia para os solteiros! Chegou a IA de RPG de VR, nova descoberta da Universidade Tecnológica de Nanyang em "criar pessoas", que canta, dança, interage e ainda conversa com você!

Uma equipe de pesquisa da Universidade Tecnológica de Nanyang, em Cingapura, lançou a tecnologia de IA chamada SOLAMI, capaz de criar personagens virtuais 3D realistas, com interação em tempo real, compreensão de voz e resposta de movimento. A tecnologia utiliza aprendizado profundo para transformar a voz e os movimentos do usuário em uma linguagem compreensível para os personagens virtuais, proporcionando uma experiência de interação natural e fluida. O SOLAMI também possui uma interface de VR, permitindo que os usuários interajam cara a cara com os personagens virtuais através de dispositivos de VR.

image.png

【Resumo AiBase:】

🎮 SOLAMI é uma estrutura de modelagem visual-linguagem-ação social de ponta a ponta, permitindo interação natural entre usuário e personagem virtual.

📊 O conjunto de dados SynMSI sintético fornece dados abundantes de conversação e ação para treinamento, resolvendo o problema da falta de dados.

🌐 A interface de VR imersiva do SOLAMI permite que os usuários interajam com personagens virtuais de forma imersiva, melhorando a experiência social.

Link para mais detalhes: https://solami-ai.github.io/

9. X declara oficialmente que o novo gerador de imagens de IA Aurora será lançado para todos os usuários nesta semana

Recentemente, a rede social X (anteriormente Twitter) lançou o novo gerador de imagens Aurora, treinado com bilhões de amostras e com capacidade de gerar imagens de alta qualidade. Embora inicialmente tenha sido removido, agora foi relançado e planeja ser disponibilizado para todos os usuários em uma semana. O Aurora consegue renderizar com precisão detalhes visuais do mundo real, embora testes tenham revelado que as imagens geradas ocasionalmente apresentam fusões não naturais e falta de detalhes.

image.png

【Resumo AiBase:】

✨ Aurora é um novo gerador de imagens desenvolvido pela xAI, com capacidade de renderização em nível fotográfico.

🌍 Atualmente disponível em alguns países, com previsão de lançamento para todos os usuários em uma semana.

🔍 Testes revelaram que as imagens geradas pelo Aurora às vezes apresentam fusões não naturais e falta de detalhes em pessoas.

Link para mais detalhes: https://x.ai/blog/grok-image-generation-release

10. Reddit lança recurso de perguntas e respostas com IA, mas os usuários não aprovam!

O Reddit lançou recentemente um novo recurso chamado "Reddit Answers", com o objetivo de melhorar a experiência de pesquisa do usuário por meio de perguntas e respostas com IA. No entanto, embora o recurso possa fornecer respostas com base em posts e comentários da plataforma, o feedback dos usuários não tem sido positivo, com muitos considerando que a prioridade deveria ser a melhoria do mecanismo de busca. O recurso está atualmente em teste com um número limitado de usuários nos EUA e ainda não foi lançado na plataforma Android.

image.png

【Resumo AiBase:】

🔍 O novo recurso "Reddit Answers" está em teste com usuários limitados nos EUA, com o objetivo de melhorar a experiência de busca.

🤖 O recurso utiliza posts e comentários da plataforma Reddit para fornecer perguntas e respostas com IA.

😟 A recepção dos usuários tem sido morna, com muitos expressando insatisfação com a prioridade dada à melhoria do mecanismo de busca.

11. Tesla Tao Lin: manterá a rota de direção autônoma puramente visual

A vice-presidente da Tesla, Tao Lin, reafirmou a determinação da empresa em manter a rota puramente visual em sua tecnologia de direção autônoma. Ela enfatizou que apenas a combinação de câmeras e redes neurais visuais pode simular melhor os hábitos de direção humana, alcançando uma direção autônoma totalmente segura e inteligente. O chip AI4 da Tesla já está equipado em todos os modelos à venda, com um aumento significativo na capacidade de processamento, marcando que a empresa está preparada em termos de hardware para a direção autônoma completa.

【Resumo AiBase:】

🔍 A Tesla mantém sua abordagem de direção autônoma totalmente visual, considerando-a a solução mais segura e inteligente.

💡 A tecnologia de direção autônoma emprega um modelo de linguagem grande de ponta a ponta, alcançando todo o processo, da entrada de fótons à saída de decisão.

📈 Todos os modelos à venda estão equipados com o chip AI4 mais recente, com aumento de 5 vezes na capacidade de processamento, preparando o terreno para a direção autônoma completa.

12. Recuperação surpreendente! A nova administração da Stability AI elimina dívidas e alcança crescimento de três dígitos em seis meses

Sob a liderança do novo CEO, Prem Akkaraju, a Stability AI, após seis meses de esforços, alcançou um crescimento de três dígitos em seus negócios e eliminou todas as suas dívidas. Akkaraju destacou a saúde do balanço patrimonial da empresa e focou no rápido desenvolvimento de APIs e serviços de licenciamento. A formação da nova equipe administrativa atraiu o retorno de investidores que haviam se retirado, sinalizando uma perspectiva positiva para a empresa.

【Resumo AiBase:】

💼 O novo CEO da Stability AI, Prem Akkaraju, afirma que a empresa alcançou um crescimento de três dígitos em seus negócios e está livre de dívidas.

📈 A nova equipe administrativa completou a recuperação em seis meses, atraindo o retorno de investidores que haviam se retirado.

🎥 O renomado diretor James Cameron se juntou ao conselho de administração da Stability AI, demonstrando uma retomada da confiança do setor.

13. Zhiyuan lança o modelo de geração 3D See3D para aprendizado de vídeo sem anotações