Boletim Diário de IA: OpenAI lança o impressionante Sora; Modelo multimodais gratuito GLM-4V-Flash da Zhihu AI; Tencent Cloud cria assistente de código de IA

Bem-vindo à seção 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais assuntos do campo da IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.

Novos produtos de IA Clique para saber mais: https://top.aibase.com/

1. OpenAI lança oficialmente o Sora, usuários do ChatGPT Pro podem gerar vídeos ilimitados com duração máxima de 20 segundos

A OpenAI lançou o Sora Turbo, uma IA de geração de vídeo, durante o evento "ship-mas". Ele permite a geração de vídeos de 20 segundos em 1080p, utilizando texto, imagens ou vídeos como entrada, com diversas opções de estilo e edição. A plataforma destaca a expressão criativa e a segurança de conteúdo, permitindo que os usuários explorem vídeos de outros criadores.

【Resumo AiBase:】
🌟 O Sora Turbo suporta a geração de vídeos de até 20 segundos em resolução 1080p.
🎨 Os usuários podem usar várias ferramentas para criar vídeos.
🔒 Todos os vídeos gerados incluem marca d'água e metadados C2PA para garantir a segurança.
Link para mais detalhes: https://sora.com/

2. A Zhihu AI lança o modelo multi-modal gratuito GLM-4V-Flash: aumento na precisão do processamento de imagens

A Beijing Zhihu Huazhang Technology Co., Ltd. lançou sua primeira API multi-modal gratuita, o GLM-4V-Flash, com o objetivo de melhorar a precisão do processamento de imagens e reduzir a barreira de entrada para desenvolvedores. O modelo suporta vários idiomas e possui vários recursos avançados de processamento de imagens, como geração de descrições de imagens e perguntas e respostas visuais, podendo fornecer soluções precisas para setores específicos.

【Resumo AiBase:】
🌐 O GLM-4V-Flash é a primeira API multi-modal gratuita, suportando 26 idiomas e reduzindo a barreira de entrada para desenvolvedores.
📊 Possui recursos avançados como geração de descrições de imagens, classificação e raciocínio visual, sendo aplicável a diversos setores.
🚀 Este modelo já demonstrou eficácia significativa em setores como mídia social, educação e beleza.
Link para mais detalhes: https://www.bigmodel.cn/console/trialcenter

3. Assistente de código de IA da Tencent Cloud lançado, baseado no modelo de linguagem grande HunYuan

O assistente de código de IA lançado pela Tencent Cloud visa ajudar programadores a melhorar a eficiência de desenvolvimento, prevendo e fornecendo sugestões de código. Usando o modelo de linguagem grande HunYuan, ele consegue entender profundamente o contexto do código, fornecendo sugestões precisas de preenchimento de código, superando os métodos tradicionais de correspondência de palavras-chave. Ele não apenas se adapta ao estilo de codificação do programador, mas também demonstra fortes capacidades de assistência de codificação em vários cenários-chave, como geração de expressões regulares, geração rápida de páginas da web e interpretação clara de códigos complexos.

微信截图_20241210085836.png

【Resumo AiBase:】
⚙️ O assistente de código de IA, através de uma compreensão profunda do contexto do código, fornece sugestões precisas de preenchimento de código, melhorando significativamente a eficiência do desenvolvimento.
📈 Este assistente pode aprender o estilo de codificação do programador, fornecendo preenchimento de código personalizado, adequado aos hábitos individuais.
🔍 Através do modelo de linguagem grande HunYuan, o assistente de código de IA demonstra capacidades poderosas em vários cenários, incluindo a geração de expressões regulares e a adaptação rápida a novas especificações de interface.

4. O modelo de IA KeLing API V1.5 adiciona o modo padrão std, o modelo V1.0 adiciona pincel de movimento

A Beijing Kuaishou Technology Co., Ltd. lançou recentemente o modo padrão do modelo KeLing AI API V1.5 e a função "pincel de movimento" do modelo V1.0. Essas atualizações visam melhorar a experiência do usuário, aumentando a flexibilidade e a eficiência da criação artística. O modelo V1.5 oferece uma opção de custo-benefício com seu desempenho excelente e velocidade de processamento rápida, enquanto a nova função do modelo V1.0 permite que os usuários especifiquem trajetórias de movimento para pessoas ou objetos em imagens, proporcionando controle de movimento mais preciso e representações mais vívidas.

【Resumo AiBase:】
✨ O modo padrão do modelo V1.5 oferece desempenho excelente e velocidade de processamento rápida, melhorando a experiência do usuário.
🖌️ A função "pincel de movimento" adicionada ao modelo V1.0 permite que os usuários especifiquem trajetórias de movimento, permitindo controle preciso.
🌟 Novas funções enriquecem as funcionalidades do KeLing AI, trazendo possibilidades inovadoras para a criação de artes visuais.

5. O modelo multi-modal de grande escala Shusheng · Wanxiang InternVL2.5 é de código aberto, com desempenho comparável ao GPT-4o

O modelo Shusheng · Wanxiang InternVL2.5, lançado pelo laboratório de IA de Xangai, alcançou uma precisão superior a 70% em benchmarks de compreensão multi-modal, tornando-se o primeiro modelo de código aberto comparável a modelos comerciais como GPT-4o e Claude-3.5-Sonnet. O modelo melhorou seu desempenho através da técnica de raciocínio de pensamento em cadeia, demonstrando forte escalabilidade em tempo de teste e capacidade de raciocínio multidisciplinar em vários campos.

【Resumo AiBase:】
🚀 O modelo InternVL2.5 atingiu uma precisão superior a 70% em benchmarks de compreensão multi-modal, apresentando um desempenho excepcional.
📈 Através da técnica de raciocínio de pensamento em cadeia, o modelo alcançou uma melhoria de desempenho de 3,7 pontos percentuais, demonstrando forte escalabilidade.
🌐 A natureza de código aberto permite que pesquisadores e desenvolvedores acessem e utilizem livremente o modelo, impulsionando o desenvolvimento da tecnologia de IA multi-modal.
Link para mais detalhes: https://www.modelscope.cn/collections/InternVL-25-fbde6e47302942

6. Swift Ventures lança índice de empresas de IA, definindo padrões claros para investimentos em inteligência artificial

A Swift Ventures lançou um novo índice de empresas de inteligência artificial, com o objetivo de ajudar investidores a identificar empresas listadas que realmente investem em tecnologia de IA. O índice analisou milhares de dados e descobriu que, embora empresas mencionem frequentemente a IA em seus relatórios financeiros, poucas investem em larga escala. As 90 empresas atualmente rastreadas se destacam em pesquisa de IA e densidade de talentos, com uma taxa de crescimento anual muito superior à média do mercado.

【Resumo AiBase:】
📊 Este índice acompanha cerca de 90 empresas, classificando-as com base em investimentos em pesquisa de IA, densidade de talentos e receita de IA.
💡 Empresas que investem em pesquisa de IA têm uma margem bruta média duas vezes maior do que as que não investem, mostrando uma correlação positiva entre pesquisa e lucratividade.
🚀 Algumas empresas discretas têm um desempenho excepcional na área de IA, com taxas de crescimento anual superiores a 50%, indicando que a transformação da IA ultrapassou as grandes empresas de tecnologia.

7. Salto quântico surpreendente! O chip Willow do Google resolve em 5 minutos um cálculo que levaria 13,8 bilhões de anos, deixando até mesmo a OpenAI impressionada

O chip quântico Willow do Google alcançou um avanço histórico no campo da computação quântica, reduzindo com sucesso uma tarefa de cálculo que levaria 10^25 anos em um computador tradicional para apenas 5 minutos, demonstrando o enorme potencial da tecnologia quântica. Através de um design de engenharia refinado, o Willow aumentou o número de qubits e, simultaneamente, reduziu significativamente os erros de cálculo, impulsionando o progresso da computação quântica.

【Resumo AiBase:】
⚡ O chip Willow alcançou controle de erro abaixo do limite na computação quântica, com uma redução significativa na taxa de erro.
⏱️ Velocidade de cálculo surpreendente: uma tarefa de 10^25 anos leva apenas 5 minutos, demonstrando o enorme potencial da computação quântica.
🔒 O avanço do Willow levanta preocupações sobre a segurança de criptografia, especialmente a ameaça potencial a criptomoedas como o Bitcoin.

8. Boa notícia para os solteiros! Chegou a IA de RPG de VR, nova descoberta da Universidade Tecnológica de Nanyang em "criar pessoas", que canta, dança, interage e ainda conversa com você!

Uma equipe de pesquisa da Universidade Tecnológica de Nanyang, em Cingapura, lançou a tecnologia de IA chamada SOLAMI, capaz de criar personagens virtuais 3D realistas, com interação em tempo real, compreensão de voz e resposta de movimento. A tecnologia utiliza aprendizado profundo para transformar a voz e os movimentos do usuário em uma linguagem compreensível para os personagens virtuais, proporcionando uma experiência de interação natural e fluida. O SOLAMI também possui uma interface de VR, permitindo que os usuários interajam cara a cara com os personagens virtuais através de dispositivos de VR.

【Resumo AiBase:】
🎮 SOLAMI é uma estrutura de modelagem visual-linguagem-ação social de ponta a ponta, permitindo interação natural entre usuário e personagem virtual.
📊 O conjunto de dados SynMSI sintético fornece dados abundantes de conversação e ação para treinamento, resolvendo o problema da falta de dados.
🌐 A interface de VR imersiva do SOLAMI permite que os usuários interajam com personagens virtuais de forma imersiva, melhorando a experiência social.
Link para mais detalhes: https://solami-ai.github.io/

9. X declara oficialmente que o novo gerador de imagens de IA Aurora será lançado para todos os usuários nesta semana

Recentemente, a rede social X (anteriormente Twitter) lançou o novo gerador de imagens Aurora, treinado com bilhões de amostras e com capacidade de gerar imagens de alta qualidade. Embora inicialmente tenha sido removido, agora foi relançado e planeja ser disponibilizado para todos os usuários em uma semana. O Aurora consegue renderizar com precisão detalhes visuais do mundo real, embora testes tenham revelado que as imagens geradas ocasionalmente apresentam fusões não naturais e falta de detalhes.

【Resumo AiBase:】
✨ Aurora é um novo gerador de imagens desenvolvido pela xAI, com capacidade de renderização em nível fotográfico.
🌍 Atualmente disponível em alguns países, com previsão de lançamento para todos os usuários em uma semana.
🔍 Testes revelaram que as imagens geradas pelo Aurora às vezes apresentam fusões não naturais e falta de detalhes em pessoas.
Link para mais detalhes: https://x.ai/blog/grok-image-generation-release

10. Reddit lança recurso de perguntas e respostas com IA, mas os usuários não aprovam!

O Reddit lançou recentemente um novo recurso chamado "Reddit Answers", com o objetivo de melhorar a experiência de pesquisa do usuário por meio de perguntas e respostas com IA. No entanto, embora o recurso possa fornecer respostas com base em posts e comentários da plataforma, o feedback dos usuários não tem sido positivo, com muitos considerando que a prioridade deveria ser a melhoria do mecanismo de busca. O recurso está atualmente em teste com um número limitado de usuários nos EUA e ainda não foi lançado na plataforma Android.

【Resumo AiBase:】
🔍 O novo recurso "Reddit Answers" está em teste com usuários limitados nos EUA, com o objetivo de melhorar a experiência de busca.
🤖 O recurso utiliza posts e comentários da plataforma Reddit para fornecer perguntas e respostas com IA.
😟 A recepção dos usuários tem sido morna, com muitos expressando insatisfação com a prioridade dada à melhoria do mecanismo de busca.

11. Tesla Tao Lin: manterá a rota de direção autônoma puramente visual

A vice-presidente da Tesla, Tao Lin, reafirmou a determinação da empresa em manter a rota puramente visual em sua tecnologia de direção autônoma. Ela enfatizou que apenas a combinação de câmeras e redes neurais visuais pode simular melhor os hábitos de direção humana, alcançando uma direção autônoma totalmente segura e inteligente. O chip AI4 da Tesla já está equipado em todos os modelos à venda, com um aumento significativo na capacidade de processamento, marcando que a empresa está preparada em termos de hardware para a direção autônoma completa.

【Resumo AiBase:】
🔍 A Tesla mantém sua abordagem de direção autônoma totalmente visual, considerando-a a solução mais segura e inteligente.
💡 A tecnologia de direção autônoma emprega um modelo de linguagem grande de ponta a ponta, alcançando todo o processo, da entrada de fótons à saída de decisão.
📈 Todos os modelos à venda estão equipados com o chip AI4 mais recente, com aumento de 5 vezes na capacidade de processamento, preparando o terreno para a direção autônoma completa.

12. Recuperação surpreendente! A nova administração da Stability AI elimina dívidas e alcança crescimento de três dígitos em seis meses

Sob a liderança do novo CEO, Prem Akkaraju, a Stability AI, após seis meses de esforços, alcançou um crescimento de três dígitos em seus negócios e eliminou todas as suas dívidas. Akkaraju destacou a saúde do balanço patrimonial da empresa e focou no rápido desenvolvimento de APIs e serviços de licenciamento. A formação da nova equipe administrativa atraiu o retorno de investidores que haviam se retirado, sinalizando uma perspectiva positiva para a empresa.

【Resumo AiBase:】
💼 O novo CEO da Stability AI, Prem Akkaraju, afirma que a empresa alcançou um crescimento de três dígitos em seus negócios e está livre de dívidas.
📈 A nova equipe administrativa completou a recuperação em seis meses, atraindo o retorno de investidores que haviam se retirado.
🎥 O renomado diretor James Cameron se juntou ao conselho de administração da Stability AI, demonstrando uma retomada da confiança do setor.

13. Zhiyuan lança o modelo de geração 3D See3D para aprendizado de vídeo sem anotações

Notícias de IA

IA Diário

Linha do Tempo da IA

Al hardware

Casos Recentes

Coleção de Imagens

Coleção de Vídeos

Coleção de Áudios

Coleção de Conteúdo

Tutoriais Recentes

Ranking de Produtos de IA

Ranking de Crescimento de Tráfego de IA

Ranking de Queda de Tráfego de IA

Ranking Semanal de IA

Estados Unidos

China

Índia

Brasil

Geração de Imagens

Assistente Pessoal

Geração de Personagens

Geração de Vídeos

Ranking de Projetos de IA

Ranking de Crescimento de Projetos de IA

Ranking de Desenvolvedores de IA

Ranking de Organizações de IA

Deepseek

TTS

LLM

ChatGPT

Visão Geral

Boletim Diário de IA: OpenAI lança o impressionante Sora; Modelo multimodais gratuito GLM-4V-Flash da Zhihu AI; Tencent Cloud cria assistente de código de IA

站长之家

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

Revolução nos grandes modelos! Como o Gemini 2.5 Pro revoluciona a forma como tratamos as informações

Diário de IA: Alibaba Tongyi lança modelo Qwen-TTS; Cursor já suporta navegador e celular; ByteDance lança tecnologia de composição de imagens XVerse

Novo modelo de recomendação da Taobao RecGPT lançado, experiência de compras aprimorada

PerMAXity: Análise de Investimento Impulsionada por IA e Geração Automática de Relatórios Financeiros Compreensivos

Meta cria laboratório de inteligência superinteligente e lidera uma nova era na inteligência artificial

NoteGen surge: um poderoso recurso de anotações baseado em IA para plataformas múltiplas, entrando em uma nova era de gestão do conhecimento

Microsoft lança sistema MAI-DxO de inteligência artificial, aumento quatro vezes na precisão do diagnóstico médico

RecGPT, o grande modelo de recomendação de bilhões de parâmetros da Alibaba Group, é oficialmente lançado na Quarta Tecnologia do Jovem Duro 4.0

TEN VAD impressiona com código aberto: ferramenta de detecção de voz corporativa cria um assistente de voz inteligente super inteligente!

Chai-2 é lançado com impacto: design de anticorpos sem amostra usando IA, acelerando o desenvolvimento de medicamentos cem vezes mais rápido