Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais destaques do campo da IA, com foco em desenvolvedores, ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.
Novos produtos de IA Clique para saber mais:https://top.aibase.com/
1、Kimi lança modo de chamada de voz multifuncional com suporte para alteração de voz e ajuste de velocidade
O assistente de inteligência artificial Kimi lançou recentemente o aguardado recurso de chamadas de voz, oferecendo aos usuários uma experiência interativa rica. O novo recurso combina aplicativos diversificados e experiências personalizadas para melhorar a eficiência da comunicação e atender às necessidades individuais. O aplicativo foi aprimorado para cenários específicos, como prática de inglês e simulações de entrevistas, oferecendo soluções inovadoras para aprendizado e carreira. A tecnologia de clonagem de voz adiciona diversão, e o feedback contínuo do usuário ajuda a otimizar e expandir a gama de aplicativos de serviços de voz.
【AiBase destaca:】
🌟 O assistente Kimi atualizou o recurso de chamada de voz, melhorando a experiência interativa do usuário.
🎤 Suporta legendas em tempo real e voz ajustável, para uma interação mais natural.
🤖 Introduz a tecnologia de clonagem de voz, aumentando a diversão e os cenários de aplicação.
2、Modelo CogView3-Plus da Zhipu é de código aberto: uma nova era para a tecnologia de geração de imagens a partir de texto
A equipe de tecnologia Zhipu lançou o CogView3 e sua versão atualizada, o CogView3-Plus-3B, marcando uma nova fase na criação de arte assistida por IA. O CogView3 tem um desempenho impressionante, 77% superior ao SDXL, com uma velocidade de inferência apenas um décimo da do SDXL. O CogView3-Plus introduz a estrutura DiT e o mecanismo de atenção conjunta texto-imagem para melhorar o desempenho e reduzir os custos. O repositório de código aberto já está disponível, impulsionando o rápido desenvolvimento do campo de geração de imagens de IA, e as perspectivas de aplicação da tecnologia de geração de imagens a partir de texto são amplas.
【AiBase destaca:】
🚀 CogView3 e CogView3-Plus-3B de código aberto, marcando uma nova fase na criação de arte assistida por IA.
💡 O CogView3 tem um desempenho impressionante, 77% superior ao SDXL, com uma velocidade de inferência apenas um décimo da do SDXL.
💻 O CogView3-Plus introduz a estrutura DiT e o mecanismo de atenção conjunta texto-imagem para melhorar o desempenho e reduzir os custos.
Link para detalhes:https://top.aibase.com/tool/cogview3Plus
3、Adobe lança modelo de vídeo Firefly AI, Photoshop adiciona vários recursos de IA
Na última conferência MAX, a Adobe lançou o modelo de vídeo Firefly AI e várias ferramentas aprimoradas do Photoshop, oferecendo aos usuários novos e emocionantes recursos de IA. O modelo de vídeo Firefly permite que os usuários criem ou modifiquem conteúdo de vídeo por meio de prompts de texto, oferecendo aos criadores um novo espaço criativo. Ao mesmo tempo, as novas ferramentas de IA do Photoshop, como a ferramenta de remoção e o recurso de preenchimento generativo, tornam a edição de imagens mais fácil para os usuários. A Adobe promete usar apenas conteúdo licenciado para treinar modelos e lançou credenciais de conteúdo para aumentar a transparência.
【AiBase destaca:】
📹 O modelo de vídeo Firefly AI permite que os usuários criem e modifiquem conteúdo de vídeo por meio de texto, oferecendo aos criadores um novo espaço criativo.
🖼️ O Photoshop adicionou várias ferramentas de IA, como a ferramenta de remoção e o preenchimento generativo, ajudando os usuários a editar imagens com mais facilidade.
🔍 A Adobe promete usar apenas conteúdo licenciado para treinar modelos e lançou credenciais de conteúdo para aumentar a transparência.
Link para detalhes:https://blog.adobe.com/en/publish/2024/09/11/bringing-gen-ai-to-video-adobe-firefly-video-model-coming-soon
4、ChatGPT se transforma: nova interface introduz recurso de pesquisa
A OpenAI recentemente fez uma grande atualização no ChatGPT, transformando-o de um simples assistente de conversação em uma plataforma de informações abrangente. A atualização da interface inclui o novo recurso Canvas e a posição da caixa de prompt móvel, tornando a experiência do usuário mais conveniente. O recurso SearchGPT permite que os usuários acessem dados da web em tempo real e colabora com editores renomados para garantir a confiabilidade das informações.
【AiBase destaca:】
🔍 Novo design de interface: adiciona o recurso Canvas e a posição da caixa de prompt móvel, melhorando a experiência do usuário.
🌐 Introduz o recurso SearchGPT: pressione a tecla / para ativar, acesse dados da web em tempo real, com citações e links embutidos.
💡 Fácil de usar: operação intuitiva, fornece respostas com origem em segundos após a pergunta, permitindo perguntas adicionais para discutir tópicos em profundidade.
5、A Volcano Engine lança uma solução de pré-processamento de vídeo para treinamento de modelos grandes
Na recente conferência de tecnologia de nuvem de vídeo, a Volcano Engine lançou uma solução de pré-processamento de vídeo para treinamento de modelos grandes, uma tecnologia que já foi aplicada com sucesso ao modelo de geração de vídeo Doubao, marcando um grande avanço na tecnologia de geração de vídeo de IA.
【AiBase destaca:】
🔑 A tecnologia AIGC e multimídia está mudando profundamente a experiência do usuário.
🔑 A Volcano Engine explora a integração de modelos grandes de IA e tecnologia de vídeo, fornecendo soluções abrangentes.
🔑 O esquema de pré-processamento desenvolvido pela Volcano Engine otimiza os algoritmos e os aspectos de engenharia, melhorando a eficiência do treinamento do modelo.
6、Midjourney está prestes a lançar um editor online, versão V7 e recursos personalizados a caminho
A Midjourney anunciou recentemente uma série de atualizações emocionantes e novos recursos em breve, mostrando o rápido desenvolvimento e inovação da empresa na área de geração de imagens de IA. A equipe está ativamente promovendo vários projetos, focando em melhorar a qualidade e desenvolver recursos principais, em vez de lançar novos produtos com pressa.
【AiBase destaca:】
🚀 A Midjourney está prestes a lançar um novo editor online, permitindo que os usuários importem imagens e usem recursos de mapas de profundidade e reparo de imagens para edição.
💡 A equipe está otimizando a interface do usuário para diferenciar novos recursos dos recursos de imagem existentes e está discutindo quais recursos incluir no lançamento inicial.
🔧 A Midjourney está desenvolvendo novas ferramentas para tornar mais fácil para os usuários gerenciar e alternar entre várias configurações personalizadas, introduzindo um sistema de personalização de estilo mais refinado.
7、A Microsoft está criando um companheiro de IA que pode "ver" e "lembrar" todos os comportamentos do usuário
Recentemente, a Microsoft tem se dedicado ao desenvolvimento de um companheiro de IA que pode observar o comportamento do usuário em tempo real, com o objetivo de construir um relacionamento interativo profundo. Isso reflete a necessidade básica humana de confissão, compreensão e companhia. Ao mesmo tempo, o novo recurso Recall do Windows pode explorar profundamente o histórico digital do usuário, reproduzindo experiências passadas. O Zoom lançou o recurso de clonagem de IA, permitindo que os usuários enviem suas versões digitais para participar de reuniões, melhorando a eficiência do trabalho.
【AiBase destaca:】
🌟 A Microsoft está desenvolvendo um companheiro de IA que pode observar o comportamento do usuário em tempo real, com o objetivo de construir um relacionamento interativo profundo.
📂 O novo recurso Recall do Windows pode explorar profundamente o histórico digital do usuário, reproduzindo experiências passadas.
💬 O Zoom lançou o recurso de clonagem de IA, permitindo que os usuários enviem suas versões digitais para participar de reuniões, melhorando a eficiência do trabalho.
8、Vice-presidente de IA da Microsoft muda para OpenAI para se dedicar à pesquisa de AGI
Sebastian Bubeck, vice-presidente de IA da Microsoft, deixou a Microsoft para se juntar à OpenAI e se dedicar à pesquisa de inteligência artificial geral (AGI). Essa mudança marca uma reviravolta na carreira de Bubeck e adiciona um forte apoio ao desenvolvimento da OpenAI.
【AiBase destaca:】
🧠 Bubeck deixou a Microsoft e se juntou à OpenAI para se concentrar na pesquisa de AGI.
🤝 O relacionamento entre a Microsoft e a OpenAI é complexo, sendo ambas investidoras e concorrentes, e ambas esperam continuar cooperando.
🚀 A entrada de Bubeck impulsionará a OpenAI a fazer avanços em modelos de linguagem menores e na pesquisa de AGI.
9、Impressionante! O modelo de IA DIAMOND pode simular Counter-Strike, funcionando em uma única RTX3090
Pesquisadores desenvolveram o modelo de IA DIAMOND, capaz de simular o jogo Counter-Strike: Global Offensive, rodando em uma placa de vídeo Nvidia RTX3090 a 10 quadros por segundo. Embora existam algumas falhas, espera-se que no futuro o desempenho do modelo seja melhorado com o aumento de dados e capacidade de computação.
【AiBase destaca:】
🎮 O modelo DIAMOND pode simular o jogo CS:GO a 10 quadros por segundo.
📊 Treinado com apenas 87 horas de dados de jogo, ainda consegue simular cenários de jogo complexos.
🐛 Existem falhas, como saltos infinitos e desvios de rota que causam falhas na simulação, mas há potencial para melhorias no futuro.
Link para detalhes:https://diamond-wm.github.io/
10、A demanda pela GPU Blackwell da Nvidia está em alta, com o fornecimento esgotado para os próximos 12 meses
A mais recente geração de GPUs Blackwell da Nvidia gerou uma demanda sem precedentes, e o CEO Jensen Huang revelou que o fornecimento para os próximos 12 meses já está esgotado, mais uma vez confirmando o desejo do mercado por computação de alto desempenho.
【AiBase destaca:】
💡 A demanda pela GPU Blackwell está explodindo, com o fornecimento esgotado para os próximos 12 meses.
🔍 Os principais clientes incluem grandes empresas de tecnologia como AWS e Google, impulsionando o crescimento do mercado.
📈 A NVIDIA prevê o envio de bilhões de dólares em GPUs Blackwell em 2024, com um crescimento significativo na receita de data centers.
11、A ação da Nvidia atinge um novo recorde histórico, com valor de mercado próximo a US$ 3,4 trilhões
As ações da Nvidia atingiram um novo recorde histórico nesta semana, com valor de mercado próximo a US$ 3,4 trilhões, entusiasmando os investidores. A fortuna pessoal do CEO Jensen Huang ultrapassou US$ 121,5 bilhões, com a alta demanda pelo novo chip Blackwell. A Nvidia consolidou sua liderança no mercado de chips de IA, com valor de mercado apenas inferior ao da Apple, demonstrando sua força.
【AiBase destaca:】
🚀 A ação da Nvidia atingiu um novo recorde de US$ 138,07, com alta de quase 180% no ano.
📊 A empresa detém uma participação de mercado de 70% a 95% no mercado de chips de IA, com valor de mercado de US$ 3,4 trilhões.
💡 O CEO Jensen Huang disse que a demanda pelo novo chip Blackwell é "insana" e já está esgotada até o próximo ano.