Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais destaques do campo da IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.
Novos produtos de IA Clique para saber mais: https://top.aibase.com/
1、Chegou com impacto! O SD3.5L da Stability AI adiciona três novas funções ControlNet, aprimorando ainda mais a capacidade de geração de imagens
A Stability AI lançou a nova versão do Stable Diffusion 3.5 Large, adicionando três novas funções ControlNet: Blur, Canny e Depth, melhorando significativamente a capacidade de geração de imagens. Os usuários podem usar o modelo gratuitamente sem fins comerciais, e empresas pequenas e criadores com receita anual inferior a US$ 1 milhão também podem usufruir do uso comercial gratuito.
【Resumo AiBase:】
🌟 Adicionadas três novas funções ControlNet: Blur, Canny e Depth, melhorando a capacidade de geração de imagens.
💼 Acordo de uso gratuito: indivíduos e empresas com receita anual inferior a US$ 1 milhão podem usar o modelo gratuitamente.
🔒 Segurança em destaque: A Stability AI está tomando medidas para evitar o uso indevido do modelo.
Link para detalhes: https://stability.ai/news/sd3-5-large-controlnets
2、Kimi testa internamente a função de geração de vídeo com IA: 100 segundos de criação gratuitos por dia
A ferramenta de bate-papo de inteligência artificial Kimi está testando internamente seu inovador serviço de geração de vídeo com IA - Espaço de Criação Kimi. Atualmente em fase de teste beta, visa fornecer aos usuários uma nova forma de expressão criativa. Os usuários podem usar 12 modelos de estilo predefinidos e recursos de criação personalizados para criar vídeos musicais personalizados, com 100 segundos de vídeo gratuitos por dia.
【Resumo AiBase:】
🎨 O Espaço de Criação Kimi oferece 12 estilos predefinidos e recursos personalizados, permitindo que os usuários criem vídeos personalizados livremente.
🎶 Os usuários podem gerar 100 segundos de vídeo gratuitamente por dia, aumentando significativamente a flexibilidade da criação.
💡 O recurso suporta descrições detalhadas de cenas de vídeo, oferecendo mais possibilidades para a expressão criativa e impulsionando o desenvolvimento da tecnologia de geração de vídeo com IA.
3、Infinito crossover! A Zhishu AI lança uma versão atualizada do AutoGLM, controlando aplicativos em toda a web com uma única frase
A Zhishu AI lançou recentemente várias versões atualizadas do AutoGLM, incluindo versões para navegador e computador, demonstrando uma poderosa capacidade de operação entre aplicativos. Os usuários podem simplesmente usar uma frase para alternar e operar livremente entre vários aplicativos, aumentando significativamente a eficiência.
【Resumo AiBase:】
⚡ Capacidade de operação entre aplicativos: os usuários podem operar entre vários aplicativos com apenas uma frase, aumentando significativamente a eficiência do uso.
🖥️ Controle por voz GLM-PC: controle o computador diretamente por meio de comandos de voz, simplificando o fluxo de trabalho e tornando-se um salvador para os trabalhadores.
🌟 Assistente multifuncional AutoGLM: suporta aplicativos principais, permitindo que os usuários concluam facilmente tarefas como pedir comida e pesquisar, mostrando a inteligência e flexibilidade da IA.
4、Robô "Optimus" da Tesla atualizado: design de mão mais ágil e sensível!
A Tesla fez uma grande atualização no design das mãos de seu robô humanoide "Optimus", adicionando 22 graus de liberdade e uma camada protetora macia, melhorando a flexibilidade e a capacidade de detecção tátil do robô. Essa inovação oferecerá mais possibilidades para o uso do robô em áreas como casa, saúde e indústria, mostrando a exploração contínua da Tesla na área de robótica.
【Resumo AiBase:】
🤖 Novo design de mão com 22 graus de liberdade, melhorando a flexibilidade e precisão da operação.
🛡️ A camada protetora adicionada aumenta a capacidade de detecção tátil, permitindo o manuseio seguro de itens delicados.
⚙️ Todos os acionadores são integrados no antebraço, com o objetivo de concluir a integração do sensor e reduzir o peso até o final do ano.
5、A Amazon está desenvolvendo um novo modelo de linguagem multimodal "Olympus", que pode estrear na conferência da AWS
A Amazon está desenvolvendo um grande modelo de linguagem multimodal chamado "Olympus", que deve ser lançado na conferência AWS re:Invent da próxima semana. O modelo não apenas processa texto, mas também imagens e vídeos, com amplo potencial de aplicação.
【Resumo AiBase:】
💡 O novo modelo "Olympus" processará texto, imagens e vídeos, suportando a pesquisa em linguagem natural de clipes de vídeo específicos.
🚀 O modelo deve ser lançado oficialmente na conferência AWS re:Invent da próxima semana, possivelmente como parte do AWS Bedrock.
🔧 A estratégia de IA da Amazon inclui não apenas software, mas também desenvolvimento de hardware, lançando uma série de chips dedicados para treinamento e inferência.
6、Rhymes AI lança o modelo revolucionário de geração de texto, imagem e vídeo Allegro-TI2V
O modelo Allegro-TI2V, lançado recentemente pela Rhymes AI, representa um grande avanço na tecnologia de geração de vídeo a partir de texto. O modelo não apenas suporta um comprimento de contexto de até 79,2K e uma resolução de saída de 720×1280, mas também possui uma capacidade eficiente de geração de vídeo, atendendo às necessidades de criadores em áreas como cinema, jogos e arte digital.
【Resumo AiBase:】
🚀 O Allegro-TI2V suporta comprimento de contexto de até 79,2K e resolução de 720×1280, com velocidade de geração de vídeo de até 15 quadros por segundo.
🎨 O modelo introduziu dois novos modos: geração de vídeo subsequente e geração de vídeo intermediária, melhorando significativamente a flexibilidade e eficiência da criação de vídeo.
💻 A Rhymes AI lançou o Allegro-TI2V sob a licença Apache2.0, os usuários podem começar rapidamente com uma simples instalação, com amplas perspectivas de aplicação.
Link para detalhes: https://huggingface.co/rhymes-ai/Allegro-TI2V
7、Assustador! A IA replica perfeitamente a personalidade de uma pessoa com apenas duas horas de entrevista, com 85% de precisão!
Recentemente, uma equipe de pesquisa em colaboração com o Google DeepMind desenvolveu um novo aplicativo de IA que pode gerar simulações de personalidade com até 85% de precisão após apenas duas horas de entrevista. Essa tecnologia é baseada no modelo de linguagem grande ChatGPT, que entende profundamente as características de personalidade por meio de perguntas e registros das respostas dos participantes.
【Resumo AiBase:】
🔍 O modelo de IA gera simulações de personalidade após duas horas de entrevista, com 85% de precisão.
💡 Essa tecnologia visa reduzir os custos e o tempo de pesquisa sociológica, melhorando a eficácia e abrangência das pesquisas.
🤖 As personalidades simuladas são chamadas de "agentes" e podem melhorar a interação humano-computador em assistentes de trabalho e robôs pessoais no futuro.
Link para detalhes: https://techxplore.com/journals/arxiv/
8、A Gu Dong Technology lança óculos AI + AR bicolor com visão completa: uso sem esforço + lentes de alta definição
Os óculos Star1 e Star1S da Gu Dong Technology representam a combinação perfeita de IA e AR, oferecendo exibição em cores e recursos de IA poderosos. Os óculos não apenas consideram o conforto de uso no design, mas também alcançaram alta qualidade de imagem e aplicação de sistemas de IA multimodais na tecnologia. O Star1S, o primeiro óculos AR de guia de onda de matriz bicolor em cores do setor, deve ser lançado em dezembro.
【Resumo AiBase:】
🖼️ O Star1S é o primeiro óculos AR de guia de onda de matriz bicolor em cores, oferecendo maior conforto de uso e clareza de imagem.
🤖 Equipado com um sistema de IA multimodal, o Star1S oferece longa duração em vários ambientes, atendendo às necessidades de diferentes cenários.
📱 Suporta compatibilidade com aplicativos principais, os usuários podem atender chamadas e assistir vídeos diretamente pelos óculos, com funções semelhantes às de um smartphone.
9. ChatGPT completa dois anos, número de usuários ultrapassa 200 milhões
Desde seu lançamento em 2022, o ChatGPT experimentou um rápido desenvolvimento, tornando-se uma ferramenta digital essencial na vida cotidiana. O número de usuários aumentou rapidamente em pouco tempo, ultrapassando 200 milhões, com 3,1 bilhões de visitas mensais. O lançamento do novo GPT-4o e da função de pesquisa melhorou a experiência do usuário, mas ainda existem problemas de precisão da informação e questões éticas. A OpenAI está trabalhando para resolver esses desafios para otimizar ainda mais seus serviços e a confiança do usuário.
【Resumo AiBase:】
🌐 O número de usuários do ChatGPT aumentou rapidamente em dois anos, tornando-se um assistente digital importante em casa.
🔍 A nova função de pesquisa melhorou a forma de obter informações, desafiando os mecanismos de pesquisa tradicionais.
⚖️ O ChatGPT ainda enfrenta problemas de precisão de informações e questões éticas, exigindo soluções adicionais.
10、Ascensão meteórica! xAI atinge avaliação de US$ 50 bilhões em pouco mais de um ano
A empresa de inteligência artificial de Elon Musk, xAI, atingiu uma avaliação de US$ 50 bilhões em apenas 16 meses, superando muitos concorrentes. Em comparação com a OpenAI, a rápida ascensão da xAI demonstra seu enorme potencial e atratividade de mercado no campo da IA. A empresa consolidou ainda mais sua posição no setor por meio de financiamento e inovação tecnológica, especialmente na construção de supercomputadores.
【Resumo AiBase:】
🚀 A xAI atingiu uma avaliação de US$ 50 bilhões em 16 meses, superando várias concorrentes.
💰 Recentemente concluiu um financiamento de US$ 5 bilhões para a compra de chips NVIDIA, apoiando a construção de supercomputadores.
🤖 O chatbot Grok tornou-se um forte concorrente no mercado, melhorando sua capacidade de resposta por meio de treinamento em mídia social.