Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais assuntos do campo da IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.

Novos produtos de IA Saiba mais:https://top.aibase.com/

1、Kuaishou lança o aplicativo independente “Ke Ling AI”, intensificando o desenvolvimento de criação de IA para dispositivos móveis

A Kuaishou lançou recentemente o aplicativo independente “Ke Ling AI”, dedicado a expandir o campo da criação de IA em dispositivos móveis. O aplicativo é baseado nos modelos de linguagem grandes Ke Ling e Ke Tu, desenvolvidos pela própria Kuaishou, e oferece recursos de geração e edição de vídeos e imagens. Embora suas funcionalidades sejam menos abrangentes que a versão para web, já atraiu 3,6 milhões de usuários, que criaram mais de 37 milhões de vídeos e 100 milhões de imagens. Ele concorre diretamente com o aplicativo “Ji Meng AI” do Douyin.

image.png

【AiBase em resumo:】

🚀 A Kuaishou lança o aplicativo independente “Ke Ling AI”, expandindo o desenvolvimento de criação de IA para dispositivos móveis.

💡 O aplicativo “Ke Ling AI” é baseado em modelos de linguagem grandes próprios, oferecendo recursos de geração e edição de vídeos e imagens.

💪 Já atraiu 3,6 milhões de usuários, que criaram mais de 37 milhões de vídeos e 100 milhões de imagens. Concorre com o “Ji Meng AI” do Douyin.

2、Zhihu AI open-source o modelo de vídeo CogVideoX v1.5 mais recente

A equipe de tecnologia da Zhihu lançou o modelo de geração de vídeo CogVideoX v1.5 mais recente e o tornou open-source. Esta versão apresenta melhorias significativas na capacidade de geração de vídeo, suportando vídeos de 5/10 segundos, resolução de 768P e capacidade de geração de 16 quadros. A nova plataforma Qingying foi lançada, combinada com o modelo de efeitos sonoros CogSound, oferecendo geração de vídeo 4K ultra-HD. O processamento de dados e a inovação de algoritmos garantem a qualidade e a coerência do vídeo.

image.png

【AiBase em resumo:】

🚀 CogVideoX v1.5 open-source, suporta vídeos de 5/10 segundos, resolução de 768P e capacidade de geração de 16 quadros.

🎬 Nova plataforma Qingying lançada, combinada com o modelo de efeitos sonoros CogSound, oferecendo geração de vídeo 4K ultra-HD.

🔬 Processamento de dados e inovação de algoritmos garantem a qualidade e a coerência dos vídeos gerados.

Link para detalhes:https://github.com/thudm/cogvideo

3、Relatório indica que o Baidu lançará óculos inteligentes com assistente de IA integrado, baseado no modelo Wenxin

O Baidu planeja lançar óculos inteligentes com assistente de IA Xiaodu integrado, que serão apresentados na Conferência Mundial do Baidu de 2024. Os óculos possuem recursos inovadores, oferecendo uma experiência inteligente totalmente nova.

【AiBase em resumo:】

🌟 Os óculos serão equipados com uma câmera, suportando a captura de fotos e vídeos.

📷 Os óculos suportam interação de voz baseada no modelo Ernie, melhorando a experiência do usuário.

🗣️ Os óculos inteligentes do Baidu fornecerão soluções mais personalizadas e adequadas às necessidades dos usuários chineses.

4、Jogadores ávidos se alegram! O Krea AI lança a função de treinamento Lora

O Krea AI lançou a função de treinamento Lora, oferecendo aos usuários serviços de treinamento personalizados para personagens, estilos e produtos. Os usuários podem carregar várias imagens para iniciar o treinamento, com uma interface simples e fácil de usar. As configurações dos parâmetros de treinamento são simples, o efeito de treinamento é bom e é amigável para usuários iniciantes. O preço para membros é de US$ 10 por mês e suporta uso comercial.

【AiBase em resumo:】

🔥 O Krea AI lança a função de treinamento Lora, permitindo que os usuários personalizem personagens, estilos e produtos.

💡 Interface simples, carregue as imagens e configure os parâmetros básicos, o processo de treinamento é simples e fácil de usar.

💰 Preço para membros de US$ 10 por mês, podendo gerar 720 imagens FLux e 36.000 imagens em tempo real, com suporte para uso comercial.

Link para detalhes:https://www.krea.ai/train

5、Ke Ling lança função de modelo personalizado, superando o desafio da consistência de personagens na geração de vídeos de IA

A função de modelo personalizado lançada recentemente pela Ke Ling representa um avanço significativo no campo da geração de vídeos de IA, resolvendo o desafio técnico da consistência de personagens. Esta função permite que os criadores carreguem vários clipes de vídeo para treinamento, suportando o uso de vídeos de IA gerados pela própria Ke Ling, oferecendo maior flexibilidade. Após o treinamento, o sistema pode gerar conteúdo de vídeo mantendo a consistência dos personagens, mostrando as possibilidades criativas vibrantes.

image.png

【AiBase em resumo:】

🔑 Os criadores podem carregar vários clipes de vídeo para treinamento de modelos, suportando o uso de vídeos de IA gerados pela própria Ke Ling, oferecendo maior flexibilidade.

🚀 Após o treinamento, o sistema pode gerar conteúdo de vídeo mantendo a consistência dos personagens, mostrando a visualização em 360 graus e características de aparência estáveis em cenários complexos.

💡 A versão KLING 1.5 suporta saída de vídeo HD 1080p, oferecendo várias opções de formato para atender às necessidades de conteúdo de diferentes plataformas. A ferramenta de pincel de ação melhora a precisão e a flexibilidade da criação de vídeos.

6、Pequeno e poderoso! Modelo de IA visual de bolso moondream2, pode ser executado em telefones celulares

O moondream2, lançado pela Moondream, é um modelo de linguagem visual compacto e de alto desempenho, com apenas 1,6 bilhão de parâmetros, podendo ser executado em dispositivos pequenos, como smartphones. O modelo possui poderosas capacidades de processamento de texto e imagem, apresentando excelente desempenho em vários testes de referência. A equipe da Moondream continua atualizando o desempenho do modelo, tendo arrecadado com sucesso US$ 4,5 milhões em financiamento, com um CEO experiente.

image.png

【AiBase em resumo:】

🌟 A Moondream lança o moondream2, com apenas 1,6 bilhão de parâmetros, podendo ser executado em dispositivos pequenos, como smartphones.

💰 A Moondream arrecadou com sucesso US$ 4,5 milhões em financiamento, o CEO trabalhou na Amazon e a equipe continua atualizando e melhorando o desempenho do modelo.

📈 O moondream2 possui poderosas capacidades de processamento de texto e imagem, podendo responder a perguntas, realizar OCR, contagem e classificação de objetos, com excelente desempenho em testes de referência.

Link para detalhes:https://huggingface.co/vikhyatk/moondream2

7、Xiaomi anuncia atualização do modelo de linguagem grande Xiao Ai: função “Perguntas e Respostas sobre Música” com suporte em vários dispositivos

A Xiaomi anunciou oficialmente a atualização das capacidades musicais do modelo de linguagem grande Xiao Ai, adicionando a função “Perguntas e Respostas sobre Música”, que os usuários podem experimentar em vários dispositivos. Esta função é baseada na melhoria das capacidades de inteligência artificial, ajudando os usuários a pesquisar informações sobre músicas e responder a perguntas sobre conhecimento musical profissional. O Xiao Ai passou por uma grande atualização de versão em julho deste ano, melhorando significativamente as funções de perguntas e respostas naturais e de assistente inteligente, melhorando a experiência do usuário.

image.png

【AiBase em resumo:】

🎵 O Xiao Ai da Xiaomi adicionou a função “Perguntas e Respostas sobre Música”, suportando pesquisas de informações sobre músicas e respostas a perguntas sobre conhecimento musical profissional.

📱 A função é aplicável a vários dispositivos, os usuários precisam atualizar o Xiao Ai para a versão mais recente.

🚗 Em atualizações anteriores, o Xiao Ai melhorou significativamente várias funções de perguntas e respostas naturais e de assistente inteligente, melhorando a experiência do usuário.

8、Mistral AI lança API de moderação de conteúdo multilíngue, desafiando a OpenAI

A Mistral AI lançou uma nova API de moderação de conteúdo, destinada a competir com líderes do setor, resolvendo problemas de segurança de IA e filtragem de conteúdo. A API é baseada no modelo Ministral8B, podendo detectar vários tipos de conteúdo prejudicial, suportando vários idiomas e já está em uso na plataforma Le Chat. A Mistral colabora com várias empresas, mostrando sua tecnologia madura e perspectiva europeia.

image.png

【AiBase em resumo:】

🌍 Suporte multilíngue: A API cobre 11 idiomas, detectando conteúdo sexualmente explícito, discurso de ódio e outros conteúdos prejudiciais.

🔗 Colaboração com empresas: Aplicação na plataforma Le Chat, colaboração com Microsoft Azure, Qualcomm e outras empresas.

🔒 Vantagem tecnológica: Com base no contexto da conversa, melhora a capacidade de detecção de conteúdo potencialmente prejudicial.

Link para detalhes:https://docs.mistral.ai/capabilities/guardrailing/

9、Chegou a “língua eletrônica” de IA! Pode saborear o gosto dos alimentos e detectar facilmente o frescor dos alimentos

Cientistas desenvolveram com sucesso um novo dispositivo chamado “língua eletrônica”, que utiliza tecnologia de inteligência artificial para distinguir com precisão diferentes misturas de café, detectar o frescor de alimentos e bebidas, fornecendo novas soluções para detecção de alimentos e controle de qualidade. A língua eletrônica imita a tecnologia do paladar humano, melhorando a precisão e a eficiência do trabalho, podendo acelerar o desenvolvimento de sabores e garantir a qualidade do produto. Possui função de monitoramento do frescor dos alimentos, protegendo a saúde dos consumidores e o controle de qualidade dos comerciantes. As perspectivas futuras de aplicação são amplas, podendo ser expandidas para várias áreas, como medicina e monitoramento ambiental.

image.png

【AiBase em resumo:】

🌟 A língua eletrônica utiliza tecnologia de inteligência artificial para distinguir com precisão diferentes misturas de café.

🍽️ Detecta o frescor de alimentos e bebidas, prevenindo a deterioração.

🔬 No futuro, a língua eletrônica poderá ser aplicada em várias áreas, como medicina e monitoramento ambiental.

Link para detalhes:https://www.nature.com/articles/s41586-024-08003-w

10、Tecnologia de ponta do Google ReCapture: pode gerar instantaneamente vídeos de “múltiplas câmeras”

A tecnologia ReCapture é uma tecnologia inovadora lançada pelo Google Research, que permite aos usuários experimentar o conteúdo de vídeo original a partir de uma nova perspectiva, regenerando vídeos com trajetórias de câmera personalizadas. O princípio por trás desta tecnologia não é complexo, através de modelos de difusão multiperspectivas e tecnologia de ajuste fino de vídeo mascarado, realiza a transformação de vídeos brutos em vídeos claros, coerentes e dinâmicos. Os pesquisadores do Google dizem que o ReCapture não requer uma grande quantidade de dados de treinamento, é aplicável a vários vídeos e conversões de perspectiva, permitindo que usuários comuns criem facilmente vídeos de “múltiplas câmeras” de nível profissional.

image.png

【AiBase em resumo:】

🔍 A tecnologia ReCapture permite que os usuários revivam vídeos, gerando novas versões com trajetórias de câmera personalizadas.

🛠️ Utiliza modelos de difusão multiperspectivas e tecnologia de ajuste fino de vídeo mascarado, realizando a transformação de vídeos brutos em vídeos claros, coerentes e dinâmicos.

🎥 O ReCapture não requer uma grande quantidade de dados de treinamento, é aplicável a vários vídeos e conversões de perspectiva, permitindo que usuários comuns criem vídeos de “múltiplas câmeras” de nível profissional.

Link para detalhes:https://generative-video-camera-controls.github.io/

11、OpenAI vence processo por direitos autorais, a legalização da coleta de dados de IA se torna uma tendência?

Recentemente, o Tribunal Distrital do Sul de Nova York rejeitou a ação por violação de direitos autorais movida pela Raw Story Media, Inc. e pela AlterNet Media, Inc. contra a OpenAI, considerando que o caso carecia de fundamento. Esta decisão marca uma vitória importante para a OpenAI em disputas legais entre IA e direitos autorais, fornecendo também uma referência para o tratamento de casos semelhantes no futuro. O tribunal decidiu rejeitar a ação, enfatizando que a natureza sintética do conteúdo de IA generativa torna menos provável a cópia literal, fornecendo referência e insights legais para o tratamento de disputas futuras entre IA e direitos autorais.

【AiBase em resumo:】

📜 Os autores não conseguiram provar danos reais causados pelas ações da OpenAI, o tribunal decidiu rejeitar a ação.

🔍 O juiz enfatizou que a natureza sintética do conteúdo de IA generativa torna menos provável a cópia literal.

⚖️ Esta decisão fornece referência e insights legais para o tratamento de disputas futuras entre IA e direitos autorais.

12、Microsoft Outlook lança temas dinâmicos personalizados baseados em IA, atualizados dinamicamente de acordo com o clima e a localização

A função de temas Copilot lançada recentemente pela Microsoft trouxe uma experiência visual personalizada para o Outlook, permitindo que os usuários personalizem sua aparência exclusiva. A função de tema baseada em IA não é apenas bonita e amigável, mas também pode ser atualizada dinamicamente com base em fatores como clima e localização, melhorando a experiência do usuário. Os usuários podem desfrutar de uma experiência de gerenciamento de e-mail mais agradável e personalizada.