Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais assuntos do campo de IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.
Novos produtos de IA Clique para saber mais: https://top.aibase.com/
1. A Apple lança uma bomba na WWDC: Siri com GPT-4o, toda a linha com IA generativa
Na Conferência Mundial de Desenvolvedores da Apple (WWDC) de 2024, a empresa anunciou que toda sua linha de produtos entraria na era da IA generativa, lançando o novo sistema inteligente personalizado Apple Intelligence. O núcleo da atualização é um serviço inteligente que combina modelos de IA generativa com dados do usuário, integrando-se profundamente ao iOS 18, iPadOS 18 e macOS Sequoia. A Siri foi transformada, com capacidade aprimorada de compreensão da linguagem e execução de operações entre aplicativos. O sistema integra o ChatGPT para fornecer recursos de compreensão de imagens e documentos, além de novas ferramentas de escrita e Image Playground.
【Resumo AiBase:】
🍎 O Apple Intelligence integra modelos de IA generativa e dados do usuário, fornecendo serviços inteligentes práticos e integrando-se profundamente ao iOS 18, iPadOS 18 e macOS Sequoia.
🤖 A Siri foi transformada, com capacidade aprimorada de compreensão da linguagem e suporte para execução de operações entre aplicativos. Os usuários podem interagir com a Siri digitando.
📸 O sistema integra o ChatGPT para fornecer recursos de compreensão de imagens e documentos, além de novas ferramentas de escrita e Image Playground, permitindo que os usuários criem imagens em estilo de animação, ilustração ou esboço.
Detalhes: https://www.chinaz.com/2024/0611/1622511.shtml
2. Apple e Google colaboram no modelo Gemini
A Apple anunciou uma parceria com o modelo Gemini do Google, abrindo o acesso a modelos de terceiros para oferecer mais opções aos usuários. A Siri integrará o ChatGPT, permitindo que os usuários conversem sem sair do Siri, mantendo o controle de privacidade. A Apple atualizou seu kit de desenvolvimento, integrando o ChatGPT da OpenAI pela primeira vez, e lançou uma série de novos recursos e atualizações.
【Resumo AiBase:】
🍎 A Apple e o modelo Gemini do Google colaboram, abrindo o acesso a modelos de terceiros e expandindo o ecossistema de inteligência artificial.
🤖 A Siri integra o ChatGPT, permitindo que os usuários conversem dentro do Siri, mantendo o controle de privacidade.
🚀 A Apple atualizou seu kit de desenvolvimento, integrando o ChatGPT da OpenAI pela primeira vez e lançando novos recursos do iOS 18 e VisionOS 2.
3. Grande reformulação do aplicativo Fotos do iOS 18: adição de remoção de IA e triagem inteligente para reduzir o escopo de pesquisa
No sistema iOS 18 recém-lançado pela Apple, o recurso de mensagens de texto foi completamente reformulado. Os usuários não apenas podem adicionar sublinhados e tachamentos ao conteúdo das mensagens de texto, mas também podem aplicar uma série de efeitos de texto dinâmicos, tornando cada mensagem única.
【Resumo AiBase:】
⭐️ A Apple e a OpenAI fecharam um acordo de parceria, e o iOS 18 introduzirá o recurso ChatGPT.
🤖 As perspectivas narrativas geradas pelo GPT-4 são informativas para o desempenho futuro das ações.
💬 O sistema iPadOS 18 não apenas suporta todos os recursos de personalização do iOS 18, mas também suporta a barra de ferramentas de uso frequente personalizada dentro de aplicativos personalizados.
Modelos de dispositivos compatíveis com a atualização do iOS 18: https://www.chinaz.com/2024/0611/1622488.shtml
4. Tencent lança novo modelo de vídeo a partir de imagem Follow-Your-Pose-v2
Este artigo apresenta o novo modelo de vídeo a partir de imagem "Follow-Your-Pose-v2", lançado pela equipe Tencent Hun Yuan em colaboração com a Universidade de Zhongshan e a Universidade de Ciência e Tecnologia de Hong Kong. Ele apresenta destaques como geração de ações de vídeo para várias pessoas, forte capacidade de generalização e tratamento correto de oclusões de pessoas. Este modelo tem um significado importante no campo da geração de vídeo e amplas perspectivas de aplicação.
【Resumo AiBase:】
🌟 Suporta geração de ações de vídeo para várias pessoas, com tempo de inferência reduzido.
🔥 Forte capacidade de generalização, capaz de gerar vídeos de alta qualidade, independentemente da idade, roupa, raça, complexidade do fundo ou complexidade da ação.
💡 Processamento correto de oclusões de pessoas, capaz de gerar cenas de oclusão com relação correta de frente e trás.
Página do projeto: https://top.aibase.com/tool/follow-your-pose
Endereço do artigo: https://arxiv.org/pdf/2406.03035
5. MotionFollower: replicação de ações de personagens sem alterar o fundo do vídeo
MotionFollower é uma tecnologia inovadora que pode replicar o movimento de um vídeo para um personagem em outro vídeo, mantendo a aparência do personagem inalterada. Esta tecnologia tem amplas aplicações, incluindo produção cinematográfica, criação de anúncios e desenvolvimento de jogos.
【Resumo AiBase:】
⚙️ MotionFollower é uma tecnologia inovadora que replica o movimento de um vídeo para outro personagem, mantendo sua aparência inalterada.
🌐 Ampla gama de aplicações, incluindo cinema, publicidade e jogos.
🎥 MotionFollower processa vídeos com amplos movimentos de câmera, permitindo a transferência de informações de movimento de alta qualidade.
Link para detalhes: https://top.aibase.com/tool/motionfollower
6. Adobe revisa os termos de serviço, esclarecendo que não usará as obras dos clientes para treinamento de IA
A Adobe anunciou uma revisão de seus termos de serviço, esclarecendo que não usará as obras dos clientes para treinamento de IA, com o objetivo de reconquistar a confiança dos usuários. Esta mudança foi anunciada após fortes protestos dos usuários na semana anterior.
【Resumo AiBase:】
🛡️ A Adobe revisou seus termos de serviço, esclarecendo que não usará as obras dos clientes para treinamento de IA.
💬 O presidente da Adobe admitiu que deveria ter esclarecido os termos de serviço mais cedo e disse que será mais transparente.
🖼️ As preocupações dos criadores com a Adobe ainda persistem, e a empresa está trabalhando para reconquistar a confiança.
7. OpenAI aprimora o recurso de voz do ChatGPT, permitindo que ele fale com vozes de diferentes personagens
A OpenAI atualizou recentemente o recurso de voz do ChatGPT, permitindo que os usuários interajam com o chatbot usando uma variedade de vozes e estilos de voz gerados por IA. O novo recurso permite que os usuários instruam o chatbot de IA a responder em tempo real usando qualquer voz, melhorando a interatividade e a acessibilidade.
【Resumo AiBase:】
🔊 O ChatGPT possui atualmente quatro vozes predefinidas e pode otimizar o estilo de voz em tempo real.
🗣️ Os usuários podem pedir à IA para dublar personagens de histórias, gerando vozes únicas, como o rugido de um leão.
🔜 A OpenAI lançará novos recursos de voz nas próximas semanas, disponíveis para todos os usuários do ChatGPT, com acesso prioritário para assinantes premium.
8. Superando o Instant3D! A Universidade Jiao Tong de Xangai lança a nova estrutura Bootstrap3D, melhorando significativamente a capacidade de geração 3D
Uma equipe de pesquisa da Universidade Jiao Tong de Xangai e da Universidade Chinesa de Hong Kong lançou uma nova estrutura chamada Bootstrap3D. Ao combinar modelos multimodais de percepção 3D ajustados, ela pode gerar automaticamente dados de imagem multivisuais de alta qualidade, melhorando significativamente a capacidade dos modelos de geração 3D. O conjunto de dados de síntese da estrutura foi totalmente aberto e está disponível gratuitamente para pesquisadores e desenvolvedores. Os recursos-chave da estrutura incluem pipeline de construção de dados, geração de prompts de texto, geração de imagens, síntese multivisual, seleção de qualidade e reescrita de descrições. A equipe de pesquisa também propôs uma estratégia de rearranjo de timestep de treinamento (TTR) para otimizar diferentes estágios do processo de denoising, resolvendo problemas no treinamento de modelos de difusão multivisual. Os resultados experimentais mostram que os modelos de difusão multivisual usando a estratégia TTR têm um desempenho superior em termos de alinhamento texto-imagem, qualidade da imagem e consistência de visualização, melhorando efetivamente os resultados da geração multivisual.
【Resumo AiBase:】
🔑 Pipeline de construção de dados: a geração automática de dados de imagem multivisual e texto descritivo detalhado é uma das principais inovações da estrutura.
🔑 Geração de prompts de texto: uso de modelos de linguagem grandes para gerar prompts de texto criativos e diversos, fornecendo material para a geração de imagens.
🔑 Síntese multivisual: expansão de imagens de visualização única para imagens multivisuais, garantindo consistência em diferentes perspectivas.
Link para detalhes: https://top.aibase.com/tool/bootstrap3d
9. Google lança a estrutura AGREE para melhorar a precisão do conteúdo gerado por modelos de linguagem grandes
O Google Research lançou a estrutura AGREE, projetada para melhorar a precisão do conteúdo e das referências geradas por modelos de linguagem grandes. A estrutura melhora a precisão das respostas recuperando parágrafos relevantes e fornece aos usuários uma maneira de verificar a autenticidade das informações. As tecnologias principais incluem ajuste fino na fase de treinamento e adaptação em tempo de teste. Os resultados experimentais mostram que o AGREE se destaca em melhorar a precisão e a capacidade de referência das respostas de conteúdo.
【Resumo AiBase:】
🔍 A estrutura AGREE visa melhorar a precisão do conteúdo e das referências geradas por modelos de linguagem grandes.
🎯 As tecnologias principais incluem ajuste fino na fase de treinamento e adaptação em tempo de teste.
💡 Os resultados experimentais mostram que o AGREE se destaca em melhorar a precisão e a capacidade de referência das respostas de conteúdo.
Link para detalhes: https://arxiv.org/pdf/2311.09533
10. A Fenbi lançará seu professor de IA autodesenvolvido em agosto
O grupo Fenbi lançará seu professor de IA autodesenvolvido em agosto de 2024, como uma das ferramentas de aprendizagem de IA oferecidas em sua plataforma online, sendo aplicado inicialmente em cursos de exames de admissão nacionais ou provinciais e certificações profissionais.
【Resumo AIBase:】
⭐️ O grupo Fenbi lançará seu professor de IA autodesenvolvido em agosto de 2024.
⭐️ O professor de IA será uma das ferramentas de aprendizagem de IA oferecidas na plataforma online da Fenbi.
⭐️ Será aplicado inicialmente em cursos de exames de admissão nacionais ou provinciais e certificações profissionais.