Boletim de IA: Com o GPT-4o! Produtos Apple em Era de IA Generativa; Tencent Suporta Vídeo com Múltiplas Pessoas; Função de Voz do ChatGPT Aprimorada

站长之家

Publicado emNotícias e Informações de IA · 16 minutos de leitura · Jun 11, 2024

Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais assuntos do campo de IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.

Novos produtos de IA Clique para saber mais: https://top.aibase.com/

1. A Apple lança uma bomba na WWDC: Siri com GPT-4o, toda a linha com IA generativa

Na Conferência Mundial de Desenvolvedores da Apple (WWDC) de 2024, a empresa anunciou que toda sua linha de produtos entraria na era da IA generativa, lançando o novo sistema inteligente personalizado Apple Intelligence. O núcleo da atualização é um serviço inteligente que combina modelos de IA generativa com dados do usuário, integrando-se profundamente ao iOS 18, iPadOS 18 e macOS Sequoia. A Siri foi transformada, com capacidade aprimorada de compreensão da linguagem e execução de operações entre aplicativos. O sistema integra o ChatGPT para fornecer recursos de compreensão de imagens e documentos, além de novas ferramentas de escrita e Image Playground.

【Resumo AiBase:】
🍎 O Apple Intelligence integra modelos de IA generativa e dados do usuário, fornecendo serviços inteligentes práticos e integrando-se profundamente ao iOS 18, iPadOS 18 e macOS Sequoia.
🤖 A Siri foi transformada, com capacidade aprimorada de compreensão da linguagem e suporte para execução de operações entre aplicativos. Os usuários podem interagir com a Siri digitando.
📸 O sistema integra o ChatGPT para fornecer recursos de compreensão de imagens e documentos, além de novas ferramentas de escrita e Image Playground, permitindo que os usuários criem imagens em estilo de animação, ilustração ou esboço.
Detalhes: https://www.chinaz.com/2024/0611/1622511.shtml

2. Apple e Google colaboram no modelo Gemini

A Apple anunciou uma parceria com o modelo Gemini do Google, abrindo o acesso a modelos de terceiros para oferecer mais opções aos usuários. A Siri integrará o ChatGPT, permitindo que os usuários conversem sem sair do Siri, mantendo o controle de privacidade. A Apple atualizou seu kit de desenvolvimento, integrando o ChatGPT da OpenAI pela primeira vez, e lançou uma série de novos recursos e atualizações.

【Resumo AiBase:】
🍎 A Apple e o modelo Gemini do Google colaboram, abrindo o acesso a modelos de terceiros e expandindo o ecossistema de inteligência artificial.
🤖 A Siri integra o ChatGPT, permitindo que os usuários conversem dentro do Siri, mantendo o controle de privacidade.
🚀 A Apple atualizou seu kit de desenvolvimento, integrando o ChatGPT da OpenAI pela primeira vez e lançando novos recursos do iOS 18 e VisionOS 2.

3. Grande reformulação do aplicativo Fotos do iOS 18: adição de remoção de IA e triagem inteligente para reduzir o escopo de pesquisa

No sistema iOS 18 recém-lançado pela Apple, o recurso de mensagens de texto foi completamente reformulado. Os usuários não apenas podem adicionar sublinhados e tachamentos ao conteúdo das mensagens de texto, mas também podem aplicar uma série de efeitos de texto dinâmicos, tornando cada mensagem única.

【Resumo AiBase:】
⭐️ A Apple e a OpenAI fecharam um acordo de parceria, e o iOS 18 introduzirá o recurso ChatGPT.
🤖 As perspectivas narrativas geradas pelo GPT-4 são informativas para o desempenho futuro das ações.
💬 O sistema iPadOS 18 não apenas suporta todos os recursos de personalização do iOS 18, mas também suporta a barra de ferramentas de uso frequente personalizada dentro de aplicativos personalizados.
Modelos de dispositivos compatíveis com a atualização do iOS 18: https://www.chinaz.com/2024/0611/1622488.shtml

4. Tencent lança novo modelo de vídeo a partir de imagem Follow-Your-Pose-v2

Este artigo apresenta o novo modelo de vídeo a partir de imagem "Follow-Your-Pose-v2", lançado pela equipe Tencent Hun Yuan em colaboração com a Universidade de Zhongshan e a Universidade de Ciência e Tecnologia de Hong Kong. Ele apresenta destaques como geração de ações de vídeo para várias pessoas, forte capacidade de generalização e tratamento correto de oclusões de pessoas. Este modelo tem um significado importante no campo da geração de vídeo e amplas perspectivas de aplicação.

【Resumo AiBase:】
🌟 Suporta geração de ações de vídeo para várias pessoas, com tempo de inferência reduzido.
🔥 Forte capacidade de generalização, capaz de gerar vídeos de alta qualidade, independentemente da idade, roupa, raça, complexidade do fundo ou complexidade da ação.
💡 Processamento correto de oclusões de pessoas, capaz de gerar cenas de oclusão com relação correta de frente e trás.
Página do projeto: https://top.aibase.com/tool/follow-your-pose
Endereço do artigo: https://arxiv.org/pdf/2406.03035

5. MotionFollower: replicação de ações de personagens sem alterar o fundo do vídeo

MotionFollower é uma tecnologia inovadora que pode replicar o movimento de um vídeo para um personagem em outro vídeo, mantendo a aparência do personagem inalterada. Esta tecnologia tem amplas aplicações, incluindo produção cinematográfica, criação de anúncios e desenvolvimento de jogos.

【Resumo AiBase:】
⚙️ MotionFollower é uma tecnologia inovadora que replica o movimento de um vídeo para outro personagem, mantendo sua aparência inalterada.
🌐 Ampla gama de aplicações, incluindo cinema, publicidade e jogos.
🎥 MotionFollower processa vídeos com amplos movimentos de câmera, permitindo a transferência de informações de movimento de alta qualidade.
Link para detalhes: https://top.aibase.com/tool/motionfollower

6. Adobe revisa os termos de serviço, esclarecendo que não usará as obras dos clientes para treinamento de IA

A Adobe anunciou uma revisão de seus termos de serviço, esclarecendo que não usará as obras dos clientes para treinamento de IA, com o objetivo de reconquistar a confiança dos usuários. Esta mudança foi anunciada após fortes protestos dos usuários na semana anterior.

【Resumo AiBase:】
🛡️ A Adobe revisou seus termos de serviço, esclarecendo que não usará as obras dos clientes para treinamento de IA.
💬 O presidente da Adobe admitiu que deveria ter esclarecido os termos de serviço mais cedo e disse que será mais transparente.
🖼️ As preocupações dos criadores com a Adobe ainda persistem, e a empresa está trabalhando para reconquistar a confiança.

7. OpenAI aprimora o recurso de voz do ChatGPT, permitindo que ele fale com vozes de diferentes personagens

A OpenAI atualizou recentemente o recurso de voz do ChatGPT, permitindo que os usuários interajam com o chatbot usando uma variedade de vozes e estilos de voz gerados por IA. O novo recurso permite que os usuários instruam o chatbot de IA a responder em tempo real usando qualquer voz, melhorando a interatividade e a acessibilidade.

【Resumo AiBase:】
🔊 O ChatGPT possui atualmente quatro vozes predefinidas e pode otimizar o estilo de voz em tempo real.
🗣️ Os usuários podem pedir à IA para dublar personagens de histórias, gerando vozes únicas, como o rugido de um leão.
🔜 A OpenAI lançará novos recursos de voz nas próximas semanas, disponíveis para todos os usuários do ChatGPT, com acesso prioritário para assinantes premium.

8. Superando o Instant3D! A Universidade Jiao Tong de Xangai lança a nova estrutura Bootstrap3D, melhorando significativamente a capacidade de geração 3D

Uma equipe de pesquisa da Universidade Jiao Tong de Xangai e da Universidade Chinesa de Hong Kong lançou uma nova estrutura chamada Bootstrap3D. Ao combinar modelos multimodais de percepção 3D ajustados, ela pode gerar automaticamente dados de imagem multivisuais de alta qualidade, melhorando significativamente a capacidade dos modelos de geração 3D. O conjunto de dados de síntese da estrutura foi totalmente aberto e está disponível gratuitamente para pesquisadores e desenvolvedores. Os recursos-chave da estrutura incluem pipeline de construção de dados, geração de prompts de texto, geração de imagens, síntese multivisual, seleção de qualidade e reescrita de descrições. A equipe de pesquisa também propôs uma estratégia de rearranjo de timestep de treinamento (TTR) para otimizar diferentes estágios do processo de denoising, resolvendo problemas no treinamento de modelos de difusão multivisual. Os resultados experimentais mostram que os modelos de difusão multivisual usando a estratégia TTR têm um desempenho superior em termos de alinhamento texto-imagem, qualidade da imagem e consistência de visualização, melhorando efetivamente os resultados da geração multivisual.

【Resumo AiBase:】
🔑 Pipeline de construção de dados: a geração automática de dados de imagem multivisual e texto descritivo detalhado é uma das principais inovações da estrutura.
🔑 Geração de prompts de texto: uso de modelos de linguagem grandes para gerar prompts de texto criativos e diversos, fornecendo material para a geração de imagens.
🔑 Síntese multivisual: expansão de imagens de visualização única para imagens multivisuais, garantindo consistência em diferentes perspectivas.
Link para detalhes: https://top.aibase.com/tool/bootstrap3d

9. Google lança a estrutura AGREE para melhorar a precisão do conteúdo gerado por modelos de linguagem grandes

O Google Research lançou a estrutura AGREE, projetada para melhorar a precisão do conteúdo e das referências geradas por modelos de linguagem grandes. A estrutura melhora a precisão das respostas recuperando parágrafos relevantes e fornece aos usuários uma maneira de verificar a autenticidade das informações. As tecnologias principais incluem ajuste fino na fase de treinamento e adaptação em tempo de teste. Os resultados experimentais mostram que o AGREE se destaca em melhorar a precisão e a capacidade de referência das respostas de conteúdo.

【Resumo AiBase:】
🔍 A estrutura AGREE visa melhorar a precisão do conteúdo e das referências geradas por modelos de linguagem grandes.
🎯 As tecnologias principais incluem ajuste fino na fase de treinamento e adaptação em tempo de teste.
💡 Os resultados experimentais mostram que o AGREE se destaca em melhorar a precisão e a capacidade de referência das respostas de conteúdo.
Link para detalhes: https://arxiv.org/pdf/2311.09533

10. A Fenbi lançará seu professor de IA autodesenvolvido em agosto

O grupo Fenbi lançará seu professor de IA autodesenvolvido em agosto de 2024, como uma das ferramentas de aprendizagem de IA oferecidas em sua plataforma online, sendo aplicado inicialmente em cursos de exames de admissão nacionais ou provinciais e certificações profissionais.

【Resumo AIBase:】
⭐️ O grupo Fenbi lançará seu professor de IA autodesenvolvido em agosto de 2024.
⭐️ O professor de IA será uma das ferramentas de aprendizagem de IA oferecidas na plataforma online da Fenbi.
⭐️ Será aplicado inicialmente em cursos de exames de admissão nacionais ou provinciais e certificações profissionais.

Cook: o Apple AI versão em chinês se esforça para entrar no mercado chinês, mudando o estilo de vida

O CEO da Apple, Cook, anunciou em Xangai que a tecnologia de IA da Apple, Apple Intelligence, está se esforçando para entrar no mercado chinês. Ele enfatizou que a IA mudará profundamente o estilo de vida e até salvar vidas, pedindo ao público que não tenha excesso de preocupação. Cook acredita que a IA trará impactos positivos e não se preocupa com o fato de os computadores pensarem como humanos.

Apple lidera por 12 anos consecutivos a lista das marcas mais valiosas do mundo, relatório revela que confiança e design são mais importantes que a euforia da IA

A Apple lidera pela 12ª vez consecutiva a lista das marcas mais valiosas do mundo pela Interbrand, com um valor de marca de 47,09 bilhões de dólares, uma redução de 4%, mas graças à confiança duradoura e à excelente experiência de design, destaca o papel fundamental da valorização da marca e da coesão do ecossistema diante da onda da IA.

O chefe do departamento de busca AI da Apple, Ke Yang, abandona a empresa para se juntar à Meta Platforms

Ke Yang, líder principal do departamento de busca AI da Apple, deixará a empresa para se juntar à Meta. Ele lidera a equipe responsável por 'respostas, conhecimento e informação', que está trabalhando para melhorar o Siri, permitindo que ele tenha capacidade de acesso a conteúdo na internet semelhante ao ChatGPT. Essa mudança de pessoal ocorre em um momento crucial para a Apple fortalecer sua linha de produtos de IA.

A Apple vai aparecer na Conferência Internacional de Visão Computacional em 2025

A Apple irá apresentar oito artigos na Conferência Internacional de Visão Computacional (ICCV), que será realizada em Honolulu em outubro de 2025, focando em tecnologias avançadas como modelos multimodais e geração de vídeos, compartilhando seus últimos resultados em pesquisa em visão computacional.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Brand Visibility

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Promotion Link Detection

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

Boletim de IA: Com o GPT-4o! Produtos Apple em Era de IA Generativa; Tencent Suporta Vídeo com Múltiplas Pessoas; Função de Voz do ChatGPT Aprimorada

站长之家

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

OpenAI adquire empresa de atalhos da Apple, o antigo time original

Lidando com deficiências na inferência do modelo: a equipe MIND da Apple acelera a contratação de profissionais de IA

​Cook: o Apple AI versão em chinês se esforça para entrar no mercado chinês, mudando o estilo de vida

Apple lidera por 12 anos consecutivos a lista das marcas mais valiosas do mundo, relatório revela que confiança e design são mais importantes que a euforia da IA

O chefe do departamento de busca AI da Apple, Ke Yang, abandona a empresa para se juntar à Meta Platforms

Apple lança MacBook Pro com chip M5: o primeiro processador Mac otimizado para IA, duração da bateria de 24 horas

Executivos do projeto de IA da Apple mudam para a equipe Siri da Meta e enfrentam desafios

Lançamento importante da Apple M5: desempenho de IA aumenta quatro vezes, acelerando a experiência de inteligência no dispositivo

Nova ação da Apple! Produzirá dispositivos domésticos de IA e robôs de mesa móveis no Vietnã

A Apple vai aparecer na Conferência Internacional de Visão Computacional em 2025

Notícias de IA Relacionadas Recomendadas

OpenAI adquire empresa de atalhos da Apple, o antigo time original

Lidando com deficiências na inferência do modelo: a equipe MIND da Apple acelera a contratação de profissionais de IA

​Cook: o Apple AI versão em chinês se esforça para entrar no mercado chinês, mudando o estilo de vida

Apple lidera por 12 anos consecutivos a lista das marcas mais valiosas do mundo, relatório revela que confiança e design são mais importantes que a euforia da IA

O chefe do departamento de busca AI da Apple, Ke Yang, abandona a empresa para se juntar à Meta Platforms

Apple lança MacBook Pro com chip M5: o primeiro processador Mac otimizado para IA, duração da bateria de 24 horas

Executivos do projeto de IA da Apple mudam para a equipe Siri da Meta e enfrentam desafios

Lançamento importante da Apple M5: desempenho de IA aumenta quatro vezes, acelerando a experiência de inteligência no dispositivo

Nova ação da Apple! Produzirá dispositivos domésticos de IA e robôs de mesa móveis no Vietnã

A Apple vai aparecer na Conferência Internacional de Visão Computacional em 2025

GEO Services

Cook: o Apple AI versão em chinês se esforça para entrar no mercado chinês, mudando o estilo de vida

Cook: o Apple AI versão em chinês se esforça para entrar no mercado chinês, mudando o estilo de vida