Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os destaques do campo de IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.
Novos produtos de IA Clique para saber mais: https://top.aibase.com/
1、Chegou a versão Edu do ChatGPT: Suporte a GPT-4o, GPT personalizado, análise de dados
A versão Edu do ChatGPT foi lançada, oferecendo um ChatGPT multifuncional para campi universitários, ajudando alunos e professores a melhorar a qualidade do aprendizado e a eficiência do ensino. Muitas universidades de ponta já estão usando o ChatGPT na educação, com jovens de 18 a 24 anos sendo o principal grupo de usuários. Os recursos incluem suporte a GPT-4o, análise de dados e GPT personalizado, oferecendo limites de mensagens mais altos e suporte de voz. Mecanismos de segurança são completos e há muitos casos de uso prático.
【Resumo AiBase:】
🚀 Lançamento da versão Edu do ChatGPT, com suporte a GPT-4o, GPT personalizado e análise de dados, ajudando alunos e professores a melhorar a eficiência do aprendizado.
🔍 Muitas universidades de ponta já usam o ChatGPT na educação, com jovens de 18 a 24 anos como principal grupo de usuários, apresentando forte demanda e capacidade de aprendizado.
💡 Casos de uso práticos abundantes, incluindo tarefas de reflexão de fim de semestre, serviço comunitário, treinamento de idiomas, etc., demonstram o uso profundo do ChatGPT no campo da educação.
2、Kuaishou lança o produto de modelo de linguagem grande para geração de imagens "Ketu"
O "Ketu", modelo de linguagem grande para geração de imagens desenvolvido pela Kuaishou, foi oficialmente lançado, oferecendo aos usuários uma nova experiência de criação de imagens com IA. Este modelo de linguagem grande suporta duas funções: geração de imagem a partir de texto e geração de imagem a partir de imagem, podendo ser usado para criação de imagens com IA e personalização de imagens de IA. Os usuários podem experimentar facilmente tecnologias de ponta através do miniaplicativo WeChat ou da versão web do "Ketu".

【Resumo AiBase:】
🔍 O modelo de linguagem grande "Ketu" tem bilhões de parâmetros, com dados provenientes de comunidades de código aberto, construção interna da Kuaishou e a fusão de tecnologias de IA autodesenvolvidas.
🎨 "Ketu" abrange milhões de conceitos de entidades chinesas comuns, fornecendo suporte mais amplo e profundo para a criação de imagens.
🧠 "Ketu" introduz tecnologias de aprendizado por reforço e modelos de recompensa, resolvendo o problema da ineficiência do modelo de linguagem grande de geração de imagem no processamento de textos longos e textos com semântica complexa.
Acesso ao produto: https://top.aibase.com/tool/kuaishouketudamoxingkolors
3、Baidu Netdisk lança função de geração de avatar de mangá com IA
O Baidu Netdisk lançou um novo recurso de IA impressionante. Na véspera do Dia das Crianças, os usuários podem se transformar nos protagonistas de mangás infantis com apenas uma foto. Este recurso é altamente personalizado, permitindo que os usuários se sintam imersos em um mundo de animação vibrante, e sua velocidade de processamento rápida e eficiente torna a experiência ainda mais suave.
【Resumo AiBase:】
🎨 Transformação personalizada: os usuários podem enviar fotos para se transformarem em personagens de mangá, experimentando um estilo único.
🚀 Processamento rápido: a função de IA do Baidu Netdisk possui uma velocidade de processamento extremamente rápida, gerando fotos de mangá bonitas em poucos segundos.
🌟 Efeitos diversificados: além de se transformar em imagens de mangá, também pode simular efeitos de animação clássicos, atendendo às necessidades de diferentes usuários.
4、Claude 3 abre API de terceiros, permitindo automação de fluxos de trabalho
O novo recurso da Anthropic permite que os usuários interajam com o Claude de forma mais conveniente e automatizem a execução de várias tarefas por meio de chamadas de API estruturadas. Ao mesmo tempo, o Claude também pode processar imagens e integrá-las a aplicativos em tempo real, fornecendo soluções mais inteligentes e eficientes para empresas.

【Resumo AiBase:】
🔍 Os usuários podem fazer perguntas de texto para que o Claude execute automaticamente várias tarefas.
🔍 Os usuários podem usar chamadas de API estruturadas para realizar operações rotineiras e responder a perguntas.
🔍 O novo recurso da Anthropic permite que o Claude processe imagens e aplicativos em tempo real.
5、Novita AI open-source o projeto Animate Anyone: crie animações com apenas uma foto
A Novita AI tornou open-source o projeto Animate Anyone, permitindo que os usuários criem animações com apenas uma foto. Esta tecnologia traz novas possibilidades e oportunidades para a produção de animações, permitindo que os usuários criem rapidamente obras impressionantes.

【Resumo AiBase:】
👉 ViViD pode mover roupas para personagens de vídeo de forma natural.
👉 Saias e calças podem ser substituídas livremente, adaptando-se a diversas necessidades de prova de roupas.
👉 Atualmente, apenas a demonstração e o artigo foram publicados, o código ainda não foi divulgado.
Página do projeto: https://top.aibase.com/tool/vivid
Endereço do artigo: https://arxiv.org/pdf/2405.11794
6、Alibaba e Universidade de Ciência e Tecnologia da China lançam tecnologia de prova virtual de roupas ViViD, permitindo troca de roupas em vídeos com facilidade
A estrutura ViViD, desenvolvida em conjunto pela Alibaba e pela Universidade de Ciência e Tecnologia da China, revolucionou a experiência de prova virtual de roupas, permitindo a substituição em tempo real de roupas em vídeos, resolvendo problemas de consistência temporal e qualidade de imagem e melhorando os efeitos da prova de roupas.

【Resumo AiBase:】
👗 Tecnologia avançada: ViViD é baseado na tecnologia de modelos de difusão, permitindo a substituição em tempo real de roupas em vídeos, gerando efeitos naturais e realistas.
🔧 Três componentes principais: codificador de roupas, codificador de poses e módulo de tempo trabalham juntos para extrair detalhes de roupas, codificar poses e manter a coerência temporal.
🌟 Fusão de recursos inovadora: a introdução do mecanismo de fusão de recursos de atenção otimiza a integração de informações semânticas de roupas, melhorando os efeitos da prova de roupas para atender às necessidades dos usuários.
Link de detalhes: https://top.aibase.com/tool/vivid
7、Perplexity lança a função de criação de páginas, gerando documentos profissionais rapidamente
A Perplexity AI lançou seu mais novo recurso, Perplexity Pages, projetado para ajudar os usuários a gerar rapidamente documentos de nível profissional, aumentando a produtividade dos criadores de conteúdo e desafiando plataformas tradicionais de bancos de conhecimento. A ferramenta gera conteúdo rapidamente, suporta alta personalização, inserção de conteúdo de mídia, verificação de informações e gerenciamento de fontes, compartilhamento e otimização de pesquisa.
【Resumo AiBase:】
🚀 Geração rápida de documentos profissionais, economizando tempo e esforço.
🔧 Alta personalização para atender às diferentes necessidades.
📸 Inserção de conteúdo de mídia para melhorar o apelo dos documentos.
Link de detalhes: https://top.aibase.com/tool/perplexity
8、Midjourney lançará a versão V6.5, e a versão web estará disponível para todos em breve
A Midjourney está prestes a lançar a versão V6.5, trazendo uma melhoria significativa na qualidade da imagem, e a versão web também receberá uma grande atualização. Apesar dos desafios no desenvolvimento de modelos de vídeo, a equipe acredita que o esforço contínuo trará avanços ainda maiores.
【Resumo AiBase:】
🚀 Melhora significativa na qualidade da imagem, possivelmente consistente com a versão V7, com melhorias na coerência, pele, mãos e representação corporal.
💻 A versão web deixará de depender do Discord, oferecendo uma melhor experiência ao usuário.
💡 Lançamento do explorador de espaço de estilo e atualização da página de exploração, considerando oferecer descontos de assinatura para atrair mais usuários.
9、Modelo Suno 3.5 já está disponível para todos, podendo criar músicas de 4 minutos
O mais recente modelo Suno 3.5 está aberto a todos os usuários, trazendo recursos como a criação de músicas de 4 minutos, extensão de músicas de 2 minutos e estrutura de música aprimorada. O Suno também lançou um novo recurso que pode transformar qualquer som em música, trazendo novas possibilidades para a criação musical. A empresa recebeu US$ 125 milhões em financiamento, consolidando sua posição de liderança no campo da música com IA. O Suno demonstra forte capacidade de inovação e posição de liderança.

【Resumo AiBase:】
🎵 Criação de músicas de 4 minutos e extensão de músicas de 2 minutos.
🎶 Transformação de qualquer som em música, criando novas possibilidades.
💰 A empresa recebeu US$ 125 milhões em financiamento, consolidando sua posição de liderança.
Link de detalhes: https://top.aibase.com/tool/suno-ai
10、You.com lança função de assistente personalizado
O You.com lançou a função de assistente personalizado, permitindo que os usuários criem assistentes de IA personalizados usando modelos de linguagem de ponta como GPT-4o, Llama3 e Claude3, com o objetivo de melhorar a produtividade do usuário em tarefas de trabalho complexas. Este recurso torna os poderosos modelos de linguagem mais acessíveis e adaptáveis às necessidades individuais, oferecendo aos usuários uma experiência de assistente de IA personalizada.
【Resumo AiBase:】
⭐️ Assistente de IA personalizado visa melhorar a produtividade do usuário em tarefas de trabalho complexas.
⭐️ O You.com se compromete a fornecer precisão e informações em tempo real, fornecendo respostas mais relevantes e confiáveis por meio do acesso online.
⭐️ O impacto da tecnologia é profundo, e os assistentes de IA personalizados têm o potencial de transformar o trabalho de conhecimento em setores como saúde, finanças e educação.
11、Cartesia lança o modelo de geração de voz de baixa latência Sonic: uma réplica do bate-papo por voz em tempo real do ChatGPT?
O modelo de geração de voz de baixa latência Sonic, lançado pela Cartesia, atraiu muita atenção, com sua velocidade de inferência rápida e latência extremamente baixa sendo impressionantes. O Sonic pode gerar voz em tempo real com emoções e expressões realistas, e os usuários precisam apenas fornecer uma gravação de 10 segundos para imitar as características de voz do falante. O objetivo da Cartesia é criar um sistema inteligente em tempo real, e eles introduziram a inovadora arquitetura SSM, obtendo progresso inicial.

【Resumo AiBase:】
🚀 O modelo Sonic tem um atraso de apenas 135 milissegundos, adequado para aplicativos de bate-papo.
😊 O Sonic demonstra emoções e capacidade de expressão humanas, tornando a conversa mais natural.
🔧 Os usuários podem ajustar parâmetros como tom, velocidade e emoção para personalizar a saída de voz.
Link de detalhes: https://top.aibase.com/tool/carteisa-sonic
12、Gartner prevê receita de US$ 71,2 bilhões para chips de inteligência artificial em 2024
De acordo com a previsão da Gartner, a receita global de semicondutores de inteligência artificial crescerá 33% em 2024, atingindo US$ 71,2 bilhões. Essa tendência impulsionará a capacidade dos computadores de possuírem recursos de inteligência artificial, e as compras de computadores corporativos também mudarão completamente para computadores de inteligência artificial. O processamento de IA será realizado principalmente em data centers, e o valor dos aceleradores é estimado em US$ 21 bilhões.
【Resumo AiBase:】
📈 Espera-se que a receita global de semicondutores de inteligência artificial cresça 33% em 2024, atingindo US$ 71,2 bilhões.
💻 Espera-se que 22% dos computadores possuam recursos de inteligência artificial em 2024, e até o final de 2026, as compras de computadores corporativos mudarão completamente para computadores de inteligência artificial.
🏭 O processamento de IA será realizado principalmente em data centers, e o valor dos aceleradores de IA usados em servidores em 2024 atingirá US$ 21 bilhões.
13、Google foi superado! Avatar 3D de alta fidelidade assustadoramente realista: piscar de olhos e levantar de sobrancelha sem falhas
Recentemente, o algoritmo NPGA proposto por equipes de pesquisa da Universidade Técnica de Munique e do University College London, entre outras, atraiu muita atenção, capaz de gerar avatares 3D de alta fidelidade, com expressões realistas que tornam difícil distinguir o real do falso. A inovação tecnológica reside no uso de nuvens de pontos gaussianas para gerar a forma de uma imagem 3D, introduzindo um modelo de cabeça parametrizado neural para capturar mudanças sutis nas expressões, melhorando o realismo.

【Resumo AiBase:】
⭐ Avatar 3D de alta fidelidade: NPGA gera avatares 3D realistas com expressões ricas, aproximando-se de humanos reais.
⚙️ Tecnologia inovadora: usa nuvens de pontos gaussianas para construir a forma de uma imagem 3D, melhorando a eficiência de renderização e o realismo.
😲 Modelo de rede neural: usa um modelo de cabeça parametrizado neural para capturar mudanças sutis nas expressões faciais, simulando expressões humanas reais.
Link de detalhes: https://tobias-kirschstein.github.io/nersemble/





