Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais assuntos do campo da IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.

Novos produtos de IA Clique para saber mais: https://top.aibase.com/

1、Modelo de texto para fala de código aberto com baixo consumo de memória, Fish Speech, que rivaliza com o GPT-SoVITS

Fish Speech é uma nova ferramenta de texto para fala desenvolvida pela fishaudio, que suporta três idiomas: chinês, inglês e japonês. O processamento de voz se aproxima do nível humano, utilizando o algoritmo Flash-Attn para processar dados em larga escala, proporcionando uma experiência TTS eficiente, precisa e estável.

【AiBase destaca:】

😊 Suporte perfeito para chinês, inglês e japonês, processamento de voz próximo ao nível humano

😊 Suporta clonagem de voz, basta fornecer uma amostra de voz de referência para concluir rapidamente a clonagem

😊 Baixa exigência de memória, apenas 4 GB, suporta vários modelos diferentes de geração de voz

Endereço de experiência online: https://top.aibase.com/tool/fish-audiowenbenzhuanyuyin

Detalhes aqui: https://www.aibase.com/news/9979

2、Lançamento do Meta 3D Gen: geração rápida de ativos 3D a partir de texto em menos de um minuto

Pesquisadores recentemente lançaram uma nova tecnologia chamada Meta3D Gen (3DGen), capaz de gerar rapidamente ativos 3D a partir de texto em menos de um minuto, oferecendo aos usuários texturas e materiais de alta qualidade. Essa tecnologia integra o Meta3D AssetGen e o Meta3D TextureGen, fornecendo uma maneira eficiente de criar modelos 3D, de três a dez vezes mais rápida do que as soluções existentes.

image.png

【AiBase destaca:】

🚀 O sistema Meta 3D Gen pode criar ativos 3D de alta qualidade em menos de um minuto

💡 O Meta3D Gen integra duas tecnologias principais: Meta3D AssetGen e Meta3DTextureGen

✨ O AssetGen suporta a geração de materiais baseados em renderização física, com efeitos de iluminação realistas.

Link para detalhes: https://ai.meta.com/research/publications/meta-3d-gen/

3、Microsoft lança código aberto do GraphRAG: construção de um grafo de conhecimento para aprimorar as capacidades de resposta a perguntas e raciocínio de modelos de linguagem grandes

O sistema GraphRAG, recentemente lançado pela Microsoft como código aberto, utiliza grafos de conhecimento de entidades para aprimorar as capacidades de busca, resposta a perguntas, resumo e raciocínio de modelos de linguagem grandes, sendo particularmente adequado para lidar com conjuntos de dados em larga escala. Ao construir um grafo de conhecimento de entidades global, o GraphRAG consegue capturar conexões e interações complexas no texto, melhorando a precisão e a abrangência da recuperação de informações. Além disso, o GraphRAG tem baixa demanda por tokens, reduzindo os custos de desenvolvimento. Em testes abrangentes, apresentou desempenho excelente, sendo um dos melhores métodos RAG atualmente disponíveis.

【AiBase destaca:】

💡 O GraphRAG aprimora as capacidades de busca, resposta a perguntas, resumo e raciocínio de modelos de linguagem grandes por meio da construção de um grafo de conhecimento de entidades, sendo especialmente eficaz no tratamento de grandes conjuntos de dados.

💡 O núcleo do GraphRAG inclui duas etapas: a construção de um grafo de conhecimento de entidades e a geração de resumos de comunidades. Os resumos de comunidades extraem informações relevantes do conjunto de dados, gerando respostas mais completas e precisas.

💡 O GraphRAG tem baixa demanda por tokens, ajudando os desenvolvedores a economizar custos. Em testes abrangentes, apresentou desempenho excelente, sendo um dos melhores métodos RAG atualmente disponíveis.

Link para detalhes: https://top.aibase.com/tool/graphrag

4、Microsoft lança a ferramenta de design Designer: geração de cartões de felicitações personalizados com uma frase

A função "Cartões de Felicitações" do Microsoft Designer, recentemente lançado pela Microsoft, oferece aos usuários uma experiência sem precedentes na criação de cartões de felicitações personalizados, demonstrando a aplicação prática da tecnologia de IA na vida cotidiana.

image.png

【AiBase destaca:】

🎨 Texto para design: o usuário insere uma descrição simples, e a IA a transforma em um design de cartão de felicitações exclusivo.

🖼️ Imagens geradas por IA: a inspiração para o design do cartão de felicitações vem da descrição do usuário, e a IA gera imagens detalhadas.

✏️ Conteúdo editável: o interior do cartão de felicitações oferece texto editável, atendendo às necessidades de personalização do usuário.

Link para detalhes: https://designer.microsoft.com/

5、Lançamento da TRANSAGENTS, empresa de inteligência artificial de tradução da Tencent

TRANSAGENTS é uma empresa de publicação e tradução virtual multiagente desenvolvida pelo laboratório de IA da Tencent, especializada em tradução literária. Simulando o modo de cooperação de personagens virtuais de uma empresa de tradução real, ela realiza traduções de obras literárias de forma eficiente e fluida. O custo da tradução literária usando TRANSAGENTS é 80 vezes menor do que o de tradutores humanos profissionais, e seu desempenho supera o de tradutores humanos em situações com necessidades específicas de conhecimento do setor. Essa plataforma demonstra o potencial da tecnologia de IA no campo da tradução literária, oferecendo novas possibilidades para a criação e disseminação de literatura.

image.png

【AiBase destaca:】

🔑 TRANSAGENTS é uma empresa de publicação e tradução virtual multiagente, criada para tradução de conteúdos literários extensos, simulando o modo de cooperação de personagens de uma empresa de tradução real.

💰 O custo da tradução literária usando TRANSAGENTS é 80 vezes menor do que o de tradutores humanos profissionais, reduzindo os custos de tradução e promovendo a disseminação de obras literárias excelentes.

🌟 O desempenho da TRANSAGENTS supera o de tradutores humanos em situações com necessidades específicas de conhecimento do setor, sendo apreciada por avaliadores humanos e modelos de linguagem avançados.

Link para detalhes: https://top.aibase.com/tool/transagents

6、Suno lança cliente iOS: suporte para geração de música por voz

O aplicativo iOS da Suno transforma telefones em estúdios de música virtuais, liderando uma revolução na produção musical e potencialmente alterando a forma de expressão criativa na era digital. Apesar dos desafios legais, a empresa afirma que a tecnologia visa gerar obras totalmente novas. O aplicativo iOS da Suno representa um passo importante para a geração de música por IA para o público em geral, liderando as tendências futuras do mundo da música.

【AiBase destaca:】

🎵 Estúdio de música no seu celular: o usuário pode inserir prompts de texto ou cantarolar para gerar músicas completas, atendendo a diferentes estilos musicais.

⚖️ Desafios legais e postura firme: a empresa enfrenta ações judiciais de gravadoras, mas insiste que a IA gera obras totalmente novas; o resultado da batalha jurídica pode afetar o desenvolvimento da indústria musical de IA.

🔮 Visão do futuro da música com IA: o limite entre a criação musical de IA e a humana se torna nebuloso, levantando questões profundas sobre criatividade e o futuro da indústria musical.

7、Executivo da Apple se junta ao conselho de administração da OpenAI como observador

Este artigo relata que o executivo da Apple, Phil Schiller, se juntou ao conselho de administração da OpenAI como observador. Isso permitirá que a Apple entenda melhor as operações internas da OpenAI e, possivelmente, integre o ChatGPT ao iOS e macOS, melhorando a inteligência do Siri. A Microsoft também se juntou ao conselho da OpenAI, tornando o relacionamento ainda mais complexo.

【AiBase destaca:】

🍏 O executivo da Apple, Phil Schiller, se juntou ao conselho de administração da OpenAI como observador, ajudando a aprofundar o conhecimento sobre a OpenAI.

🤖 A entrada de Schiller no conselho promoverá a integração do ChatGPT ao iOS e macOS, melhorando a inteligência do Siri.

🔗 A Microsoft também se juntou ao conselho da OpenAI como observadora sem direito a voto, tornando o conselho da OpenAI mais complexo.

8、Vídeo de panda comendo macarrão instantâneo gerado por IA no Douyin recebe mais de 420 mil curtidas; usuários acham incrível a fidelidade

Recentemente, a tecnologia de vídeo gerada por IA no Douyin atingiu um novo nível, com um vídeo de um panda e um gato comendo macarrão instantâneo com pauzinhos que deixa as pessoas incrédulas. Apesar de algumas imperfeições, os vídeos de IA serão ainda mais realistas no futuro.

QQ截图20240703114243.jpg

【AiBase destaca:】

🐼 O realismo do vídeo é impressionante, gerando debates entre os usuários.

😺 A tecnologia de IA é amplamente aplicada na produção de vídeos, oferecendo novas experiências para criadores e espectadores.

💻 A competição entre modelos de vídeo grandes nacionais e internacionais está acirrada; cenas icônicas de filmes e séries geradas por IA estão entre as 26 melhores do ranking de desafios do Douyin.

Conteúdo detalhado: https://www.aibase.com/news/9993

9、Usuário conecta o GPT-4V à câmera de sua casa; milhões de usuários assistem a ele fazendo isso!

Um usuário estrangeiro conectou o GPT-4Vision à câmera de sua casa, atraindo a atenção de milhões de usuários. Esse comportamento demonstra o potencial da tecnologia de IA na vida cotidiana, mas também levanta discussões sobre privacidade e segurança. Com o desenvolvimento da tecnologia, esperamos ver mais aplicativos inovadores e seguros.

image.png

【AiBase destaca:】

👀 O GPT-4Vision conectado à câmera de casa atrai milhões de espectadores.

🔒 Levanta discussões sobre privacidade e segurança, lembrando as pessoas da importância da proteção de informações pessoais.

💡 Mostra o potencial da tecnologia de IA na vida cotidiana, inspirando reflexões sobre a aplicação da tecnologia.

Conteúdo detalhado: https://www.aibase.com/news/9995

10、Indignado! Artista escocês “autodestrói” suas obras para protestar contra os impactos negativos da IA na arte

O artista escocês Michael Forbes expressou seu protesto contra os impactos negativos da inteligência artificial (IA) na arte pintando por cima de suas próprias obras. Forbes já “editou” quatro pinturas, incluindo obras de John Lennon e da cantora americana Taylor Swift. Ele espera que sua ação aumente a conscientização sobre a violação de direitos autorais da IA na arte. Os artistas já não conseguem competir com imagens geradas por computador, levando muitos a desistir da carreira artística.

image.png

【AiBase destaca:】

⭐ O artista escocês Michael Forbes expressou seu protesto contra os impactos negativos da inteligência artificial (IA) na arte pintando por cima de suas próprias obras.

⭐ Forbes já “editou” quatro pinturas, incluindo obras de John Lennon e da cantora americana Taylor Swift, esperando que sua ação aumente a conscientização sobre a violação de direitos autorais da IA na arte.

⭐ Os artistas já não conseguem competir com imagens geradas por computador, levando muitos a desistir da carreira artística.