Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais assuntos do campo da IA, com foco em desenvolvedores, para ajudá-lo a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.

Novos produtos de IA Clique para saber mais: https://top.aibase.com/

1、O ex-executivo da Baidu, Jing Kun, inicia uma empresa de busca de IA avaliada em US$ 1,8 bilhão e lança seu primeiro produto, Genspark

Como ex-executivo da Baidu, Jing Kun fundou a nova empresa MainFunc e lançou seu primeiro produto, Genspark, com o objetivo de fornecer uma experiência de busca de alta qualidade por meio da tecnologia de IA. A empresa recebeu US$ 60 milhões em financiamento inicial, com uma avaliação de US$ 260 milhões, demonstrando um enorme potencial de mercado. O currículo de Jing Kun é excepcional, e agora ele está novamente liderando o setor de busca de IA. Esperamos que ele continue inovando e se desenvolvendo.

image.png

【AiBase destaca:】

🚀 MainFunc é uma empresa de produtos inovadores de IA fundada por Jing Kun e Zhu Kaihua, ex-CTO da Xiaodu, que lançou seu primeiro produto de busca AI Agent, Genspark.

💰 A empresa concluiu uma rodada de financiamento inicial de US$ 60 milhões, com uma avaliação de US$ 260 milhões, representando um enorme potencial de mercado.

🔍 Genspark se posiciona como um mecanismo AI Agent, focado em fornecer serviços de busca, gerando páginas personalizadas chamadas "Sparkpages" por meio de tecnologia de IA, economizando tempo do usuário e fornecendo informações confiáveis.

Endereço do site: https://mainfunc.ai/

Entrada do produto de busca: https://top.aibase.com/tool/sparkpage

2、A plataforma aberta Kimi iniciará o teste beta do cache de contexto Context Caching

A plataforma aberta Kimi anunciou recentemente que o aguardado recurso Context Caching está prestes a iniciar seu teste beta. Este recurso inovador oferecerá suporte a modelos de linguagem grandes com textos longos e, por meio de um mecanismo de cache de contexto eficiente, fornecerá aos usuários uma experiência sem precedentes. Context Caching é uma tecnologia de ponta que reduz significativamente o custo para os usuários ao solicitar o mesmo conteúdo, armazenando em cache o conteúdo de tokens repetidos.

微信截图_20240620091624.png

【AiBase destaca:】

🔑 O recurso Context Caching oferece suporte a modelos de linguagem grandes com textos longos, fornecendo uma experiência sem precedentes por meio de um mecanismo de cache de contexto eficiente.

🚀 O Context Caching pode identificar e armazenar inteligentemente fragmentos de texto já processados, melhorando significativamente a velocidade de resposta da interface API.

💡 Adequado para cenários de prompt em larga escala e com alta repetição, reutilizando o conteúdo em cache para melhorar a eficiência de processamento e reduzir custos.

3、O TikTok lança o Symphony AI, um conjunto de ferramentas para criação de roteiros, edição de vídeos e avatares digitais

O conjunto de ferramentas de conteúdo Symphony AI lançado pelo TikTok revolucionou a forma como o conteúdo é criado e compartilhado, permitindo que todos se tornem mestres da criatividade. O Symphony Assistant oferece assistência personalizada, descobrindo tendências, fornecendo orientação criativa, inspirando ideias, escrevendo roteiros e oferecendo sugestões de otimização. O Symphony Creative Studio pode gerar várias visualizações de vídeos do TikTok em 60 segundos, com suporte para tradução em vários idiomas e edição de vídeo. O Symphony Digital Avatars ajuda as marcas a expandir suas estratégias criativas, fornecendo avatares de pessoas reais.

【AiBase destaca:】

🚀 O Symphony Assistant oferece assistência abrangente para criação de conteúdo, desde a descoberta de tendências até a escrita de roteiros, tornando o processo de criação mais simples e eficiente.

💡 O Symphony Creative Studio permite a geração rápida de diversas visualizações de vídeos do TikTok, e os recursos de tradução em vários idiomas e edição de vídeo tornam o conteúdo mais atraente.

👤 O Symphony Digital Avatars cria avatares de pessoas reais usando IA generativa, ajudando as marcas a expandir suas estratégias criativas globais.

Link para mais detalhes: https://www.tiktok.com/business/en-US/blog/tiktok-symphony-ai-creative-suite

4、Baidu Wenku: O produto de IA “Chengpian” já suporta a geração de textos longos com 100.000 caracteres

O “Chengpian”, o mais recente produto de IA lançado pelo Baidu Wenku, alcançou um grande avanço na geração de textos longos e na edição multimídia, fornecendo aos usuários recursos abrangentes de criação e edição. Com suporte de uma poderosa tecnologia de IA, o produto permite que os usuários acessem facilmente recursos acadêmicos profissionais, criem conteúdo de texto e imagem extra longo e realizem edição e ajuste multiformato de forma unificada.

image.png

【AiBase destaca:】

🚀 O “Chengpian” suporta a geração de textos longos com 100.000 caracteres e recursos de edição multimídia, atendendo às necessidades de ponta a ponta dos usuários em áreas profissionais.

💡 Quebra as barreiras de acesso a recursos acadêmicos, permitindo que os usuários acessem facilmente dados e literatura de sites acadêmicos profissionais em todo o mundo.

✨ Suporta a compreensão e geração de textos e imagens extra longos, permitindo o upload de vários tipos de arquivos simultaneamente e a realização de resumos rápidos, perguntas e respostas e criação de conteúdo.

Link para mais detalhes: https://top.aibase.com/tool/chengpianai

5、Os primeiros resultados da avaliação do vestibular de IA são divulgados: GPT-4o fica em segundo lugar

Nesta avaliação incomum do vestibular de IA, vários modelos de IA foram submetidos a um teste completo de habilidades em língua materna, matemática e inglês, demonstrando seu potencial e limitações em áreas acadêmicas. Embora tenham apresentado bom desempenho em língua materna e inglês, ainda há espaço para melhoria na capacidade de raciocínio matemático. No futuro, com o avanço da tecnologia, a IA se tornará mais inteligente e servirá melhor à sociedade humana.

【AiBase destaca:】

🧠 Os modelos de IA participaram de testes abrangentes de habilidades, demonstrando seu potencial e limitações acadêmicas.

📚 Bom desempenho em língua materna e inglês, mas ainda há espaço para melhoria na capacidade de raciocínio matemático.

🚀 O avanço tecnológico tornará a IA mais inteligente e melhorará seu serviço à sociedade humana.

6、Flash Diffusion é aplicável a qualquer modelo de difusão, permitindo a geração de imagens em poucas etapas

O método Flash Diffusion trouxe uma inovação revolucionária para a tecnologia de geração de imagens, acelerando o processo de geração de modelos de difusão pré-treinados, demonstrando desempenho excepcional e eficiência multitalentosa. Os pesquisadores usaram métodos inovadores, como distribuições ajustáveis e objetivos adversários, para melhorar a localização e a eficiência computacional do modelo preditivo. Este método é adaptável a diferentes redes principais, reduzindo significativamente o número de etapas de amostragem enquanto mantém a alta qualidade da geração. O Flash Diffusion traz nova vitalidade, melhorando a eficiência e a multifuncionalidade da geração de imagens, e espera-se que tenha um impacto profundo em várias áreas.

image.png

【AiBase destaca:】

⚡ Acelera o processo de geração de modelos de difusão pré-treinados, com desempenho excepcional e eficiência multitalentosa.

🔍 Usa métodos inovadores, como distribuições ajustáveis e objetivos adversários, para melhorar a localização e a eficiência computacional do modelo preditivo.

🌟 Adaptável a diferentes redes principais, reduzindo significativamente o número de etapas de amostragem enquanto mantém a alta qualidade da geração.

Link para mais detalhes: https://top.aibase.com/tool/flash-diffusion

7、Geração de imagens de IA “sob medida”! Huawei e Tsinghua se unem para lançar a tecnologia de geração personalizada PMG

Na era da personalização, a Huawei e a Universidade Tsinghua colaboraram para lançar a tecnologia de geração personalizada PMG. Esta tecnologia usa o histórico de comportamento e preferências do usuário para gerar conteúdo multimídia que atende às necessidades do usuário, como emojis, designs de camisetas e pôsteres de filmes. Através de testes experimentais, a tecnologia PMG demonstrou um enorme potencial e valor comercial, proporcionando aos usuários uma experiência mais rica e personalizada.

image.png

【AiBase destaca:】

⚙️ A tecnologia PMG usa o histórico de comportamento e preferências do usuário para gerar conteúdo multimídia personalizado.

💡 A PMG extrai as preferências do usuário por meio da geração de palavras-chave e da geração de vetores ocultos, realizando a geração de conteúdo multimídia.

📈 A tecnologia PMG foi testada em cenários de aplicação como geração de imagens de roupas de comércio eletrônico, cenas de pôsteres de filmes e geração de emojis, demonstrando excelentes resultados de geração.

Link para mais detalhes: https://github.com/mindspore-lab/models/tree/master/research/huawei-noah/PMG

8、Gboard inova a experiência de digitação: Google usa modelos de linguagem grandes para corrigir todos os erros com um único clique

O Gboard é o teclado inteligente da Google para dispositivos móveis. O recurso “corretor ortográfico” recém-lançado usa modelos de linguagem grandes para corrigir erros em frases e parágrafos inteiros com um único clique, revolucionando a experiência tradicional de correção caractere por caractere. Este recurso já está disponível em dispositivos Pixel 8 e muitos usuários estão se beneficiando dele. A equipe de pesquisa gerou um conjunto de dados simulados usando uma estrutura complexa de síntese de erros, combinando aprendizado supervisionado e aprendizado por reforço para otimizar o desempenho do modelo, demonstrando o enorme potencial dos modelos de linguagem grandes para melhorar a experiência de interação de entrada em dispositivos móveis.

【AiBase destaca:】

🔍 Usa modelos de linguagem grandes para corrigir erros em frases e parágrafos inteiros com um único clique, revolucionando a experiência tradicional de correção caractere por caractere.

🚀 Gera um conjunto de dados simulados usando uma estrutura complexa de síntese de erros, combinando aprendizado supervisionado e aprendizado por reforço para otimizar o desempenho do modelo.

💡 Implementado em TPU V5 em nuvem, melhorando a eficiência de entrada do usuário por meio da otimização de latência e outros métodos.

Link para mais detalhes: https://arxiv.org/abs/2406.04523

9、É possível gerar imagens com o Lumina-T2X da Nvidia no Confyui

O modelo de geração de imagens Lumina-T2X da Nvidia pode ser usado no Confyui. Como um modelo de código aberto, seu desempenho estético e qualidade de imagem são quase iguais aos do MJ V6 líder do setor, uma conquista notável no campo de código aberto.

image.png

【AiBase destaca:】

🌟 O Lumina-T2X usa uma arquitetura DiT unificada, capaz de gerar vários tipos de conteúdo de mídia, expandindo a gama de aplicações da IA na criação de conteúdo.

💡 O modelo de geração de imagens Lumina-T2I melhora a qualidade de geração e reduz os custos de treinamento, demonstrando o potencial econômico da tecnologia de IA.

🔑 A chave para o sucesso do Lumina-T2I é que a espinha dorsal do modelo usa Large-DiT, o modelo de codificação de texto usa Llama2-7B e o VAE usa SDXL, estabelecendo uma base para a geração de imagens de alta qualidade.

Os interessados podem usar este plugin no Confyui: https://github.com/kijai/ComfyUI-LuminaWrapper

10、Ilya, figura central da OpenAI, funda a nova empresa de IA SSI, visando a inteligência artificial segura e superinteligente

Após deixar a OpenAI, Ilya Sutskever fundou a Safe Superintelligence Inc., focada em resolver problemas de segurança em sistemas de IA superinteligentes. A empresa está comprometida com a pesquisa sobre o controle e a limitação de IAs que superam a inteligência humana e planeja resolver problemas de segurança por meio de avanços em engenharia e ciência. A SSI é uma entidade lucrativa desde o início, sem pressão comercial de curto prazo, e atualmente está contratando profissionais de tecnologia.

【AiBase destaca:】

🔒 A SSI se concentra em resolver problemas de segurança em sistemas de IA superinteligentes, comprometida com a pesquisa sobre métodos para controlar e limitar IAs que superam a inteligência humana.

🚀 A SSI planeja resolver problemas de segurança de IA por meio de avanços em engenharia e ciência, melhorando a capacidade e a segurança da IA.

💼 A SSI é uma entidade lucrativa, sem pressão comercial de curto prazo, e está contratando profissionais de tecnologia.

11、O GPT-4 passa no teste de Turing: mais da metade das pessoas não consegue distinguir o GPT-4 de um humano

Um dos marcos importantes no campo da inteligência artificial é o teste de Turing. Um experimento recente mostrou que a probabilidade do GPT-4 ser erroneamente identificado como humano em um teste de Turing interativo de duas pessoas atingiu 54%, gerando preocupações sobre o desempenho realista dos sistemas de IA. Os participantes tendem a usar o estilo de linguagem e fatores socioemocionais para julgar se o outro participante é humano, o que tem um impacto profundo na discussão sobre inteligência artificial.

【AiBase destaca:】

🤖 A probabilidade do GPT-4 ser erroneamente identificado como humano no teste de Turing atingiu 54%, demonstrando um desempenho realista.

🔍 Os participantes tendem a usar o estilo de linguagem e fatores socioemocionais para julgar se o outro participante é humano.

💡 Os resultados sugerem que os sistemas de IA podem enganar humanos em aplicações práticas, apresentando novos desafios éticos, de privacidade e segurança.