Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais assuntos do campo de IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.
Novos produtos de IA clique para saber mais: https://top.aibase.com/
1、O Google Gemini está prestes a lançar cinco novos recursos: Imagen3, GPT personalizado, etc.
O Google está prestes a lançar novos recursos para a série de produtos Gemini, incluindo Imagen3, Gemini GPT personalizado, etc., aguardados com grande expectativa. Esses novos recursos oferecerão aos usuários uma experiência mais personalizada e conveniente, demonstrando a contínua inovação e desenvolvimento do Google no campo da inteligência artificial.
【AiBase destaca:】
🔍 O Google Gemini está prestes a lançar novos recursos, incluindo Imagen3, Gemini GPT personalizado, etc., oferecendo aos usuários uma experiência mais personalizada e conveniente.
🔍 Espera-se que o Gemini também lance recursos como respostas personalizadas, prompts de reserva, gravação e integração com o Google Fotos, enriquecendo ainda mais a experiência do usuário.
🔍 O Google está intensificando o recrutamento de testadores beta do Gemini para iOS. A atualização do iOS pode estar próxima, mostrando o ímpeto contínuo do desenvolvimento do Gemini.
2、O Baidu lança o aplicativo social de pessoa digital de IA, Wen Xiaoyan
O Baidu lançou recentemente o aplicativo social de pessoa digital de IA chamado "Wen Xiaoyan". Usando a tecnologia avançada do modelo de linguagem grande Wenxin, os usuários podem se comunicar e interagir em tempo real com pessoas digitais realistas, construir conexões emocionais e desfrutar de uma experiência de interação mais real e natural. Os usuários podem encontrar seus personagens digitais favoritos no aplicativo para conversar, aprender sobre suas informações e interagir de várias maneiras.
【AiBase destaca:】
🤖 Os usuários podem se comunicar e interagir em tempo real com personagens virtuais de IA, construir conexões emocionais e melhorar a experiência de interação.
📱 Cada pessoa digital de IA oferece serviços de bate-papo exclusivos, que podem servir como enciclopédias para os usuários, assistentes pessoais ou até mesmo mentores espirituais.
💬 As pessoas digitais exibem voz e texto ao responder e usam linguagem corporal para aumentar o realismo.
3、Projeto Morango da OpenAI revelado: capacidade de raciocínio Q* explodindo, futuro ao alcance!
Estou animado e curioso sobre o projeto Morango da OpenAI. Este projeto, que reaparece sob a forma de um morango, supostamente permitirá que a IA planeje tarefas antecipadamente, colete informações na internet de forma autônoma e até mesmo realize pesquisas aprofundadas. A filosofia de design do modelo Morango é bastante inovadora, dando à IA uma capacidade de raciocínio sem precedentes. O processo de pesquisa e desenvolvimento secreto da OpenAI e o alto grau de sigilo aumentam ainda mais a expectativa pelos resultados futuros.
【AiBase destaca:】
🍓 O projeto Morango permite que a IA planeje tarefas antecipadamente, colete informações na internet de forma autônoma e realize pesquisas aprofundadas.
🔍 A tecnologia STaR, através da utilização iterativa de um pequeno número de exemplos de raciocínio e uma grande quantidade de dados sem raciocínio, permite que a IA se aprimore.
🚀 A OpenAI espera que o Morango possa executar tarefas de longa duração, melhorando a capacidade de raciocínio do modelo de IA.
Endereço do artigo:https://arxiv.org/pdf/2203.14465
4、Magic Insert: arrastar e soltar permite que as pessoas se integrem perfeitamente a novos cenários
No mundo mágico da criação digital, o charme da tecnologia Magic Insert reside na capacidade de mover facilmente um assunto de uma imagem para outra imagem de fundo com um estilo diferente, alcançando uma integração perfeita. Essa tecnologia combina personalização de percepção de estilo e inserção de objetos, demonstrando flexibilidade e diversidade, trazendo novos desafios para o campo da geração de imagens.
【AiBase destaca:】
🔮 A tecnologia Magic Insert combina personalização de percepção de estilo e inserção de objetos, permitindo a perfeita integração de assuntos em diferentes cenários.
🌟 Os destaques da tecnologia incluem o uso de LoRA e modelos de ajuste fino de marcação de texto, a tecnologia Bootstrapped Domain Adaptation para inserção de objetos reais, e a flexibilidade para selecionar o grau de estilização e a fidelidade dos detalhes do assunto.
💡 Os pesquisadores demonstraram os resultados experimentais do Magic Insert em vários temas e cenários de estilo, provando sua eficácia e preferência do usuário.
Link de detalhes:https://magicinsert.github.io/demo.html
5、Kuaikan Comics: está treinando um grande modelo vertical na área de anime
A Kuaikan Comics está se dedicando à exploração de ajuste fino baseado em grandes modelos de código aberto, treinando um grande modelo vertical na área de anime para melhorar a taxa de conversão e a vitalidade da pesquisa de obras e promover o desenvolvimento inovador da indústria de quadrinhos. Usando modelos de linguagem grandes (LLM) e tecnologia de geração aprimorada por recuperação (RAG), a Kuaikan Comics construiu um banco de dados interno e adotou uma estratégia de ajuste fino de grandes modelos + RAG para melhorar a velocidade de resposta e os indicadores de classificação da pesquisa.
【AiBase destaca:】
🔍 Usar grandes modelos para ajuste fino, melhorar a taxa de conversão e a vitalidade da pesquisa de obras
🤖 Usar modelos de linguagem grandes (LLM) e tecnologia de geração aprimorada por recuperação (RAG), construir um banco de dados interno
🎨 Impulsionar o desenvolvimento inovador da indústria de quadrinhos, melhorar a experiência do usuário e a capacidade de produção de conteúdo
6、Atualização de serviços personalizados! A Amazon lança silenciosamente o assistente de compras Rufus AI
O assistente de compras Rufus AI, recém-lançado pela Amazon, oferece aos usuários uma experiência de compra personalizada. Através de um serviço inteligente de perguntas e respostas, ajuda os usuários a economizar tempo e tomar decisões inteligentes, demonstrando uma excelente capacidade de resolução de problemas de compras.
【AiBase destaca:】
🛒 O assistente de compras Rufus AI foi lançado, oferecendo uma experiência de compra personalizada e economizando tempo para os usuários.
🤖 Serviço inteligente de perguntas e respostas, respondendo detalhadamente às perguntas dos usuários sobre produtos, incluindo recomendações, comparações e rastreamento de pedidos.
🌟 O Rufus mostra potencial e pode se tornar um trunfo na área de compras inteligentes da Amazon, liderando a inovação no varejo.
7、O modelo de IA Eureka do Google é exposto antecipadamente, a capacidade excepcional de escrita de texto chama a atenção
O Google está prestes a lançar um novo modelo de IA chamado "Eureka", que está sendo aguardado com grande expectativa. O Eureka tem um desempenho excepcional na geração de linguagem natural e é considerado um grande avanço do Google na área de IA. Espera-se que um anúncio preliminar seja feito em 15 de julho e um lançamento oficial em 18 de julho. Além do Eureka, o Google também está desenvolvendo outras novas ferramentas, como o Google Gemini, gerando grande interesse na indústria.
【AiBase destaca:】
✨ O modelo Eureka tem um desempenho excepcional na geração de linguagem natural, superando outros modelos.
🔑 O Eureka demonstra uma capacidade aprimorada de seguir instruções, com uma adesão excepcional aos parâmetros definidos pelo usuário.
💡 O Eureka tem o potencial de melhorar o desempenho em uma ampla gama de tarefas impulsionadas por IA.
8、Tecnologia de reconstrução visual 3D DUSt3R: geração fácil de modelos 3D com base em imagens 2D
DUSt3R é uma tecnologia inovadora que pode criar modelos 3D sem informações da câmera, simplificando enormemente o processo de conversão de imagens 2D em modelos 3D. Ele usa um método de processamento inteligente, fornecendo processamento eficiente de tarefas de reconstrução e desempenho excepcional, alcançando os melhores resultados em várias tarefas visuais.
【AiBase destaca:】
🌟 Tecnologia inovadora: DUSt3R pode criar modelos 3D sem informações da câmera, simplificando os complexos requisitos de parâmetros da câmera.
📷 Processamento eficiente: DUSt3R processa de forma unificada as tarefas de reconstrução de várias imagens, de forma inteligente e eficiente.
🚀 Desempenho excepcional: DUSt3R tem um desempenho excepcional em várias tarefas visuais, alcançando os melhores resultados.
Link de detalhes:https://top.aibase.com/tool/dust3r
9、OpenDiLoCo: solução de código aberto para treinamento de IA distribuída, baixo custo de comunicação, cobertura global!
Na era da explosão da IA, o framework de código aberto OpenDiLoCo implementou o método de treinamento DiLoCo, alcançando treinamento distribuído global com baixo custo de comunicação e mantendo alta utilização de computação.
【AiBase destaca:】
🌐 Treinamento distribuído global: OpenDiLoCo implementou o treinamento de modelos em escala global, abrangendo dois continentes e três países, mantendo alta utilização de computação.
⚙️ Gerenciamento dinâmico de recursos: os recursos computacionais podem ser ajustados dinamicamente durante o treinamento, e novos dispositivos podem entrar ou sair do treinamento a qualquer momento.
🔗 Tolerância a falhas e comunicação ponto a ponto: usa a biblioteca Hivemind para implementar treinamento tolerante a falhas, e usa comunicação ponto a ponto para treinamento, melhorando a eficiência e a estabilidade.
Link de detalhes:https://arxiv.org/pdf/2407.07852
10、A Microsoft e o MIT inauguram uma nova era de raciocínio: modelo de 67 milhões de parâmetros, competindo com o GPT-4
Neste artigo, os pesquisadores apresentam uma estratégia de treinamento de aprendizado de máquina inovadora. Através da melhoria da capacidade de raciocínio lógico e da utilização de relações causais para construir um conjunto de treinamento, eles conseguiram treinar um pequeno modelo Transformer que se compara ao GPT-4. Esta pesquisa abre novas possibilidades para a IA aprender raciocínio causal, permitindo que a IA entenda e explique melhor o mundo.
【AiBase destaca:】
🔍 Método de treinamento exclusivo: usa um novo método de treinamento para melhorar a capacidade de raciocínio lógico de grandes modelos.
🧠 Melhoria do raciocínio lógico: melhora significativamente a capacidade de raciocínio lógico do modelo, resolvendo desafios anteriores.
🔗 Usar relações causais para construir um conjunto de treinamento: usa modelos de relações causais para construir um conjunto de dados de treinamento, ajudando o modelo a entender a lógica causal por trás dos dados.
Link de detalhes:https://arxiv.org/pdf/2407.07612v1
11、Órgão regulador financeiro dos EUA insta a investigação sobre problemas de acordo de confidencialidade da OpenAI
Este artigo relata que um grupo de denunciantes expôs problemas no acordo de confidencialidade da OpenAI e pediu aos órgãos reguladores financeiros dos EUA para investigar. Os denunciantes alegam que a OpenAI pode estar restringindo os direitos de denúncia dos funcionários, causando preocupação pública. Grassley disse que as políticas da OpenAI restringiram os direitos dos denunciantes e pediu à SEC que investigasse suas ações impróprias.
【AiBase destaca:】
⭐️ Denunciantes expõem problemas no acordo de confidencialidade da OpenAI e pedem à SEC para investigar
⭐️ A OpenAI é acusada de violar as regras da SEC, privando os funcionários do direito de denunciar
⭐️ De acordo com a carta de denúncia, a OpenAI foi solicitada a produzir todos os acordos de confidencialidade para evitar a violação dos direitos dos funcionários, e os denunciantes pediram à SEC que investigasse as ações impróprias da OpenAI