Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os destaques do campo de IA, com foco em desenvolvedores, para ajudá-lo a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.

Novos produtos de IA Clique para saber mais: https://top.aibase.com/

1. O poderoso modelo Llama3 foi oficialmente lançado e atingiu o nível do GPT4

Llama3 é o mais recente modelo de código aberto lançado pela Meta, com 8 bilhões e 70 bilhões de parâmetros, com lançamento previsto para julho. O modelo possui capacidades multimodais, integra novas funções de codificação de computador e será usado em dispositivos como os óculos inteligentes da Meta. Em comparação com seu antecessor, Llama2, ele fez progressos significativos em raciocínio, geração de código e seguimento de instruções. A Meta está colaborando com o Google para integrar resultados de pesquisa em tempo real ao assistente de IA, melhorando a experiência do usuário.

image.png

【AiBase destaca:】

✨ Llama3 contém 8 bilhões e 70 bilhões de parâmetros, possui capacidades multimodais e será usado em dispositivos como os óculos inteligentes da Meta.

🚀 Llama3 fez progressos significativos em raciocínio, geração de código e seguimento de instruções, com desempenho excepcionalmente inovador.

💡 A Meta está colaborando com o Google para integrar resultados de pesquisa em tempo real ao assistente de IA, melhorando a experiência do usuário.

Endereço de experiência: https://www.meta.ai/

Download do modelo: https://top.aibase.com/tool/meta-llama-3

Hugging Chat: https://huggingface.co/chat/conversation/6621c6d78f6a88b6b6084ac4

2. Midjourney lança novo recurso Room: usuários podem criar imagens juntos em salas de bate-papo

A Midjourney lançou recentemente um novo recurso interessante - Room, que fornece aos usuários uma plataforma de colaboração e socialização onde eles podem criar e compartilhar imagens juntos e participar de bate-papos em tempo real. O Room promove a interação e a colaboração entre os usuários, inspirando a troca de ideias e criatividade, enriquecendo a experiência da Midjourney.

image.png

【AiBase destaca:】

🎨 Os usuários podem criar e compartilhar imagens juntos, trocando ideias e feedback em bate-papos em tempo real.

💬 O Room oferece recursos de bate-papo por voz e texto, facilitando a discussão do processo criativo e o compartilhamento de ideias.

🤝 As imagens geradas à esquerda podem ser facilmente referenciadas no bate-papo, promovendo a interação e a colaboração entre os usuários.

Link para detalhes: https://www.midjourney.com/showcase

3. Baidu Wenku lança os recursos "Quadrinhos Inteligentes" e "Caderno Inteligente"

Na Conferência de Desenvolvedores de IA da Baidu Create2024 de 2024, o Baidu Wenku lançou os novos recursos "Quadrinhos Inteligentes" e "Caderno Inteligente", oferecendo aos usuários uma experiência de criação de quadrinhos ou cadernos com apenas uma frase, impulsionando o desenvolvimento da criação de conteúdo multi-modal. Os usuários podem gerar renda com suas criações, melhorar a comunicação entre pais e filhos e participar de concursos e comunidades de criação de quadrinhos. O Baidu Wenku está colaborando com a Xuanji Technology para criar uma solução de quadrinhos inteligentes líder mundial.

image.png

【AiBase destaca:】

✨ Os usuários podem criar quadrinhos ou cadernos com apenas uma frase, permitindo um caminho de criação de ponta a ponta.

🎨 O recurso "Quadrinhos Inteligentes" do Baidu Wenku otimiza a geração de histórias, oferecendo uma variedade de estilos e opções de personagens para criar obras de alta qualidade.

📚 O recurso "Caderno Inteligente" permite que os pais criem histórias exclusivas para seus filhos, melhorando a comunicação entre pais e filhos e oferecendo uma experiência de vídeo com imagens e narração.

Link para detalhes: https://wenku.baidu.com/pcactivity/makeAppointment?_wkts_=1713506418546&

4. Ferramenta de edição de vídeo automática com IA Captions suporta sincronização labial, adição automática de efeitos sonoros, etc.

Esta ferramenta de edição de vídeo com IA, chamada Captions, simplifica revolucionariamente o processo de edição de vídeo, oferecendo uma série de recursos automatizados que aprimoram os efeitos visuais e sonoros do vídeo. Os usuários podem escolher modelos de legendas, adicionar efeitos sonoros, adesivos e outros elementos para tornar o vídeo mais atraente. O Captions também suporta recursos de IA como foco nos olhos, redução de ruído, sincronização labial e ajuste de cores, tornando os vídeos mais profissionais e bonitos. Sua versão web facilita o uso pelos usuários, e planeja adicionar recursos de tradução automática de legendas no futuro, atraindo mais usuários globais.

image.png

【AiBase destaca:】

✨ Ferramenta revolucionária de edição de vídeo que identifica automaticamente clipes importantes e os edita em vídeos curtos, simplificando o processo de edição.

🎬 Oferece recursos automatizados que aprimoram os efeitos visuais e sonoros, permitindo que os usuários escolham modelos de legendas, adicionem efeitos sonoros, adesivos e outros elementos.

💡 Suporta recursos de IA como foco nos olhos, redução de ruído, sincronização labial e ajuste de cores, melhorando a profissionalidade e o apelo do vídeo.

Link para detalhes: https://top.aibase.com/tool/captions

5. Agora você pode usar modelos de código aberto em seu celular! Hugging Face lança o aplicativo iOS Hugging Chat

A Hugging Face lançou recentemente o aplicativo cliente iOS chamado "Hugging Chat", oferecendo aos usuários uma experiência conveniente. Os usuários agora podem acessar e usar vários modelos de código aberto hospedados na plataforma Hugging Face em seus celulares. O aplicativo é rápido e oferece uma experiência perfeita, embora o suporte ao chinês precise de melhorias. Essa iniciativa inovadora demonstra mais uma vez a liderança da Hugging Face na área de modelos de linguagem e sua atenção às necessidades dos usuários.

image.png

【AiBase destaca:】

📱 Os usuários agora podem acessar e usar vários modelos de código aberto hospedados na plataforma Hugging Face em seus celulares.

⚙️ O aplicativo oferece seis modelos, incluindo Command R+, Zephyr-14b, Mixtral8x7B, etc. Embora o suporte ao chinês não seja ideal, ele ainda é popular.

🚀 O aplicativo é muito rápido e oferece uma experiência perfeita aos usuários.

Link para detalhes: https://apps.apple.com/us/app/huggingchat/id6476778843

6. Nothing anuncia que os fones de ouvido suportarão o ChatGPT

A Nothing anunciou que integrará o ChatGPT ainda mais profundamente em seus smartphones e fones de ouvido, oferecendo aos usuários um serviço mais rápido. Os usuários podem interagir rapidamente com as ferramentas de IA por meio de comandos de voz, sem operação manual. Após a atualização, os usuários poderão usar o ChatGPT em seus fones de ouvido Nothing, melhorando a experiência do assistente inteligente. A empresa planeja ir além, incorporando um ponto de entrada de nível de sistema para o ChatGPT no Nothing OS, melhorando a experiência do usuário do smartphone.

image.png

【AiBase destaca:】

🔊 Os usuários podem interagir rapidamente com as ferramentas de IA por meio de comandos de voz, sem operação manual.

📱 Após a atualização, os usuários poderão usar o ChatGPT em seus fones de ouvido Nothing, melhorando a experiência do assistente inteligente.

🚀 A Nothing planeja integrar o ChatGPT ainda mais profundamente em seus smartphones e fones de ouvido, oferecendo aos usuários um serviço mais rápido.

7. Stability AI anuncia demissão de 20 funcionários, cerca de 10% do total de funcionários

A Stability AI anunciou a demissão de 20 funcionários. A decisão de demissão visa reduzir custos, fortalecer o apoio de investidores e parceiros e impulsionar a equipe a continuar desenvolvendo e lançando produtos inovadores. A empresa enfrentou recentemente problemas de rotatividade de pessoal, com o CEO fundador renunciando e enfrentando um processo por violação de direitos autorais. A decisão de demissão foi tomada após algumas semanas conturbadas após a saída do CEO.

【AiBase destaca:】

📉 A empresa demitiu 20 funcionários, cerca de 10% do total de funcionários, com o objetivo de reduzir custos, fortalecer o apoio e promover o desenvolvimento de produtos.

💼 A empresa enfrentou recentemente problemas de rotatividade de pessoal, com o CEO fundador renunciando e enfrentando um processo por violação de direitos autorais.

⚖️ A decisão de demissão faz parte de um plano estratégico, e os departamentos afetados ainda não foram especificados.

8. O gerador de imagens OpenAI DALL-E2 interrompe o serviço, o DALL-E3 assume seu lugar

A OpenAI anunciou o encerramento do serviço do gerador de imagens DALL-E2, que será substituído pelo DALL-E3. O DALL-E3 integra o ChatGPT, oferecendo uma interface mais simples e imagens de melhor qualidade. Os usuários devem observar que o DALL-E2 não aceitará mais novos clientes e recomenda-se o uso do DALL-E3 para geração de imagens.

image.png

【AiBase destaca:】

🔍 O DALL-E3 integra o ChatGPT, oferecendo uma interface mais simples e imagens de melhor qualidade.

💡 O DALL-E3 oferece imagens de maior qualidade e melhor correspondência de prompts, adequado para ChatGPT Plus, Team e Enterprise, bem como a API OpenAI.

🛑 O DALL-E2 não aceitará mais novos clientes; os usuários não poderão criar novas imagens na interface do DALL-E2; recomenda-se baixar o conteúdo particularmente apreciado para segurança.

9. A Administração do Ciberespaço da China confirma que 116 grandes modelos de IA foram registrados

A Administração do Ciberespaço da China publicou o "Aviso sobre informações já registradas de serviços de inteligência artificial generativa", confirmando que 116 grandes modelos de IA passaram pelo processo de registro, o que significa que eles atendem às normas relevantes e podem ser usados legalmente na China. Essa medida promoveu o desenvolvimento inovador e o uso regulamentado de serviços de inteligência artificial generativa, tendo um significado importante para o desenvolvimento do campo da inteligência artificial.

image.png

【AiBase destaca:】

📝 116 grandes modelos de IA foram confirmados após o registro e podem ser usados legalmente na China.

📝 Os grandes modelos de IA registrados abrangem várias áreas e cenários de aplicação.

📝 Os aplicativos de inteligência artificial generativa já lançados devem divulgar informações de registro para aumentar a transparência das informações.

10. Qual é o melhor modelo de IA na China? O novo relatório de avaliação de 14 grandes modelos de linguagem da Tsinghua University é lançado, com GLM-4 e Wenxin 4.0 na primeira linha

Este artigo resume o mais recente relatório de avaliação de capacidade abrangente de grandes modelos de linguagem da Tsinghua University, "SuperBench", que avaliou 14 grandes modelos de linguagem nacionais e estrangeiros. Na avaliação, os modelos domésticos como GLM-4 e Wenxin 4.0 tiveram um desempenho notável, reduzindo gradualmente a diferença em relação aos modelos internacionais de primeira linha.

image.png

【AiBase destaca:】

🔍 Os modelos da série GPT-4 e Claude-3 ainda estão em posição de liderança, enquanto os principais modelos domésticos GLM-4 e Wenxin 4.0 têm um desempenho notável.

📊 Na avaliação de capacidade de compreensão semântica e como agente inteligente, os modelos domésticos estão gradualmente se aproximando do nível dos modelos internacionais de primeira linha.

💡 A avaliação de capacidade de grandes modelos passou por cinco estágios: avaliação semântica, avaliação de código, avaliação de alinhamento, avaliação de agente inteligente e avaliação de segurança, mostrando uma tendência de migração e desenvolvimento contínuo.

Detalhes:

https://mp.weixin.qq.com/s/r_aAjFHTRDBGXhl3bd06XQ

11. MeMenteeBot: um robô que pode entender a linguagem humana e aprender por observação

MeMenteeBot é um robô com recursos revolucionários, com capacidade de execução de tarefas de ponta a ponta, capaz de entender instruções verbais humanas e aprender por meio da imitação visual. Sua capacidade de adaptação e movimentos ágeis são impressionantes, combinando aprendizado por imitação visual e tecnologia avançada Sim2Real, marcando uma nova fase na tecnologia robótica e abrindo infinitas possibilidades para aplicações futuras de robôs.

image.png

【AiBase destaca:】

🤖 MeMenteeBot possui capacidade de execução de tarefas de ponta a ponta, podendo receber comandos verbais e executar tarefas complexas.

🔧 MeMenteeBot possui um ciclo completo de planejamento e controle, incluindo navegação, caminhada, compreensão de cena, detecção e localização de objetos, captura e compreensão de linguagem natural.

🔄 MeMenteeBot utiliza tecnologia de aprendizado Sim2Real avançada, proporcionando ao robô movimentos ágeis, demonstrando flexibilidade e estabilidade excepcionais.