Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os destaques do setor de IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.

Novos produtos de IA Clique para saber mais: https://top.aibase.com/

1、Relatório indica que a ByteDance está integrando equipes de P&D de IA, e o AI Lab será incorporado à Seed

A ByteDance está integrando suas equipes de pesquisa e desenvolvimento de IA, incorporando o independente ByteDance AI Lab à equipe Seed. Essa medida reflete um ajuste no posicionamento estratégico da ByteDance na área de IA, com o objetivo de melhorar ainda mais sua capacidade de P&D. Desde sua criação em 2016, o AI Lab tem fornecido um forte suporte à inovação de produtos da empresa. A nova organização se concentrará no desenvolvimento de produtos de IA e modelos grandes, além de lançar um plano de recrutamento com altos salários para atrair talentos de ponta.

image.png

【AiBase em resumo:】

🚀 A ByteDance está integrando o AI Lab à equipe Seed para fortalecer sua capacidade de P&D em IA.

💼 O AI Lab, desde sua criação em 2016, tem fornecido forte suporte à inovação de produtos da ByteDance.

🎓 A ByteDance lançou um plano de recrutamento com altos salários para atrair talentos de ponta em IA para a Seed.

2、Atualização importante do ChatGPT: novo recurso de biblioteca de imagens permite visualizar todas as imagens geradas com o GPT

A OpenAI lançou o recurso de biblioteca de imagens para o ChatGPT, permitindo que os usuários gerenciem centralmente todas as imagens geradas pelo GPT-4. Esse recurso melhora a experiência criativa do usuário, permitindo edição e compartilhamento, e está disponível para usuários gratuitos, Plus e Pro. O lançamento da biblioteca de imagens não apenas fornece uma plataforma de gerenciamento conveniente para os usuários, mas também reduz a barreira à entrada para usuários não profissionais, impulsionando o rápido crescimento do mercado de geração de imagens por IA.

image.png

【AiBase em resumo:】

🗂️ O recurso de biblioteca de imagens oferece uma plataforma de gerenciamento centralizada, permitindo que os usuários armazenem e editem facilmente as imagens geradas.

📱 O aplicativo móvel adicionou a função de geração de imagens com um toque, simplificando o processo e melhorando a eficiência criativa.

🔒 A OpenAI adicionou uma marca d'água às imagens geradas por usuários gratuitos e segue rigorosamente as políticas de privacidade para garantir a segurança dos dados do usuário.

3、Festa para quem gosta de coisas grátis! O Veo2 chega ao Google AI Studio, gerando vídeos hiper-realistas de até 8 segundos

O modelo de geração de vídeo Veo2 do Google DeepMind foi lançado oficialmente, marcando um grande avanço na tecnologia de geração de vídeo por IA. O Veo2 suporta a geração de vídeos com resolução de até 720p a partir de texto ou imagens, com excelente realismo visual e capacidade de simulação física. Sua capacidade única de entender a linguagem cinematográfica permite que os usuários gerem vídeos de nível profissional, amplamente aplicáveis ​​em criação de conteúdo, marketing, educação e outros campos.

image.png

【AiBase em resumo:】

🌟 O Veo2 suporta a geração de vídeos com resolução de até 720p, e no futuro poderá ser expandido para 4K, melhorando significativamente a qualidade do vídeo.

🎬 O modelo consegue simular com precisão as leis físicas do mundo real, reduzindo problemas de "ilusão" em vídeos gerados por IA e melhorando o realismo.

🔒 O Google integrou marcas d'água digitais e filtros de segurança ao Veo2 para garantir que o conteúdo gerado esteja em conformidade com as normas de privacidade e ética.

4、A Caixa de Ferramentas da Ant lança oficialmente a “Área MCP”, com mais de 30 serviços, incluindo o “Servidor MCP de Pagamento”, disponibilizados na primeira fase

A plataforma de agentes inteligentes "Caixa de Ferramentas" do Grupo Ant lançou a "Área MCP", que suporta a implantação e chamada de vários serviços MCP, visando melhorar a eficiência de configuração de agentes inteligentes e ferramentas externas. Os desenvolvedores podem construir rapidamente agentes inteligentes que se conectam aos serviços MCP e resolver problemas de pagamento por meio do "Servidor MCP de Pagamento". Além disso, a Caixa de Ferramentas também integrará soluções de segurança para garantir a segurança dos dados e da privacidade dos agentes inteligentes.

image.png

【AiBase em resumo:】

🛠️ A Caixa de Ferramentas lança a “Área MCP”, com mais de 30 serviços MCP, permitindo que os desenvolvedores criem agentes inteligentes em 3 minutos.

💳 O "Servidor MCP de Pagamento" lançado na primeira fase resolveu o problema de pagamento entre agentes inteligentes, reduzindo a barreira à entrada para o desenvolvimento.

🔒 A Caixa de Ferramentas integrará soluções de segurança líderes do setor para garantir a segurança de dados e privacidade dos agentes inteligentes.

5、Modelo de visão 3D de grande porte SpatialLM é de código aberto, identificando conteúdo de cena em tempo real

O SpatialLM é um modelo de linguagem de grande porte de visão 3D de código aberto da Hangzhou Qunhe Technology, com forte capacidade de compreensão espacial. Este modelo gera cenas 3D fisicamente corretas a partir de vídeos comuns, reduzindo significativamente a barreira à entrada para a coleta de dados e trazendo avanços revolucionários para áreas como robótica, design de arquitetura e RA/RV.

image.png

【AiBase em resumo:】

📹 O SpatialLM usa vídeos de telefones celulares comuns para gerar layouts de cenas 3D fisicamente corretas, reduzindo o custo de coleta de dados.

🤖 O modelo suporta navegação e execução de tarefas de robôs em ambientes complexos, amplamente aplicado em casas inteligentes e robôs de serviço.

🏗️ O SpatialLM pode identificar automaticamente estruturas em projetos de construção, auxiliando em designs eficientes, e também pode ser usado em educação e desenvolvimento de RA/RV.

Link para detalhes:https://huggingface.co/manycore-research/SpatialLM-Llama-1B

6、Plataforma de supercomputação nacional lança modelo de grande porte multi-modal de nova geração, impulsionando o desenvolvimento de agentes de IA

O lançamento do "modelo de grande porte multi-modal de texto longo" pela plataforma de internet de supercomputação nacional marca mais um importante avanço na tecnologia de inteligência artificial. As duas versões, MiniMax-Text-01 e MiniMax-VL-01, desenvolvidas pela Shanghai Xiyu Technology Co., Ltd., não apenas melhoraram as capacidades de processamento de linguagem natural e visão computacional, mas também forneceram forte suporte à transformação inteligente das empresas.

image.png

【AiBase em resumo:】

🧠 O novo modelo de grande porte multi-modal de texto longo acelerará o desenvolvimento de agentes de IA, melhorando a produtividade e o atendimento ao cliente das empresas.

🔍 O MiniMax-Text-01 se concentra no processamento de dados de texto, enquanto o MiniMax-VL-01 combina informações visuais e de linguagem, adequado para tarefas multi-modais.

📈 Com a popularização da aplicação de modelos de grande porte, como as empresas podem implementá-los de forma eficaz se tornará a chave para a competição futura do mercado.

7、O computador integrado de modelos de grande porte AIStack da Alibaba Cloud faz sua primeira aparição, oferecendo soluções de IA de alto custo-benefício para empresas

Na 8ª Cúpula Nacional de Construção Digital, a Alibaba Cloud lançou o novo computador integrado de modelos de grande porte AIStack, marcando um importante avanço em soluções de IA para empresas. Este computador integrado combina hardware e software, visando fornecer serviços inteligentes de alto custo-benefício para setores como governança, energia e saúde. O lançamento do AIStack não apenas responde à demanda do mercado por serviços de IA econômicos e eficientes, mas também fornece um suporte importante para a transformação inteligente das empresas.

image.png

【AiBase em resumo:】

💡 O AIStack combina integração profunda de hardware e software para fornecer serviços inteligentes para diversos setores.

🏷️ Este computador integrado atende às necessidades personalizadas de diferentes clientes com alto custo-benefício e flexibilidade.

📈 O AIStack já está sendo usado em setores como governo, energia e saúde, melhorando significativamente a eficiência do trabalho.

8、Grande atualização do Grok-3: o Grok Studio é lançado para auxiliar na criação e colaboração de IA em vários cenários

O lançamento do Grok Studio marca a transformação do Grok-3 em uma plataforma abrangente de produtividade, oferecendo várias funções, como geração de documentos, codificação e análise de relatórios, atendendo às diversas necessidades de desenvolvedores e criadores. A visualização em tempo real e a integração com o Google Drive melhoram a experiência do usuário, tornando-o adequado para colaboração remota e desenvolvimento rápido de protótipos. A abertura do Grok Studio permite que todos os usuários experimentem seus poderosos recursos, impulsionando a inovação e aplicação de ferramentas de produtividade de IA.

image.png

【AiBase em resumo:】

🛠️ O Grok Studio é uma plataforma multifuncional que suporta a geração de documentos, codificação e desenvolvimento de jogos para navegadores, melhorando a eficiência criativa.

📊 O recurso de visualização em tempo real reduz significativamente o tempo de depuração, permitindo que os usuários vejam instantaneamente os resultados do código, ideal para o desenvolvimento rápido de protótipos.

🌐 O Grok Studio está aberto a todos os usuários, oferecendo versões gratuitas e pagas para atender às diferentes necessidades dos usuários.

Link para detalhes:https://grok.com/

9、OpenAI ingressa nas redes sociais: integrando a geração de imagens e o fluxo de informações dinâmicas

A OpenAI está desenvolvendo uma nova plataforma de rede social que visa combinar seu recurso de geração de imagens do ChatGPT com o fluxo de informações dinâmicas das redes sociais. O lançamento deste projeto não é apenas um passo importante na transformação estratégica da OpenAI, mas também a colocará em uma posição de vantagem na concorrência direta com concorrentes como Meta e X. Ao construir sua própria plataforma de rede social, a OpenAI espera obter dados do usuário para melhorar o treinamento de seus modelos de IA, e também pode remodelar as expectativas do usuário sobre a interação entre IA e redes sociais.

image.png

【AiBase em resumo:】

🖼️ A OpenAI está desenvolvendo uma nova plataforma de rede social focada no recurso de geração de imagens do ChatGPT.

📊 O desenvolvimento da rede social fornecerá dados do usuário para a OpenAI, ajudando-a a manter sua posição de liderança na competição de IA.

⚔️ Este projeto colocará a OpenAI em concorrência direta com gigantes da tecnologia como Meta e X, e pode remodelar a experiência do usuário.

10、Relatório indica que a OpenAI pode lançar recursos de mídia social semelhantes ao X, planejando integrar o ChatGPT

A OpenAI está desenvolvendo um novo recurso de mídia social que pode ser integrado à sua popular ferramenta ChatGPT. O foco principal é a geração de imagens, permitindo que os usuários criem e compartilhem imagens geradas por IA, criando uma experiência de interação social semelhante à plataforma X. Embora o projeto ainda esteja em estágio inicial, essa medida da OpenAI é vista como um desafio às gigantes atuais de mídia social, além de levantar preocupações sobre privacidade do usuário e moderação de conteúdo.

image.png

【AiBase em resumo:】

🖼️ A OpenAI está desenvolvendo um recurso de mídia social semelhante ao X, focando na capacidade de geração de imagens do ChatGPT.

📈 Este recurso visa utilizar a base de usuários do ChatGPT para melhorar a criação de conteúdo e a interação social.

⚖️ A OpenAI precisa se preocupar com a privacidade do usuário e a moderação de conteúdo para evitar os erros de outras plataformas de mídia social.

11、A Anthropic pode lançar um assistente de IA por voz, e o Claude terá três modos de voz

De acordo com a Bloomberg, a empresa de inteligência artificial Anthropic está prestes a lançar seu novo assistente de IA por voz, Claude, que deve ser lançado oficialmente ainda este mês. Este assistente permitirá que os usuários interajam com o Claude por meio da voz, melhorando a naturalidade e conveniência da comunicação homem-máquina. A Anthropic planeja lançar três modos de voz em inglês: Airy, Mellow e Buttery, para oferecer uma experiência de comunicação diversificada e personalizada. Além disso, a Anthropic também lançou um pacote de assinatura mensal de US$ 200 para usuários "premium", expandindo ainda mais sua competitividade no mercado.

image.png

【AiBase em resumo:】

🎤 A Anthropic lançará seu novo assistente de IA por voz, Claude, ainda este mês, com três modos de voz.

🗣️ O novo recurso de voz visa melhorar a experiência de interação do usuário com a IA, incluindo as opções de voz Airy, Mellow e Buttery.

💰 A Anthropic lançou recentemente um pacote de assinatura mensal de US$ 200, continuando a expandir sua competitividade no mercado de IA.

12、A Gamma lança a plataforma 2.0 totalmente atualizada: evolução completa na criação de documentos, apresentações e páginas da web

O lançamento da plataforma Gamma 2.0 marca uma grande atualização nas ferramentas de criação de conteúdo de IA. A nova plataforma aprimora a experiência de geração de conteúdo do usuário por meio de sua interface moderna e otimização aprofundada de suas três principais funções. Funções como geração inteligente de documentos, design automático de apresentações e construção de páginas da web sem código tornam o processo de criação mais eficiente e conveniente.

image.png

【AiBase em resumo:】

✨ Novo design de interface do usuário, aprimorando a experiência do usuário e reduzindo a curva de aprendizado.

📄 Três funções principais atualizadas, suportando a criação de documentos, apresentações e páginas da web.

📈 Funções de otimização de SEO e adaptação móvel, aprimorando a competitividade de mercado dos criadores de conteúdo.

13、A Hugging Face, plataforma conhecida por modelos de grande porte de código aberto, ingressa no campo da robótica, adquirindo a Pollen Robotics

A Hugging Face recentemente adquiriu a Pollen Robotics, uma startup francesa de robôs humanoides, marcando seu posicionamento estratégico no campo da robótica. Essa aquisição impulsionará o desenvolvimento do ecossistema de robótica de código aberto, especialmente seu produto principal, o Reachy2, um braço robótico de 7 graus de liberdade, adequado para educação e pesquisa. A Hugging Face planeja integrar o Reachy2 em seus projetos de código aberto e abrir o repositório de código para promover a participação de desenvolvedores em todo o mundo.

image.png

【AiBase em resumo:】

🌟 A Hugging Face adquire a Pollen Robotics, ingressando oficialmente no mercado de robôs humanoides.

🤖 O Reachy2 é um robô humanoide com um braço robótico de 7 graus de liberdade, adequado para educação e pesquisa.

🔧 A Hugging Face abrirá o repositório de código do Reachy2 para impulsionar o ecossistema de robótica de código aberto impulsionado pela comunidade.