Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais destaques do campo da IA, com foco em desenvolvedores, para ajudá-lo a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.
Novos produtos de IA clique para saber mais:https://top.aibase.com/
1、A ByteDance lança plataforma de comunidade de modelos de IA: Lumi, semelhante ao Liblib e ao CIvitai
A plataforma de comunidade de compartilhamento de modelos de IA Lumi, recém-lançada pela ByteDance, demonstra sua estratégia abrangente no campo da IA. A plataforma oferece recursos de upload e compartilhamento de modelos, criação de workflows e treinamento LoRA, atualmente disponível apenas para usuários com lista de permissões. Semelhante ao LiblibAI, o Lumi se tornará um elemento importante na estratégia da ByteDance na área de IA.
【AiBase destaca:】
🚀 Lumi é a mais recente plataforma de comunidade de compartilhamento de modelos de IA lançada pela ByteDance, oferecendo recursos de upload e compartilhamento de modelos e treinamento.
💡 Com foco semelhante ao LiblibAI, o Lumi demonstra a estratégia abrangente da ByteDance no campo da IA.
💥 A ByteDance já possui uma ampla presença no campo da IA, incluindo grandes modelos, ChatBots, mídia social com IA e companheiros virtuais com IA, entre outros.
Acesso ao produto: https://top.aibase.com/tool/lumilumi
2、A identidade do misterioso modelo de IA "Pequeno Panda" é revelada: Recraft V3, o mais recente modelo de geração de imagens de uma empresa de IA britânica
Comentei sobre o recém-revelado modelo de geração de imagens Recraft V3, de uma empresa de IA britânica. Este modelo, que chamou a atenção sob o pseudônimo red_panda, possui poderosas capacidades de geração de imagens a partir de textos longos. Seus recursos de controle de layout e estilo de texto permitem que os usuários criem efeitos visuais de qualidade profissional com precisão.
【AiBase destaca:】
🔍 Recraft V3 é o mais recente modelo de geração de imagens lançado pela startup de IA britânica Recraft AI, que chamou a atenção com o pseudônimo red_panda.
💡 O Recraft V3 lidera outros modelos no ranking Artificial Analysis com uma pontuação ELO de 1172, recebendo mais de 100.000 votos.
🚀 O Recraft V3 possui poderosas capacidades de geração de imagens a partir de textos longos, com recursos aprimorados de controle de layout e estilo de texto, sendo particularmente adequado para marketing de marca, marketing e design gráfico complexo.
Link para mais detalhes: https://www.recraft.ai/
3、OpenAI anuncia o lançamento do modo de voz avançado do ChatGPT para Windows e Mac
A OpenAI anunciou hoje que o modo de voz avançado (AVM) do ChatGPT foi lançado oficialmente para Windows e Mac. Desenvolvido com base no modelo GPT-4o, ele oferece uma experiência de interação de conversa em tempo real mais natural. O feedback do usuário tem sido positivo, embora o acesso esteja temporariamente indisponível em algumas regiões. O sistema adicionou cinco novas opções de voz, com suporte para interrupções e pausas, atendendo à necessidade dos usuários de uma interação mais próxima da comunicação interpessoal. A precisão das respostas de IA é alta, com uma taxa de satisfação do usuário de 96%. O ChatGPT também lançou um recurso de pesquisa de histórico de bate-papo na versão web, continuando a avançar no campo da interação de voz, embora os resultados de marketing ainda estejam pendentes.
【AiBase destaca:】
🔊 O modo de voz avançado (AVM) do ChatGPT foi lançado oficialmente para Windows e Mac, oferecendo uma experiência de interação de conversa em tempo real mais natural.
🌐 O sistema adicionou cinco novas opções de voz, com suporte para interrupções e pausas, atendendo à necessidade dos usuários de uma interação mais próxima da comunicação interpessoal.
💬 O feedback do usuário tem sido positivo, com alta precisão nas respostas de IA e uma taxa de satisfação do usuário de 96%. O ChatGPT também lançou um recurso de pesquisa de histórico de bate-papo na versão web, continuando a avançar no campo da interação de voz.
4、Criado especificamente para IA da Apple! Apple anuncia o lançamento do chip M4Max
Os novos chips M4Pro e M4Max da Apple oferecem aos computadores Mac um aumento significativo de desempenho e recursos avançados. Esses chips utilizam um processo de fabricação avançado, otimizando o desempenho e a eficiência energética para oferecer um desempenho excepcional em tarefas profissionais e de IA.
【AiBase destaca:】
🚀 Os chips da série M4 utilizam o processo de fabricação de 3 nanômetros de segunda geração, melhorando o desempenho e a eficiência energética.
💻 Os chips M4Pro e M4Max oferecem suporte ao Thunderbolt 5 e aumento da largura de banda de memória unificada, proporcionando aos Macs recursos e velocidade ainda maiores.
🧠 Os chips M4, M4Pro e M4Max incluem um motor de rede neural e um acelerador de aprendizado de máquina, oferecendo aos usuários uma nova experiência inteligente.
5、OpenAI realiza atualização significativa na API em tempo real: além de uma redução de preço superior a 50%, são lançadas cinco novas vozes
A OpenAI atualizou recentemente sua API em tempo real, lançando cinco novas opções de voz, reduzindo as taxas de cache e oferecendo uma experiência de desenvolvimento mais econômica. As novas vozes incluem Ash, Verse e Ballad, com estilo britânico, que são vibrantes e ajustáveis, oferecendo uma experiência de comunicação mais natural. No entanto, a API em tempo real ainda está em fase de teste, não oferecendo autenticação do cliente, e as condições da rede afetam a confiabilidade do processamento de áudio. Os desenvolvedores podem atrair mais usuários por meio da redução de preços e dos recursos de cache.
【AiBase destaca:】
🌟 Cinco novas vozes naturais adicionadas, melhorando a experiência do aplicativo de voz.
💰 A API em tempo real reduz as taxas de entrada por meio do cache, tornando-a mais acessível para os desenvolvedores.
⚡ O processamento de áudio em tempo real é afetado pelas condições da rede, sendo necessário observar a confiabilidade.
6、Tecnologia de ponta em Hollywood! Wonder Dynamics lança recurso de conversão de vídeo para 3D
A Wonder Dynamics lançou a versão beta de sua ferramenta de IA revolucionária, Wonder Animation, que utiliza inteligência artificial para redefinir o processo de produção de filmes. Essa tecnologia permite que os criadores convertam facilmente materiais em cenas de animação 3D com personagens CG, permitindo a edição completa de cenas virtuais.
【AiBase destaca:】
✨ Os criadores podem usar qualquer câmera, em qualquer local, e converter em cenas de animação 3D por meio de IA.
🎬 Capacidade de reconstrução de cena poderosa, reproduzindo com precisão a relação e a trajetória de movimento da câmera, personagens e ambiente.
🚀 Permite que os artistas mantenham o controle criativo, facilitando a produção de filmes totalmente animados.
Link para mais detalhes: https://top.aibase.com/tool/wonder-dynamics
7、Google realiza atualização significativa na tecnologia de voz com IA: 2 minutos de conversa gerados em 3 segundos, mudando completamente a forma de interação entre humanos e máquinas
A tecnologia de geração de voz recentemente lançada pelo Google mais uma vez estabeleceu um novo padrão na indústria. Essa tecnologia inovadora pode gerar conversas naturais de até 2 minutos em apenas 3 segundos, garantindo a coerência e a qualidade do som entre vários falantes. Essa tecnologia já está sendo usada em vários produtos do Google, mudando a forma como as pessoas interagem com assistentes digitais e ferramentas de IA em todo o mundo.
【AiBase destaca:】
✨ Codificador e decodificador de voz de alta eficiência, comprimindo áudio com baixa taxa de bits de 600 bits por segundo, mantendo uma saída de alta qualidade.
🔍 Arquitetura Transformer especializada, processando a estrutura hierárquica de informações, pré-treinada e ajustada em conjuntos de dados de conversas de alta qualidade.
🌐 Integração da tecnologia SynthID, adicionando marcas d'água ao conteúdo de áudio gerado por IA, garantindo o uso responsável da tecnologia.
Link para mais detalhes: https://deepmind.google/discover/blog/pushing-the-frontiers-of-audio-generation/
8、A Mianbi Intelligence e a Baidu Intelligent Cloud firmam parceria
A Mianbi Intelligence e a Baidu Intelligent Cloud anunciaram uma parceria estratégica para desenvolver conjuntamente soluções de colaboração entre nuvem e dispositivos para grandes modelos. A parceria melhorará o desempenho de grandes modelos em cenários de aplicação de dispositivos inteligentes e computação de borda, reduzindo os custos de inferência, aumentando a velocidade de resposta, melhorando a experiência do usuário e a eficiência operacional. A Mianbi Intelligence lançou o MiniCPM3.0 e o MiniCPM-V2.6, superando a série GPT, chamando a atenção nacional e internacional.
【AiBase destaca:】
🤝 Parceria para desenvolver conjuntamente soluções de colaboração entre nuvem e dispositivos para grandes modelos, melhorando o desempenho do modelo, reduzindo custos e aumentando a velocidade de resposta.
🚀 Lançamento do MiniCPM3.0, um modelo com 4 bilhões de parâmetros, superando o GPT-3.5 em várias áreas.
💡 Lançamento do MiniCPM-V2.6, totalmente alinhado com o nível GPT-4V, com capacidade de compreensão de vídeo em tempo real e imagens múltiplas, chamando a atenção nacional e internacional.
9、Fim de 19 anos de prejuízo! CEO do Reddit agradece à IA por ajudar o site a lucrar pela primeira vez
Após 19 anos de prejuízo, o Reddit finalmente obteve lucro após sua oferta pública inicial. A receita líquida do terceiro trimestre atingiu US$ 29,9 milhões, com uma receita de US$ 34,84 bilhões, um aumento de 68% em relação ao ano anterior. O CEO Huffman disse que a inteligência artificial foi fundamental para atingir a lucratividade. Os planos futuros incluem acelerar o roteiro do produto e melhorar a experiência de pesquisa do usuário.
【AiBase destaca:】
🌟 O Reddit obtém lucro pela primeira vez, com uma receita líquida de US$ 29,9 milhões no terceiro trimestre.
📈 Crescimento significativo de usuários, com 97 milhões de usuários ativos diários, ultrapassando várias vezes os 100 milhões.
🤖 A inteligência artificial ajuda a expandir os recursos de tradução, com previsão de cobertura de 30 países até 2025.
10、Novo robô Atlas da Boston Dynamics: totalmente elétrico, totalmente autônomo, conclui tarefas complexas com sucesso
A Boston Dynamics lançou um vídeo impressionante do Atlas, sua nova geração de robôs humanoides, mostrando sua capacidade de concluir tarefas de classificação independentemente em um ambiente de fábrica simulado. O vídeo destaca o uso de aprendizado de máquina e sensores atualizados pelo Atlas para fornecer feedback e ajustes em tempo real, demonstrando sua capacidade de trabalho totalmente autônomo.
【AiBase destaca:】
🤖 A Boston Dynamics apresenta o robô Atlas totalmente elétrico, capaz de concluir tarefas de classificação complexas de forma independente.
🔧 O Atlas utiliza aprendizado de máquina e sensores atualizados para fornecer feedback e ajustes em tempo real.
💡 Uma marca d'água "totalmente autônomo" é exibida no vídeo, destacando sua capacidade de trabalho com mínima intervenção humana.
11、Universidade Tsinghua lança plataforma inovadora de simulação de fonte sonora SonicSim
Uma equipe de pesquisa da Universidade Tsinghua lançou a plataforma de simulação de fonte sonora móvel SonicSim, resolvendo o problema da falta de dados em cenários de fontes sonoras móveis no campo do processamento de voz. Essa plataforma simula ambientes acústicos reais, fornecendo suporte de dados de alta qualidade para modelos de separação e aprimoramento de voz. O SonicSim resolveu efetivamente o problema de os conjuntos de dados existentes não atenderem às necessidades de cenários de fontes sonoras móveis.
【AiBase destaca:】
🔊 A plataforma SonicSim é construída com base no Habitat-sim, simulando ambientes acústicos reais.
🎙 O conjunto de dados SonicSet usa dados de fontes sonoras móveis em vários cenários, garantindo a autenticidade e a diversidade dos dados.
🚀 Os modelos treinados no conjunto de dados SonicSet alcançam um desempenho superior, demonstrando que o SonicSim simula efetivamente ambientes acústicos reais.
Link para mais detalhes: https://arxiv.org/pdf/2410.01481
12、Baichuan Intelligence lança solução completa para ajudar empresas a implantar modelos de forma privada com o menor custo possível
A Baichuan Intelligence Technology lançou uma solução completa para ajudar as empresas a implantar grandes modelos de forma privada com baixo custo e alta eficiência. Essa solução inclui dados de treinamento universal de alta qualidade em toda a cadeia, os modelos Baichuan4-Turbo e Baichuan4-Air, e uma cadeia completa de ferramentas de aprimoramento de domínio, atendendo às necessidades das empresas em diferentes cenários.
【AiBase destaca:】