Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os destaques do campo da IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.

Novos produtos de IA Saiba mais: https://top.aibase.com/

1. OpenAI lança recursos de compartilhamento de tela e bate-papo por vídeo, ChatGPT ganha um "modo Papai Noel"

A OpenAI adicionou recentemente recursos de bate-papo por vídeo e compartilhamento de tela ao seu modo de voz premium, permitindo que os usuários interajam em tempo real com o ChatGPT em aplicativos móveis. Este recurso está atualmente disponível para usuários do ChatGPT Teams, Plus e Pro, e espera-se que seja expandido para usuários corporativos e educacionais em janeiro próximo. Embora usuários na União Europeia e em alguns outros países não possam usar o recurso, seu lançamento marca um grande avanço na interatividade e utilidade do ChatGPT.

image.png

【AiBase destaca:】

🎥 Novo recurso de bate-papo por vídeo, o ChatGPT pode responder em tempo real ao que o usuário vê.

🖥️ Recurso de compartilhamento de tela lançado, os usuários podem solicitar ajuda do ChatGPT em seus celulares.

🎅 Modo "Papai Noel" lançado, os usuários podem interagir com um ChatGPT que imita a voz do Papai Noel.

2. Incrível! O modelo mais rápido da Anthropic, Claude3.5Haiku, agora está totalmente aberto

A Anthropic lançou seu mais recente modelo, o Claude3.5Haiku, que agora está disponível para todos os usuários. Este modelo recebeu muita atenção por sua eficiência e excelente desempenho em testes de referência, sendo especialmente adequado para tarefas em tempo real e processamento de grandes conjuntos de dados. Embora existam algumas limitações de recursos, como a falta de suporte para navegação na web e geração de imagens, sua versatilidade em chatbots e integração com Claude Artifacts melhoraram a experiência do usuário.

image.png

【AiBase destaca:】

🌟 Claude3.5Haiku agora está totalmente aberto, com suporte para análise de imagens e arquivos.

💰 A versão gratuita tem limite de mensagens, os usuários podem optar por uma assinatura Claude Pro de US$ 20 para obter mais permissões.

📈 Este modelo apresentou desempenho superior em vários testes de referência, sendo adequado para tarefas em tempo real e processamento de grandes conjuntos de dados.

3. Laboratório de IA de Xangai lança o método de "identificação de impressão digital" de modelos grandes "REEF" para combater o comportamento de "casca"

Na era da IA, proteger a propriedade intelectual de grandes modelos de linguagem (LLM) é especialmente importante. O método REEF proposto pelo Laboratório de Inteligência Artificial de Xangai, por meio da representação de características para identificação de impressão digital do modelo, pode identificar efetivamente modelos de "casca" sem afetar o desempenho do modelo. A robustez e a garantia teórica do REEF o tornam eficaz mesmo diante de vários ajustes finos e modificações, fornecendo novas ferramentas para combater o uso não autorizado.

image.png

【AiBase destaca:】

🔍 REEF é um método de identificação de impressão digital de modelo baseado em representação de características, não depende da representação de camadas específicas e possui forte robustez.

💡 Este método identifica modelos de "casca" potenciais comparando a semelhança de alinhamento de núcleo central (CKA) da representação de características dos modelos nas mesmas amostras.

📈 Os resultados experimentais mostram que o REEF supera os métodos existentes na identificação de modelos de "casca", fornecendo novas ferramentas para proteger a propriedade intelectual do LLM.

Link para detalhes: https://arxiv.org/pdf/2410.14273

4. Substituto do Runway Act one! HelloMeme torna a criação de vídeos de memes mais fácil!

HelloMeme é uma ferramenta inovadora que visa simplificar o processo de criação de vídeos de memes. Ao otimizar o mecanismo de atenção, o modelo pode capturar com mais precisão os detalhes de expressão e movimento. As três principais partes do HelloMeme trabalham juntas para melhorar a vivacidade e a clareza do vídeo, mantendo a compatibilidade com o modelo SD1.5.

image.png

【AiBase destaca:】

🎥 HelloMeme, através da otimização do mecanismo de atenção, aprimora a capacidade de criação de vídeos de memes e simplifica o processo.

🤖 Ele é composto por três partes: HMReferenceNet, HMControlNet e HMDenoisingNet, que trabalham juntas para gerar vídeos de alta qualidade.

💡 HelloMeme é compatível com o modelo SD1.5, mantendo os recursos do modelo original e ao mesmo tempo fornecendo novas capacidades, melhorando a qualidade do vídeo.

Link para detalhes: https://songkey.github.io/hellomeme/

5. Meta lança nova ferramenta de marca d'água Video Seal para combater vídeos deepfake gerados por IA!

A ferramenta Meta Video Seal, lançada pela Meta, visa adicionar marcas d'água quase imperceptíveis a vídeos gerados por IA para lidar com os desafios da tecnologia deepfake. A ferramenta não é apenas de código aberto, mas também pode ser integrada perfeitamente a softwares existentes, melhorando a proteção da originalidade do vídeo.

【AiBase destaca:】

🔍 A ferramenta Meta Video Seal da Meta pode adicionar marcas d'água a vídeos gerados por IA, resistindo à edição e à compressão.

📊 A ferramenta é de código aberto, destinada à integração com softwares existentes, e espera impulsionar o desenvolvimento de tecnologias de marca d'água no setor.

🏆 A Meta também lançará uma classificação pública para comparar diferentes métodos de marca d'água, promovendo a colaboração e a troca no setor.

6. CFO da OpenAI revela: o desenvolvimento de modelos de IA de próxima geração custará bilhões, aumento de custos!

O diretor financeiro da OpenAI revelou em Nova York que o custo de construir modelos de inteligência artificial mais avançados continuará aumentando significativamente no futuro, prevendo bilhões de dólares. Essa tendência reflete a dupla pressão do progresso tecnológico e da demanda de mercado, levando a empresa a aumentar seus investimentos em tecnologia de IA.

【AiBase destaca:】

💰 A OpenAI prevê que o custo de desenvolvimento de modelos de IA de próxima geração continuará aumentando significativamente, chegando a bilhões de dólares.

📈 A empresa está aumentando seus investimentos em sistemas de IA avançados, e os preços dos serviços podem aumentar no futuro.

🎥 O recém-lançado gerador de vídeo de IA Sora gerou uma resposta positiva, oferecendo mais possibilidades para criadores de conteúdo.

7. Google e Samsung unem forças! Novo headset de realidade mista e óculos de IA expostos, mirando o Apple Vision Pro

O headset de realidade mista e os óculos de IA inteligentes de próxima geração, lançados em conjunto pela Google e pela Samsung, demonstram plenamente sua ambição no campo da realidade mista. Esses dois dispositivos não apenas apresentam atualizações significativas de hardware, mas também integram profundamente o mais recente modelo de IA Gemini da Google, com a capacidade de entender as intenções do usuário e a memória de longo prazo, fornecendo serviços personalizados. Eles suportam várias maneiras de interação natural, tornando a experiência do usuário mais suave.

image.png

【AiBase destaca:】

🛠️ Os novos dispositivos suportam funções VR e AR, aplicando profundamente a tecnologia de IA, fornecendo serviços personalizados.

🗣️ Maneiras inovadoras de interação, suportando gestos, voz e movimentos oculares, melhorando a experiência do usuário.

📱 Baseado no sistema operacional Android XR, os aplicativos existentes são perfeitamente adaptáveis, reduzindo a barreira de entrada para desenvolvedores.

Link para detalhes: https://android-developers.googleblog.com/2024/12/introducing-android-xr-sdk-developer-preview.html

8. O "trunfo" da Google, TPU Trillium, está aberto! Desempenho em alta, eficiência de treinamento de modelos de IA atinge um novo recorde

O Trillium TPU, recém-lançado pela Google, agora está disponível para clientes do Google Cloud, e seu desempenho e eficiência significativamente aprimorados trouxeram novos avanços para o treinamento de modelos de IA. Por meio de uma arquitetura de hardware e software otimizada, o Trillium TPU alcançou melhorias significativas no desempenho de treinamento e inferência, impulsionando enormemente o desenvolvimento e a aplicação de soluções de IA.

image.png

【AiBase destaca:】

⚡ O desempenho de treinamento do Trillium TPU é 4 vezes maior, a taxa de transferência de inferência é 3 vezes maior e a eficiência energética é 67% maior.

💡 O Trillium TPU suporta treinamento de IA em larga escala, podendo alocar efetivamente a carga de trabalho e acelerar significativamente a velocidade de treinamento.

💰 O desempenho de treinamento por dólar é 2,5 vezes maior e o desempenho de inferência é 1,4 vezes maior, oferecendo uma excelente relação custo-benefício.

Link para detalhes: https://cloud.google.com/blog/products/compute/trillium-tpu-is-ga

9. Twelve Labs está desenvolvendo uma inteligência artificial capaz de analisar e pesquisar vídeos

Na era das mídias digitais, o crescimento do conteúdo de vídeo é impressionante, mas os métodos tradicionais de pesquisa e análise não conseguem atender às necessidades. O Twelve Labs, por meio da tecnologia de inteligência artificial, revolucionou a maneira como entendemos os vídeos, podendo analisar profundamente os movimentos, objetos e sons nos vídeos, fornecendo uma capacidade de pesquisa mais precisa.

image.png

【AiBase destaca:】

🔍 O modelo de IA do Twelve Labs consegue entender profundamente o conteúdo do vídeo, superando a pesquisa por palavras-chave tradicional.

🤖 A empresa concentra-se na compreensão de vídeo, fornecendo ferramentas de análise de vídeo personalizadas para vários cenários.

🌍 O Twelve Labs, além da inovação tecnológica, valoriza a ética, garantindo a imparcialidade e a inclusão do modelo de IA.

10. Comparação de salários entre xAI e OpenAI: a batalha pela aquisição de talentos entre Musk e Altman

Com o rápido desenvolvimento da indústria de inteligência artificial, a competição por talentos entre xAI e OpenAI está se intensificando. Musk acusou a OpenAI de atrair talentos com altos salários, colocando os concorrentes em desvantagem. A análise mostra que os salários da OpenAI são significativamente mais altos do que o padrão do setor, enquanto os salários da xAI também são competitivos.

image.png

【AiBase destaca:】

💰 A diferença salarial entre xAI e OpenAI é significativa, com os salários da OpenAI 87% acima do padrão do setor.

👥 A competição entre Musk e Altman está se intensificando, e a xAI já contratou vários ex-funcionários da OpenAI.

⚖️ Musk acusa a OpenAI de comportamento anticompetitivo, e ambas as partes estão competindo ferozmente pela aquisição de talentos.

11. O ex-chefe de algoritmos da OpenAI cria uma nova empresa, entrando no campo dos robôs de companhia inteligentes

De acordo com a mídia, Jiang Xu, o ex-chefe de algoritmos sênior da OpenAI, fundou uma nova empresa, "Liangyuan Xin Chuang", focando no desenvolvimento de robôs de companhia inteligentes corporificados. Como um importante contribuidor do GPT-4, Jiang Xu participou de vários projetos importantes em sua carreira na OpenAI e fundou a empresa após deixar a empresa em 2023.

【AiBase destaca:】

🤝 Liangyuan Xin Chuang concentra-se no desenvolvimento de robôs de companhia inteligentes corporificados, com o objetivo de melhorar a qualidade de vida dos usuários.

🌍 A empresa tem escritórios em Shenzhen e Singapura e está contratando ativamente para impulsionar o progresso do projeto.

🧠 Os robôs da Liangyuan Xin Chuang terão a capacidade de perceber, aprender e interagir com o ambiente, aplicáveis ​​a vários campos.

12. A Giant Network lança o grande modelo de geração de jogos sonoros "QianYing"

Na Conferência Anual da Indústria de Jogos da China de 2024, a Giant Network lançou o grande modelo de geração de jogos sonoros "QianYing", incluindo dois modelos principais, YingGame e YingSound, demonstrando a capacidade de gerar conteúdo de jogo por meio de descrições de texto. O modelo ainda está em desenvolvimento técnico e também lançou o "Plano de Criação Conjunta QianYing", com o objetivo de promover o desenvolvimento do campo "Jogo + IA".

【AiBase destaca:】

🎮 A Giant Network lança o grande modelo de geração de jogos sonoros "QianYing", promovendo a combinação de jogos e IA.

🔊 O modelo inclui YingGame e YingSound, suportando a geração de vídeos de jogos sonoros interativos.

🤝 Lançamento do "Plano de Criação Conjunta QianYing", acelerando a aplicação e a cooperação tecnológica da criação de jogos.