Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais destaques do campo da IA, com foco em desenvolvedores, ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.
Novos produtos de IA Clique para saber mais: https://top.aibase.com/
1、O rei do vídeo de IA está de volta! O novo modelo Gen3 da Runway impressiona novamente os usuários
Este artigo apresenta o Gen-3Alpha, o novo modelo de geração de vídeo da Runway. Este modelo apresenta melhorias significativas na fidelidade, consistência e representação de movimento, representando um passo importante na construção de modelos de mundo genéricos. O Gen-3Alpha possui várias funções e características notáveis, tornando-se uma estrela na indústria criativa.
【Resumo do AiBase:】
⭐️ O Gen-3Alpha apresenta melhorias significativas na fidelidade, consistência e representação de movimento, capaz de gerar personagens humanos realistas e expressivos.
⭐️ O Gen-3Alpha suporta várias ferramentas de geração, como ferramentas de texto para vídeo, imagem para vídeo e texto para imagem.
⭐️ Permite controle de tempo preciso, suportando vários modos de controle avançados, incluindo pincel de movimento, controle de câmera avançado e modo de direção.
⭐️ Iluminação extremamente estável, mantendo uma saída de alta qualidade mesmo em cenas de movimento rápido.
Mais vídeos aqui: https://mp.weixin.qq.com/s/5LbM0NfkeiYFU0r4VDqpYA
Endereço do site: https://top.aibase.com/tool/gen-3-alpha
2、A Luma AI lançou a função Extend, estendendo a duração do vídeo para mais de 10 segundos
A Luma AI atualizou recentemente seu modelo de vídeo Dream Machine, adicionando a função Extend, que pode estender a duração do vídeo para mais de 10 segundos, mantendo o estilo e os objetos originais do vídeo. Embora a função Extend leve mais tempo para gerar vídeos estendidos, a consistência do estilo é bem mantida.
【Resumo do AiBase:】
✨ O Dream Machine atualizado lançou a função Extend, permitindo que a duração do vídeo atinja mais de 10 segundos, mantendo o estilo e os objetos originais do vídeo.
⏱️ O uso da função Extend para estender vídeos leva mais tempo, mas a consistência do estilo é boa.
🔗 Detalhes: https://www.chinaz.com/ainews/9639.shtml
3、A DeepSeek lançou o modelo de código aberto DeepSeek-Coder-V2
A DeepSeek lançou recentemente o modelo de código aberto DeepSeek-Coder-V2, que supera o GPT-4-Turbo em capacidade de código e matemática, com desempenho líder mundial. O modelo usa a arquitetura MoE, suporta vários idiomas e comprimentos de contexto mais longos. Os usuários podem usá-lo comercialmente gratuitamente, sem necessidade de inscrição.
【Resumo do AiBase:】
🚀 Desempenho líder mundial, especialmente em geração de código e aritmética matemática.
💡 Suporta 338 linguagens de programação e comprimento de contexto de 128K, atendendo a mais necessidades de desenvolvimento.
🔗 Oferece serviço de API, com preço consistente com o DeepSeek-V2, com excelente desempenho em testes de referência.
Link para detalhes: https://top.aibase.com/tool/deepseek-coder-v2
4、O Adobe Acrobat recebe uma grande atualização de IA, suportando análise de vários documentos e geração de imagens
A Adobe está prestes a lançar uma série de atualizações importantes de IA, melhorando os recursos do assistente de IA do Acrobat, a capacidade de geração de imagens e garantindo a proteção da privacidade dos dados. Esta atualização aumentará significativamente a eficiência do escritório, facilitando o processamento de grandes quantidades de documentos e a otimização do conteúdo visual.
【Resumo do AiBase:】
🚀 Função de assistente de IA aprimorada, suportando análise e consulta de vários documentos, melhorando a experiência do usuário.
🖼️ Gerador de imagens de IA adicionado, permitindo que os usuários gerem novas imagens ou editem imagens existentes em PDFs.
🔒 Compromisso de proteção de privacidade de dados, documentos são carregados para análise na nuvem, mas não são usados para treinar modelos de IA, e o uso por terceiros é proibido.
5、A Apple lança 20 modelos Core ML no Hugging Face
A Apple lançou 20 novos modelos Core ML e 4 conjuntos de dados na plataforma Hugging Face, mostrando seu progresso significativo na promoção do desenvolvimento da IA. Esta atualização inclui não apenas novos modelos emocionantes focados em texto e imagem, mas também uma ampla gama de aplicativos, como classificação de imagens, estimativa de profundidade monocromática e segmentação semântica. A Apple destaca a importância da IA de dispositivo, melhorando o desempenho do aplicativo executando modelos otimizados nos dispositivos dos usuários, ao mesmo tempo em que garante a segurança e a privacidade dos dados do usuário.
【Resumo do AiBase:】
🚀 A Apple lançou 20 novos modelos Core ML e 4 conjuntos de dados na plataforma Hugging Face, promovendo o desenvolvimento da IA.
💡 Os novos modelos Core ML lançados abrangem uma ampla gama de aplicativos, incluindo classificação de imagens, estimativa de profundidade monocromática e segmentação semântica.
🔒 A Apple destaca a importância da IA de dispositivo, modelos otimizados são executados nos dispositivos dos usuários, melhorando o desempenho do aplicativo e garantindo a segurança e a privacidade dos dados do usuário.
Link para detalhes: https://huggingface.co/apple
6、O ElevenLabs lança ferramenta de efeitos sonoros de geração de vídeo de código aberto, permitindo a dublagem automática de vídeos carregados
O ElevenLabs, uma empresa focada em tecnologia de geração de áudio, anunciou recentemente sua entrada no campo da geração de vídeo, lançando um projeto de código aberto que pode dublar automaticamente vídeos carregados, gerando efeitos sonoros apropriados. Eles lançaram um novo recurso que permite aos usuários gerar vários efeitos sonoros realistas inserindo texto, beneficiando enormemente os setores de cinema, jogos e vídeos curtos. Além da geração de efeitos sonoros, ele também fornece recursos poderosos como clonagem de voz e conversão de texto em fala.
【Resumo do AiBase:】
🔊 Dublagem automática de vídeos carregados, gerando efeitos sonoros apropriados.
🎶 Gera vários efeitos sonoros realistas inserindo texto, ajudando os setores de cinema, jogos e vídeos curtos.
🎤 Fornece recursos de clonagem de voz e conversão de texto em fala, dando às informações uma forma de expressão mais vívida.
Entrada de conversão de texto em áudio: https://top.aibase.com/tool/elevenlabs-wenbenzhuanyinxiaoapi
Entrada de dublagem automática de vídeo: https://top.aibase.com/tool/elevenlabs-texts-to-sounds-effects-api
7、O Tencent WeChat Video Number pretende restringir a venda de produtos por influenciadores digitais
O Tencent Video Number anunciou recentemente uma revisão das "Regras para a Publicação de Conteúdo de Baixa Qualidade por Influenciadores de Vitrine de Vídeo Number", com o objetivo de fortalecer a supervisão da qualidade do conteúdo e pretende proibir a venda de produtos por influenciadores digitais ao vivo. Esta revisão foi aberta para coleta de opiniões do público de 7 de junho a 13 de junho deste ano.
【Resumo do AiBase:】
⭐ As regras revisadas visam fortalecer a supervisão da qualidade do conteúdo do Video Number.
⭐ Proíbe a venda de produtos por influenciadores digitais ao vivo, proibindo explicitamente o conteúdo de transmissão ao vivo não real.
⭐ A plataforma tomará medidas punitivas contra os infratores.
Detalhes: https://www.chinaz.com/2024/0618/1624007.shtml
8、O SD3 da Stability AI enfrenta oposição devido a problemas de licenciamento, a comunidade CivitAI bloqueia conteúdo relacionado
O SD3, o último grande modelo lançado pela Stability AI, causou controvérsia devido a problemas de licenciamento e enfrenta oposição da comunidade de IA. A comunidade CivitAI bloqueou conteúdo relacionado ao SD3, levando a disputas sobre o contrato de licença. A empresa lançou uma licença de criador voltada para o consumidor, restringindo as condições dos desenvolvedores e o número de imagens geradas. O SD3 tem problemas como a incapacidade de gerar certas poses corporais e seu futuro é incerto. A saída do CEO e as demissões exigem que a empresa explique o impacto do novo contrato de licença. Toda a controvérsia tem um impacto potencial na comunidade de IA e no desenvolvimento de modelos de código aberto.
【Resumo do AiBase:】
💥 Problemas de licenciamento do SD3 causam controvérsia e enfrentam oposição da comunidade de IA.
🔒 A empresa lançou uma licença de criador, restringindo as condições dos desenvolvedores e o número de imagens geradas.
❓ O SD3 tem problemas como a incapacidade de gerar certas poses corporais e seu futuro é incerto.
9、Impressora Lego Pixelbot 3000
Este artigo apresenta a impressora Lego Pixelbot 3000 projetada e fabricada pelo criador do canal do YouTube @Creative Mindstorms, que usa código personalizado e inteligência artificial para gerar mosaicos Lego. Os usuários precisam apenas inserir o nome da obra de arte, a IA gera a imagem e o Pixelbot 3000 monta automaticamente o mosaico.
【Resumo do AiBase:】
🤖 Usando código personalizado e inteligência artificial, o Pixelbot 3000 pode gerar automaticamente mosaicos Lego, simplificando o processo de impressão.
🎨 O Pixelbot 3000 usa o DALL-E3 da OpenAI para gerar imagens simplificadas em estilo cartoon, resultando em imagens em escala de alto contraste.
🔧 O Pixelbot 3000 divide a imagem gerada pela IA e amostra a cor do pixel central de cada quadrado para obter um melhor padrão de mosaico.
10、Pesquisadores ensinam a IA a reconhecer esboços de desenho a mão livre humanos
Este artigo apresenta um novo método desenvolvido por uma equipe de pesquisa da Universidade de Surrey e da Universidade de Stanford que ensina a inteligência artificial a entender a importância e os resultados dos esboços de desenho a mão livre humanos. Ao combinar esboços e descrições de texto, a inteligência artificial mostra uma capacidade de compreensão quase humana, identificando e rotulando com precisão objetos em cenários complexos. Esta pesquisa traz novas possibilidades para a interação humano-computador e os fluxos de trabalho de design.
【Resumo do AiBase:】
🧠 A inteligência artificial aprende a entender a importância dos esboços, mostrando um desempenho quase humano.
🌳 A inteligência artificial pode identificar e rotular objetos como pipas, árvores e girafas com 85% de precisão, superando outros modelos.
🎨 O novo método não se aplica apenas a esboços desenhados por não artistas, mas também a esboços de objetos sem treinamento específico.
Link para detalhes: https://arxiv.org/abs/2312.12463
11、Pesquisa: Imagens geradas por IA não conseguem representar com precisão as nuances da cultura arquitetônica islâmica
A inteligência artificial (IA) trouxe mudanças revolucionárias para o campo do design arquitetônico, mas em campos culturalmente sensíveis como a arquitetura islâmica, as imagens geradas por IA não conseguiram representar corretamente os elementos históricos. A pesquisa indica que os geradores de IA têm conhecimento histórico insuficiente e recomenda o uso cauteloso. Os autores acreditam que a IA pode ser uma ferramenta valiosa, mas deve ser combinada com conhecimento profissional humano e sensibilidade cultural.
【Resumo do AiBase:】
🏗️ A IA trouxe mudanças revolucionárias para o design arquitetônico, mas enfrenta desafios na arquitetura islâmica.
🕌 Os geradores de IA têm conhecimento histórico insuficiente e não conseguem representar com precisão os detalhes da cultura arquitetônica islâmica.
🤖 A IA deve ser usada como uma ferramenta para aprimorar a criatividade humana, combinada com conhecimento profissional e sensibilidade cultural.