Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais destaques do campo de IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.
Novos produtos de IA Clique para saber mais: https://top.aibase.com/
1、Lançamento do Novo Modelo de Vídeo XinYi 2.0: Suporta saída de 1080P60fps e até 4K
O recém-lançado modelo de vídeo XinYi 2.0 da XinYi Technology alcançou um grande avanço na área de criação de vídeo com IA, realizando a criação automatizada de todo o processo, reduzindo a barreira e o custo da criação de vídeo. A tecnologia integra algoritmos de IA avançados e tecnologia de aprendizado profundo, fornecendo uma função conveniente de ativação com um único clique. Também possui um modelo de roteiro autodesenvolvido, tecnologia de síntese de voz emocional e capacidade de geração automática de música de fundo.

【Resumo AiBase:】
⚙️ O novo modelo de vídeo XinYi 2.0 realiza a criação automatizada de todo o processo, reduzindo a barreira e o custo da criação de vídeo.
💡 A tecnologia integra algoritmos de IA avançados e tecnologia de aprendizado profundo, fornecendo uma função conveniente de ativação com um único clique.
🎬 O novo modelo de vídeo XinYi 2.0 possui um modelo de roteiro autodesenvolvido, tecnologia de síntese de voz emocional e capacidade de geração automática de música de fundo.
Link para detalhes: https://aigc.yizhentv.com/product/aiVideo
2、OpenAI lança recurso de ajuste fino do modelo GPT-4o, com 1 milhão de Tokens gratuitos por dia!
A OpenAI lançou o novo modelo multimodal de grande porte GPT-4o e permite que desenvolvedores terceirizados façam ajustes finos para atender às diferentes necessidades de aplicativos. Os desenvolvedores podem selecionar a versão do modelo no painel de ajuste fino por meio de uma operação simples e receber 1 milhão de Tokens gratuitos diariamente para ajuste fino. Ao mesmo tempo, a OpenAI se concentra na segurança e proteção de dados, garantindo que o modelo ajustado não abuse dos dados da empresa.

【Resumo AiBase:】
🌟 Lançamento do recurso de ajuste fino: os desenvolvedores podem ajustar o comportamento do modelo GPT-4o de acordo com suas necessidades.
💰 Grande distribuição de Tokens gratuitos: 1 milhão de Tokens são fornecidos diariamente para o ajuste fino do modelo, atraindo muitos desenvolvedores a participar.
🔒 Garantia de segurança de dados: a OpenAI valoriza a privacidade e a segurança de dados, garantindo que o modelo ajustado não utilize os dados de entrada e saída para treinar novamente.
Link para detalhes: https://platform.openai.com/finetune
3、Outra ferramenta de vídeo com IA chega com força! Hotshot pode gerar vídeos de até 10 segundos, sem marca d'água
Hotshot é um novo gerador de vídeo de texto para vídeo com IA que pode gerar vídeos de até 10 segundos e 720p, mostrando um grande potencial. Os usuários podem experimentar gratuitamente a versão de pré-visualização antecipada do modelo, mas a geração é limitada a dois vídeos sem marca d'água por dia. A equipe fundadora concluiu o treinamento do modelo em apenas quatro meses, usando 600 milhões de clipes de vídeo e milhares de GPUs. No futuro, espera-se que a geração completa de vídeos do YouTube com IA se torne comum, e os criadores terão mais controle.
【Resumo AiBase:】
🌟 O novo gerador de vídeo de texto para vídeo com IA lançado pelo Hotshot entrou na fase de "pré-visualização antecipada" pública, e os usuários podem experimentar gratuitamente.
🚀 O modelo foi treinado em apenas quatro meses usando 600 milhões de clipes de vídeo e milhares de GPUs, mostrando um grande potencial.
🎥 O fundador Sastry prevê que, dentro de um ano, a geração completa de vídeos do YouTube com IA se tornará comum, e os criadores terão mais controle.
Link para detalhes: https://top.aibase.com/tool/hotshot
4、Atualização do LivePortrait: Suporta animação de retrato dirigida por imagem e controle de área detalhada
A ferramenta Gradio do LivePortrait recebeu uma série de atualizações emocionantes. Os usuários agora podem usar suas próprias imagens para dirigir a animação de retratos e podem selecionar precisamente a área de animação. Os recursos adicionados melhoraram a conveniência e a liberdade criativa da produção de animação, ao mesmo tempo em que protegem as informações de privacidade. A principal vantagem do LivePortrait é sua impressionante tecnologia de transferência de expressão facial, capaz de criar efeitos dinâmicos realistas.

【Resumo AiBase:】
🚀 Os usuários podem usar suas próprias imagens para dirigir a animação de retratos e selecionar precisamente a área de animação.
🎭 O recurso de movimento relativo adicionado protege a privacidade, mas pode afetar a intensidade da expressão.
💡 O LivePortrait pode copiar precisamente expressões para outra pessoa, fornecendo uma liberdade criativa sem precedentes.
Link para detalhes: https://top.aibase.com/tool/liveportrait
5、Ferramenta de edição de imagem instantânea com IA TurboEdit: Uma frase muda a cor do cabelo, rejuvenesce e muda a roupa instantaneamente!
O TurboEdit é uma ferramenta de edição de imagem instantânea baseada em texto que permite aos usuários editar imagens rapidamente por meio de descrições de texto simples. A velocidade de edição é extremamente rápida, suportando feedback instantâneo e edição interativa, permitindo que os usuários vejam os efeitos de edição em tempo real. Seja um designer profissional ou um usuário comum, todos podem realizar facilmente suas ideias criativas por meio do TurboEdit.
【Resumo AiBase:】
✨ Basta uma frase descritiva para editar rapidamente imagens, alcançando efeitos instantâneos de mudança de cor de cabelo, rejuvenescimento e mudança de roupa.
💡 O TurboEdit pode modificar apenas partes específicas enquanto mantém a imagem geral inalterada, permitindo que os usuários ajustem livremente qualquer área da imagem.
🚀 O TurboEdit suporta a modificação simultânea de vários atributos da imagem, incluindo cor, vestuário e estilo, permitindo que a criatividade se estenda infinitamente.
Link para detalhes: https://betterze.github.io/TurboEdit/
6、Viggle, o Rei da Dança com IA: Faça Musk e Trump dançarem juntos com um clique, com mais de 6,8 milhões de acessos mensais
Musk mais uma vez mostrou seu status de rei do tráfego na internet, com um vídeo publicado por meio da ferramenta Viggle AI que explodiu na web, com visualizações rapidamente ultrapassando 130 milhões. A ferramenta de geração de vídeo com IA baseada em modelos da Viggle AI é simples e poderosa, permitindo que usuários comuns criem vídeos de nível profissional. Com mais de 6,8 milhões de acessos mensais, demonstra um marco no uso da tecnologia de IA na vida cotidiana.

【Resumo AiBase:】
🌟 O Viggle AI permite que os usuários gerem facilmente vídeos de dança fluidos e naturais simplesmente carregando fotos e selecionando modelos de ação.
🚀 O recurso Multi de controle de múltiplos personagens permite que os usuários controlem dois personagens simultaneamente, inspirando a criatividade dos usuários e a rápida disseminação de vídeos de criação secundária.
💡 A operação baseada em modelos do Viggle AI reduz a barreira à criação, permitindo que usuários comuns criem vídeos de nível profissional, semelhante ao sucesso do CapCut e do CapCut.
Entrada do produto: https://top.aibase.com/tool/viggle
7、Criado para raciocínio visual complexo! Microsoft lança Phi-3.5-vision
A Microsoft lançou recentemente o Phi-3.5-vision, um modelo de IA leve e multimodal de código aberto, projetado para lidar com entradas de texto e visuais. O Phi-3.5-vision tem um desempenho excelente em ambientes com recursos limitados, suporta comprimento de contexto de 128K e é adequado para os campos comercial e de pesquisa. O modelo possui amplas funções de compreensão de imagens, OCR, análise de gráficos e tabelas, mostrando um aumento significativo no desempenho nos testes de referência.

【Resumo AiBase:】
🔍 O Phi-3.5-vision é um modelo de IA leve e multimodal adequado para lidar com entradas de texto e visuais.
💡 O modelo suporta comprimento de contexto de 128K e tem um desempenho excelente em ambientes com recursos de memória ou computação limitados.
🚀 O Phi-3.5-vision possui funções de compreensão de imagens, OCR, análise de gráficos e tabelas, mostrando um aumento significativo no desempenho.
Link para detalhes: https://huggingface.co/microsoft/Phi-3.5-vision-instruct
8、Modelo de reconhecimento de fala automático da ByteDance Seed-ASR, entende todos os tipos de sotaques e dialetos!
O Seed-ASR é um mecanismo de reconhecimento de fala lançado pela ByteDance. Treinado com uma grande quantidade de dados, ele possui excelente capacidade de reconhecimento e percepção de contexto, podendo reconhecer com precisão várias línguas, dialetos e sotaques, trazendo novas possibilidades para a comunicação entre idiomas. Ele tem um excelente desempenho em vários cenários, melhorando a experiência do usuário, especialmente nos campos de assistentes inteligentes e pesquisa por voz.
【Resumo AiBase:】
🔍 O Seed-ASR foi treinado com mais de 20 milhões de horas de dados de fala e 900.000 horas de dados emparelhados, podendo reconhecer com precisão 13 dialetos chineses e 7 idiomas estrangeiros, incluindo inglês com vários sotaques.
🔑 O Seed-ASR possui excelente capacidade de percepção de contexto, combinando registros de conversas anteriores e atas de reuniões para melhorar a precisão do reconhecimento, especialmente em cenários específicos.
🎯 O Seed-ASR pode reconhecer termos técnicos de vários campos profissionais, incluindo medicina, tecnologia, automóveis e música, melhorando significativamente a eficiência e a precisão de assistentes inteligentes e pesquisa por voz.
Link para detalhes: https://bytedancespeech.github.io/seedasr_tech_report/
9、Versão compactada do Llama3! Nvidia lança o modelo de linguagem pequeno Llama-3.1-Minitron4B com apenas 400 milhões de parâmetros
Na era em que as empresas de tecnologia buscam realizar a inteligência artificial, a Nvidia lançou o Llama-3.1-Minitron4B, usando técnicas de poda e destilação, com alto desempenho e eficiência de treinamento e implantação.

【Resumo AiBase:】
🌟 O Llama-3.1-Minitron4B é um modelo de linguagem pequeno lançado pela Nvidia, com treinamento e implantação eficientes.
📈 A quantidade de tokens usados foi reduzida em 40 vezes, com um aumento significativo no desempenho.
🔓 A versão de poda de largura já foi lançada no Hugging Face, facilitando o uso e desenvolvimento comercial.
Link para detalhes: https://developer.nvidia.com/blog/how-to-prune-and-distill-llama-3-1-8b-to-an-nvidia-llama-3-1-minitron-4b-model/
10、OpenAI e Condé Nast firmam parceria de conteúdo de longo prazo
Recentemente, a OpenAI e a Condé Nast firmaram um acordo de parceria de longo prazo para explorar a apresentação do conteúdo das marcas da Condé Nast em produtos de inteligência artificial. Essa parceria marca uma estreita colaboração entre os campos de conteúdo digital e inteligência artificial, proporcionando aos usuários uma experiência de pesquisa mais rica e relatórios de alta qualidade.
【Resumo AiBase:】
🌟 A OpenAI e a Condé Nast firmaram uma parceria de longo prazo, e o conteúdo será integrado aos produtos de IA.
📰 A OpenAI obteve uma grande quantidade de arquivos de texto de editoras para treinar modelos de linguagem grandes.
⚖️ Algumas empresas de mídia estão optando por processar a OpenAI para proteger seus direitos.
11、Repressão a avaliações falsas com IA! O governo dos EUA toma medidas enérgicas, proibindo comentários falsos gerados por IA
Recentemente, a Comissão Federal de Comércio (FTC) dos EUA tomou uma medida importante, proibindo totalmente comentários e recomendações falsos gerados por IA. Essa nova regulamentação visa combater comportamentos desonestos em comentários online, proteger os direitos do consumidor e manter um ambiente de mercado de concorrência justa. A presidente da FTC, Lina Khan, disse que comentários falsos desperdiçam tempo e dinheiro, poluem o mercado e desviam a atenção dos concorrentes honestos. O presidente Biden apoiou essa medida, enfatizando que os consumidores devem confiar nas avaliações dos clientes.




