Lançamento do ModernBERT, um Modelo de Linguagem de Nova Geração, Quatro Vezes Mais Rápido e com Menor Custo em Tarefas como RAG

AIbase基地

Publicado emNotícias e Informações de IA · 5 minutos de leitura · Dec 23, 2024

276

Recentemente, a Answer.AI e a LightOn lançaram em conjunto o modelo de linguagem de código aberto ModernBERT, uma atualização significativa do BERT do Google. De acordo com os desenvolvedores, o ModernBERT apresenta melhorias significativas em velocidade de processamento, eficiência e qualidade. O modelo é quatro vezes mais rápido que seu predecessor, utilizando menos memória.

O ModernBERT foi projetado para processar textos com até 8192 tokens, um aumento de 16 vezes em relação ao limite típico de 512 tokens dos modelos de codificação existentes. Além disso, o ModernBERT é o primeiro modelo de codificação de código de programação amplamente treinado, obtendo uma pontuação superior a 80 no conjunto de dados de perguntas e respostas do StackOverflow, estabelecendo um novo recorde para modelos de codificação.

Na avaliação de compreensão de linguagem geral (GLUE), o ModernBERT-Large atingiu o melhor equilíbrio entre velocidade e precisão, com um tempo de processamento de aproximadamente 20 milissegundos por token e uma pontuação de 90. A equipe de desenvolvimento descreve o ModernBERT como um Honda Civic afinado, destacando sua confiabilidade e eficiência em aplicações cotidianas.

Em comparação com modelos de linguagem grandes existentes, como o GPT-4, o ModernBERT reduz significativamente os custos no processamento de textos em larga escala. Enquanto o GPT-4 custa alguns centavos por consulta, o ModernBERT pode ser executado localmente, sendo mais rápido e econômico. Por exemplo, o projeto FineWeb Edu gastou US$ 60.000 usando o modelo BERT para filtrar 15 bilhões de tokens, enquanto mesmo com o decodificador Gemini Flash do Google, o custo ultrapassou US$ 1 milhão.

A equipe de desenvolvimento afirma que o ModernBERT é ideal para diversas aplicações práticas, incluindo sistemas de geração aprimorada por recuperação (RAG), busca de código e revisão de conteúdo. Diferentemente do GPT-4, que requer hardware especializado, o ModernBERT pode ser executado eficientemente em GPUs de jogos comuns para consumidores.

Atualmente, o ModernBERT está disponível em duas versões: um modelo básico com 139 milhões de parâmetros e um modelo grande com 395 milhões de parâmetros. Ambas as versões já foram lançadas no Hugging Face, e os usuários podem substituir seus modelos BERT existentes diretamente. A equipe de desenvolvimento planeja lançar versões maiores no próximo ano, mas não há planos para capacidades multimodais. Para promover o desenvolvimento de novos aplicativos, eles também lançaram uma competição, premiando os cinco melhores demonstradores com US$ 100 e uma assinatura profissional do Hugging Face por seis meses.

Desde o lançamento do BERT pelo Google em 2018, o modelo tem sido um dos modelos de linguagem mais populares, com mais de 68 milhões de downloads mensais no HuggingFace.

Acesso ao projeto: https://huggingface.co/blog/modernbert

Destaques:
🌟 O ModernBERT é quatro vezes mais rápido que o BERT e pode processar textos com até 8192 tokens.
💰 Em comparação com o GPT-4, o ModernBERT reduz significativamente os custos de processamento de texto em larga escala e é mais eficiente.
📊 O modelo é particularmente eficiente no processamento de código de programação, obtendo uma pontuação superior a 80 no conjunto de dados de perguntas e respostas do StackOverflow, estabelecendo um novo recorde.

ModernBERT Google BERT Answer.AI LightOn

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily

Notícias de IA Relacionadas Recomendadas

A Google DeepMind lança o modelo de inteligência artificial AlphaEarth Foundations, redefinindo a monitorização ambiental global

A DeepMind lançou o AlphaEarth, um sistema de IA que integra dados de satélites com resolução de 10x10m, reduzindo erros em 24% em monitoramento ambiental. Inclui 1,4 trilhão de dados e já é testado por 50 organizações.....

Aug 1, 2025

O Google lança o modelo de IA AlphaEarth, reduzindo o custo de observação da Terra para 1/16

O Google lançou o modelo de IA AlphaEarth Foundations, que revoluciona a observação da Terra por meio de tecnologia de satélites virtuais. O modelo integra diariamente dados de múltiplas fontes, como satélites e radares, dividindo a superfície terrestre em uma grade de 10 metros para monitoramento contínuo. Utiliza codificação de cores para apresentar visualmente propriedades como vegetação e superfície. Sua tecnologia inovadora de compressão reduz a demanda de armazenamento para 1/16, diminuindo significativamente os custos. Já foi aplicado em áreas como monitoramento de culturas e rastreamento de desmatamento, com desempenho excelente nas testes. Atualmente, o conjunto de dados está disponível no Google Earth Engine

Aug 1, 2025

Sua conversa com o ChatGPT pode ser exposta acidentalmente! Foi indexada pelos motores de busca como o Google

As conversas do ChatGPT compartilhadas pelos usuários podem ser indexadas pelos mecanismos de busca, causando vazamento de privacidade. Esses conteúdos públicos são variados, desde consultas cotidianas até perguntas estranhas. Embora as conversas sejam privadas por padrão, os links compartilhados ativamente tornam-se públicos. A OpenAI disse que é apenas uma função experimental e decidiu removê-la, comprometendo-se a melhorar a proteção da privacidade. Especialistas alertam que até mesmo compartilhamentos na internet considerados seguros podem apresentar riscos de vazamento de informações, e os usuários devem estar atentos.

Aug 1, 2025

Conversas de usuários do ChatGPT são expostas acidentalmente e indexadas por mecanismos de busca como o Google

Usuários descobriram que os links das conversas compartilhadas pelo ChatGPT foram indexados por mecanismos de busca, gerando preocupações com a privacidade. Esses links públicos contêm diversos conteúdos de conversas, desde consultas sobre reformas até perguntas estranhas. A OpenAI explicou que apenas as conversas compartilhadas ativamente pelos usuários ficaram visíveis, e que já encerraram essa função experimental para evitar vazamentos acidentais. Pontos-chave: 1) Links de compartilhamento foram indexados, expondo conversas privadas; 2) Conversas padrão são privadas; 3) A OpenAI encerrou essa funcionalidade.

Aug 1, 2025

Google assinará o Código de Conduta da Inteligência Artificial da União Europeia, demonstrando seu compromisso com a conformidade!

Google assinou o código de conduta da UE sobre IA, contrastando com a Meta. O código exige transparência e respeito aos direitos autorais. A lei de IA da UE entra em vigor em 2 de agosto, visando modelos de 'risco sistêmico'. Google apoia, mas teme impactos na competitividade.....

Jul 31, 2025

Jornal da IA: Yunque do Vulcão lança Dou Bao 3.0; Qwen3 de Tongyi é aberto ao público sem modelo de pensamento; Google atualiza discretamente o Imagen 4

1.Volcano Engine atualiza série DouBao: edição de imagem 3.0, tradução 2.0 com dialetos, modelo 1.6 melhorado. 2.Qwen3-30B da Tongyi rivaliza com GPT-4o. 3.OpenAI lança ChatGPT Study. 4.HYPIR restaura fotos antigas em 1.7s. 5.Google NotebookLM adiciona resumo de vídeos. 6.Imagen4 supera GPT-4o em custo-benefício. 7.Skywork UniPic da Kunlun é aberto. 8.Carro elétrico i8 usa modelo VLA. 9.Google lança busca com Gemini2.5 no Reino Unido. 10.Eigent p....

Jul 30, 2025

O Google lança um novo modo de busca com IA no Reino Unido para melhorar a experiência de resolução de questões complexas

O Google lança uma nova forma de busca com IA no Reino Unido, baseada no modelo Gemini 2.5, que suporta perguntas complexas e pode lidar com questões de múltiplas partes. A nova função utiliza tecnologia de expansão de consulta, dividindo as perguntas em subtemas para buscar em paralelo e fornecer respostas mais precisas. Suporta diferentes métodos de interação, como texto, voz e imagem, permitindo que os usuários enviem imagens ou perguntas por voz. O modo de IA avalia a confiabilidade das respostas e, quando a confiabilidade é baixa, muda para resultados de busca tradicionais. Essa função visa melhorar a profundidade e a eficiência da busca, além de promover a diversificação do tráfego dos sites. Atualmente está em otimização, e o Google incentiva os usuários a enviar comentários sobre a experiência de uso.

Jul 30, 2025

O Google atualiza silenciosamente o Imagen 4! O rei das gerações de imagens da IA retorna com força?

O Google atualizou o modelo de geração de imagens Imagen4, e o Imagen4Ultra subiu para o terceiro lugar na lista de classificação autoritária no mundo, com desempenho próximo ao GPT-4o e ao Seedream3.0. A nova versão apresenta melhorias significativas na qualidade das partes detalhadas das imagens, na realidade e na consistência do estilo, além de ser mais precisa na interpretação de instruções complexas. Com vantagem de preço, a versão padrão custa 40 dólares por mil imagens, enquanto a versão Ultra custa 60 dólares por mil imagens, muito abaixo dos 167 dólares do GPT-4o. A velocidade de geração é de 9,5 segundos por imagem, mais rápida que a do GPT-4o, mas ligeiramente mais lenta que a do Seedream3.

Jul 30, 2025

Google NotebookLM bietet Video-Zusammenfassungsfunktion und verbessert das Lernerlebnis

NotebookLM da Google lança novos recursos de resumo em vídeo, transformando informações complexas em slides narrados. Extrai automaticamente imagens e gráficos para criar vídeos temáticos. Atualização visual na aba 'Estúdio' e suporte apenas para inglês, com planos para mais idiomas.....

Jul 30, 2025

O Google Chrome lança avaliações de lojas com inteligência artificial para ajudar os consumidores norte-americanos na tomada de decisão de compra

O navegador Google Chrome lançou uma função de avaliações de lojas com inteligência artificial, que exibe informações sobre a reputação dos vendedores em aspectos como qualidade, preço e serviço por meio de um ícone na barra de endereços. Essa funcionalidade está disponível apenas em inglês no momento, agregando avaliações reais de oito plataformas como a Bazaarvoice, e inicialmente está disponível apenas para versões de desktop. Diante da concorrência de navegadores de IA como o Perplexity, o Google acelera a integração de IA e adicionou suporte a assistente de inteligência artificial para usuários do Gemini. Isso faz parte da estratégia do Google para melhorar a experiência de compra, incluindo recomendações de produtos e funcionalidades como provador virtual.

Jul 29, 2025

Product Finder

Product Submit

AI Models Finder

MCP Servers

MCP Client

MCP Inspector

Case Tutorials

Latest AI News

AI Daily Brief

Lançamento do ModernBERT, um Modelo de Linguagem de Nova Geração, Quatro Vezes Mais Rápido e com Menor Custo em Tarefas como RAG

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

A Google DeepMind lança o modelo de inteligência artificial AlphaEarth Foundations, redefinindo a monitorização ambiental global

O Google lança o modelo de IA AlphaEarth, reduzindo o custo de observação da Terra para 1/16

Sua conversa com o ChatGPT pode ser exposta acidentalmente! Foi indexada pelos motores de busca como o Google

Conversas de usuários do ChatGPT são expostas acidentalmente e indexadas por mecanismos de busca como o Google

Google assinará o Código de Conduta da Inteligência Artificial da União Europeia, demonstrando seu compromisso com a conformidade!

Jornal da IA: Yunque do Vulcão lança Dou Bao 3.0; Qwen3 de Tongyi é aberto ao público sem modelo de pensamento; Google atualiza discretamente o Imagen 4

O Google lança um novo modo de busca com IA no Reino Unido para melhorar a experiência de resolução de questões complexas

O Google atualiza silenciosamente o Imagen 4! O rei das gerações de imagens da IA retorna com força?

Google NotebookLM bietet Video-Zusammenfassungsfunktion und verbessert das Lernerlebnis

O Google Chrome lança avaliações de lojas com inteligência artificial para ajudar os consumidores norte-americanos na tomada de decisão de compra