Recentemente, a Google realizou uma atualização importante para sua série de modelos de linguagem grande (LLM) Gemini, especialmente o Gemini 2.5 Flash e o Flash Lite, destacando melhorias nas velocidades e eficiência. Essas melhorias estão sendo feitas continuamente entre as grandes versões, demonstrando claramente a determinação da Google em continuar avançando no campo da IA.
De acordo com a avaliação da instituição de análise terceirizada Artificial Analysis, o Gemini 2.5 Flash Lite tornou-se "o modelo proprietário mais rápido" em seu site, com uma velocidade de saída de 887 tokens por segundo, um aumento de 40% em relação à versão anterior. Embora ainda haja uma diferença em comparação com o novo modelo de código aberto K2Think lançado pela MBZUAI e pela G42AI (que produz 2.000 tokens por segundo), a velocidade do Gemini 2.5 Flash Lite continua impressionante.
Esses dois novos modelos apresentam melhorias significativas na qualidade da saída e na eficiência de custo, especialmente no uso de tokens e na velocidade de resposta. O Gemini 2.5 Flash se destaca na capacidade de lidar com fluxos de trabalho multistep e autônomos, obtendo uma pontuação de 54% no benchmark SWE-Bench Verified. Já o Flash Lite melhora na capacidade de seguir instruções e multimodalidade, reduzindo em 50% os tokens de saída, o que diminui os custos de implantação em aplicações de alto volume.
Na avaliação independente, o desempenho do Gemini 2.5 Flash e do Flash Lite foi confirmado adicionalmente, com melhorias significativas em vários testes. Para facilitar o uso pelos desenvolvedores, a Google também lançou novos apelidos, facilitando a integração das versões mais recentes dos modelos.
Além das atualizações nos LLMs, a Google também aprimorou o Gemini Live, um modelo de áudio em tempo real projetado especificamente para aplicações de voz. A nova versão aumentou a confiabilidade das chamadas de função e a capacidade de processamento de conversas naturais, permitindo que os desenvolvedores construam assistentes de voz mais responsivos, capazes de interagir melhor com os usuários em ambientes dinâmicos. Os usuários podem usar diretamente o modelo atualizado do Gemini Live por meio da nova versão de visualização.
Essa atualização da Google não apenas melhorou o desempenho e a utilidade dos modelos, mas também forneceu aos desenvolvedores mais flexibilidade. No futuro, a Google planeja lançar mais atualizações na série Gemini para atender às crescentes necessidades dos desenvolvedores.
Destaque:
🌟 O Gemini 2.5 Flash Lite tornou-se o modelo proprietário mais rápido, com uma velocidade de saída de 887 tokens por segundo.
🚀 Os novos modelos apresentam melhorias significativas na qualidade da saída e na eficiência de custo, especialmente o Flash Lite, que reduziu em 50% os tokens de saída.
🗣️ As atualizações no Gemini Live aprimoraram as funcionalidades dos assistentes de voz, aumentando a precisão das chamadas de função e a capacidade de conversas naturais.