谷歌更新Gemini 2.5 Flash Lite，成为最快的专有模型

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Sep 28, 2025

近日，谷歌对其 Gemini 系列大型语言模型（LLM）进行了重要更新，尤其是 Gemini2.5Flash 和 Flash Lite，强调了速度和效率的提升。这些改进是在大版本发布之间持续进行的，充分展示了谷歌在 AI 领域不断进步的决心。

根据第三方分析机构 Artificial Analysis 的评估，Gemini2.5Flash Lite 已经成为其网站上 “最快的专有模型”，输出速度达到每秒887个输出 token，比上一版本提升了40%。尽管与 MBZUAI 和 G42AI 推出的新 K2Think 开源模型（每秒输出2，000个 token）相比仍有差距，但 Gemini2.5Flash Lite 的速度依然令人瞩目。

这两款新模型在输出质量和成本效率上都有显著提升，尤其是在 token 使用和响应速度方面。Gemini2.5Flash 在多步骤和自主工作流程处理能力上表现出色，其在 SWE-Bench Verified 基准测试中的得分提高到了54%。而 Flash Lite 则在遵循指令和多模态能力上也有改进，输出 token 减少了50%，这在高通量应用中降低了部署成本。

在独立基准测试中，Gemini2.5Flash 和 Flash Lite 的表现得到了进一步确认，前者在多个测试中的得分都有明显提升。为了便于开发者使用，谷歌还推出了新别名，便于整合最新版本的模型。

除了 LLM 的更新，谷歌还对 Gemini Live 进行了增强，这是一款专为语音应用设计的实时音频模型。新版本提高了函数调用的可靠性和自然对话的处理能力，开发者能够构建更响应迅速的语音助手，能够在动态环境中更好地与用户互动。用户可以通过新的预览版本直接使用更新后的 Gemini Live 模型。

谷歌的这次更新不仅提高了模型的性能和可用性，也为开发者提供了更多灵活性。未来，谷歌计划在 Gemini 系列中推出更多更新，以满足开发者不断变化的需求。

划重点:
🌟 Gemini2.5Flash Lite 成为最快的专有模型，输出速度达每秒887个 token。
🚀 新模型在输出质量和成本效率上显著提升，尤其是 Flash Lite 减少了50% 的输出 token。
🗣️ Gemini Live 的更新增强了语音助手的功能，提高了函数调用的准确性和自然对话的能力。

小型VLM黑马逆袭：Moondream 3.0仅2B激活参数，碾压GPT-5和Claude 4

Moondream3.0预览版以轻量高效的混合专家架构（总参9B，激活仅2B）引领视觉语言模型革新。它在复杂场景中表现卓越，多项基准测试超越GPT-5、Gemini和Claude4等主流模型。相比擅长验证码识别的2.0版，3.0版显著扩展了视觉推理能力，引发AI社区广泛关注。

从粗糙几何到逼真3D视频：VideoFrom3D重塑图形设计新纪元

VideoFrom3D框架革新3D图形设计，通过融合图像与视频扩散模型，从几何形状、相机路径和参考图生成逼真且风格统一的3D场景视频。无需依赖昂贵配对数据，简化流程，助力设计师高效探索创意、快速产出高质量成果。核心在于互补扩散模型的创新应用。

YouTube Music测试AI音乐主播功能：提供曲目故事和粉丝趣闻，正面迎战Spotify AI DJ

YouTube Music周五宣布测试AI音乐主播功能，可为用户提供音乐故事、粉丝趣闻和评论解说，直接回应Spotify两年前的AI DJ功能。Spotify的AI DJ已能提供精选音乐和AI语音评论。YouTube Music基于对话式AI实验，今年7月还推出了AI对话电台，用户可通过描述定制收听内容。

Anthropic 计划全球扩张：国际员工将翻倍，聚焦人工智能市场

人工智能初创公司Anthropic计划在2025年前大幅扩张国际团队，员工规模将扩大两倍，应用AI团队增至五倍。此举旨在增强海外市场竞争力，应对OpenAI、微软和谷歌的挑战。随着Claude系列模型需求激增，近80%使用量来自美国以外，韩国市场尤为突出，公司面临良好发展机遇。

AI新闻资讯

最新AI日报

AI 商用·开源产品库

AI 产品排行榜

AI产品提交

AI工具导航

模型库

大模型排行榜

模型供应商

模型服务提交

大模型选型对比

大模型费用计算器

大模型竞技场

MCP服务端

MCP客户端

MCP教程与实践

MCP排行榜

MCP服务提交

MCP实验场

MCP服务调试器

GEO 大模型推荐优化

GEO排名查询工具

模型个人电脑配置检测器

数据集合

智能文档识别解析

谷歌更新Gemini 2.5 Flash Lite，成为最快的专有模型

AIbase基地

本文来自AIbase日报

相关AI新闻推荐

小型VLM黑马逆袭：Moondream 3.0仅2B激活参数，碾压GPT-5和Claude 4

腾讯发布并开源新一代生图模型“HunyuanImage3.0”

Fedora 社区推出 AI 辅助贡献政策草案，征求意见中

从粗糙几何到逼真3D视频：VideoFrom3D重塑图形设计新纪元

日本游戏公司中超半数已采用 AI 技术，任天堂因版权顾虑保持谨慎

开源 AI 客户端 Cherry Studio 升级：v1.6.0 正式发布

YouTube Music测试AI音乐主播功能：提供曲目故事和粉丝趣闻，正面迎战Spotify AI DJ

AI初创公司Friend砸超百万美元投放地铁广告：CEO称"赌上全部身家"推广争议产品

苹果悄然研发ChatGPT式应用，Siri即将重大改版

Anthropic 计划全球扩张：国际员工将翻倍，聚焦人工智能市场

AI新闻资讯

最新AI日报

AI 商用·开源产品库

AI 产品排行榜

AI产品提交

AI工具导航

模型库

大模型排行榜

模型供应商

模型服务提交

大模型选型对比

大模型费用计算器

大模型竞技场

MCP服务端

MCP客户端

MCP教程与实践

MCP排行榜

MCP服务提交

MCP实验场

MCP服务调试器

GEO 大模型推荐优化

GEO排名查询工具

模型个人电脑配置检测器

数据集合

智能文档识别解析

谷歌更新Gemini 2.5 Flash Lite，成为最快的专有模型

AIbase基地

本文来自AIbase日报

相关AI新闻推荐

小型VLM黑马逆袭：Moondream 3.0仅2B激活参数，碾压GPT-5和Claude 4

腾讯发布并开源新一代生图模型“HunyuanImage3.0”

Fedora 社区推出 AI 辅助贡献政策草案，征求意见中

从粗糙几何到逼真3D视频：VideoFrom3D重塑图形设计新纪元

日本游戏公司中超半数已采用 AI 技术，任天堂因版权顾虑保持谨慎

​开源 AI 客户端 Cherry Studio 升级：v1.6.0 正式发布

YouTube Music测试AI音乐主播功能：提供曲目故事和粉丝趣闻，正面迎战Spotify AI DJ

AI初创公司Friend砸超百万美元投放地铁广告：CEO称"赌上全部身家"推广争议产品

苹果悄然研发ChatGPT式应用，Siri即将重大改版

Anthropic 计划全球扩张：国际员工将翻倍，聚焦人工智能市场

开源 AI 客户端 Cherry Studio 升级：v1.6.0 正式发布