谷歌宣布在Google TV上推出Gemini语音助手取代Google Assistant,这是其将Gemini整合到所有平台战略的关键一步。升级后,用户可通过更先进的AI能力以自然对话方式访问内容和功能,例如处理复杂跨情境查询,如推荐适合不同喜好的电影。
Google安全团队发现新型恶意软件PROMPTFLUX,能远程调用Gemini AI实时重写自身代码,动态生成恶意脚本,从而逃避安全检测。这种利用AI技术自我进化的特性使其具备极强的隐蔽性和威胁性。
Google推出Gemini API的“文件搜索工具”,作为全托管RAG系统,可将私有文件直接转化为知识库。用户无需处理数据分块、嵌入生成等步骤,通过API即可实现高效检索与生成。工具核心是端到端集成,自动完成文件上传、索引和检索流程。
谷歌Gemini系列AI模型迎来新进展,预览版"gemini-3-pro-preview-11-2025"在Vertex AI平台被发现,预计本月正式推出。该模型支持100万token超大上下文窗口,标识明确指向11月发布。Vertex AI作为谷歌云端AI开发核心工具,已在网络日志中暴露相关信息。
Google Gempix2是由Gemini 3驱动的图像编辑器,功能升级,输出高质量图像。
Google基于Gemini 3 Pro的AI图像编辑器,推理强,生成编辑能力出色
基于Google Gemini 2.5的图像生成与编辑工具,专业编辑简单易用。
由Google Gemini驱动,可实现AI图像生成与编辑,免费试用,效果出色。
google
$2.16
输入tokens/百万
$18
输出tokens/百万
1M
上下文长度
-
2M
32.8k
unsloth
Gemma 3是Google推出的轻量级、最先进的开源模型家族,基于与Gemini模型相同的研究和技术构建。该模型具有多模态处理能力,支持文本和图像输入,并生成文本输出,适用于各种文本生成和图像理解任务。
Gemma 3是Google推出的轻量级、最先进的多模态开放模型家族,基于与Gemini模型相同的研究和技术构建。该模型能够处理文本和图像输入并生成文本输出,具有128K的大上下文窗口,支持超过140种语言,提供从270M到27B的多种尺寸选择。
Gemma 3n-E2B-it 是 Google 推出的轻量级开源多模态模型,基于与 Gemini 相同技术构建,专为低资源设备优化。
Gemma 3n是Google推出的轻量级、最先进的开源多模态模型家族,基于与Gemini模型相同的研究和技术构建。支持文本、音频和视觉输入,适用于多种任务。
Gemma 3n是Google推出的轻量级、最先进的开源多模态模型家族,基于与Gemini模型相同的研究和技术构建,支持文本、音频和视觉输入。
Gemma 3是Google推出的轻量级开放模型系列,基于Gemini技术构建,支持多模态输入和文本输出。
Gemma 3是Google基于Gemini技术构建的轻量级开放模型系列,支持多模态输入和文本输出,具有128K大上下文窗口和140+语言支持。
Gemma 3是Google推出的轻量级开放模型系列,基于创建Gemini模型的研究和技术构建。12B版本是经过指令调优的多模态模型,支持文本和图像输入,生成文本输出。
Gemma是Google推出的轻量级开放模型系列,基于Gemini模型技术构建。Gemma 3是多模态模型,支持文本和图像输入,生成文本输出,具有128K大上下文窗口和多语言能力。
Gemma 3是Google推出的轻量级、最先进的开放模型家族,基于与Gemini模型相同的研究和技术构建。支持多模态输入和文本输出。
Gemma是Google推出的轻量级先进开放模型系列,基于创建Gemini模型的技术构建。Gemma 3是多模态模型,能处理文本和图像输入并生成文本输出。
NewEden
Gemma 3是Google推出的轻量级、最先进的开源多模态模型家族,基于创建Gemini模型的相同研究和技术构建,支持文本和图像输入并生成文本输出。
Gemma 3是Google推出的轻量级、先进的多模态开放模型,基于与Gemini模型相同的研究和技术构建,支持文本和图像输入并生成文本输出。
Gemma是Google推出的轻量级先进开放模型系列,基于与Gemini相同技术构建,支持多模态输入和文本生成。
gaunernst
Gemma 3 是 Google 推出的轻量级先进开放模型系列,基于与 Gemini 模型相同的研究和技术构建。此版本为 27B 参数的指令调优模型,采用量化感知训练(QAT)和压缩张量技术。
Gemma 3是Google推出的轻量级前沿开放模型家族,基于创建Gemini模型的相同研究与技术构建。该模型是多模态的,可处理文本和图像输入并生成文本输出。
Gemma 3是Google推出的轻量级开源多模态模型系列,基于Gemini技术构建,支持文本和图像输入,生成文本输出。1B版本经过指令调优和量化感知训练(QAT),适合资源有限环境部署。
Gemma 3是Google基于Gemini技术打造的轻量级开源多模态模型系列,支持文本和图像输入并生成文本输出。12B版本经过指令调优和量化感知训练(QAT),适合资源有限环境部署。
Gemma 3是Google推出的轻量级开源多模态模型,基于与Gemini相同技术构建,支持文本和图像输入并生成文本输出。
context-labs
Gemma 3是Google推出的轻量级、最先进的开放模型家族,基于与Gemini模型相同的研究和技术构建。它是多模态模型,能处理文本和图像输入并生成文本输出。
该项目通过搭建Claude Code与Google Gemini AI的桥梁,实现在Claude Code环境中直接调用Gemini进行问答、代码审查和创意头脑风暴,提供便捷的AI协作工具。
一个实现Claude Desktop与Google Gemini AI模型交互的MCP服务器项目
AI Studio MCP Server是一个集成Google AI Studio/Gemini API的模型上下文协议服务器,提供支持文件、对话历史和系统提示的内容生成功能。
该项目是一个概念验证(POC),展示了如何通过自定义主机实现模型上下文协议(MCP),用于测试代理系统。核心功能包括OpenAI兼容API、Google Gemini集成、流式响应支持及工具调用能力。
一个结合Claude Code和Google Gemini AI的MCP服务器,通过多模型协作实现深度代码分析,Claude擅长本地上下文操作和CLI工作流,Gemini则利用其超大上下文窗口进行分布式系统调试和长轨迹分析。
该项目是一个基于Google Cloud Vertex AI Gemini模型的MCP服务器,提供丰富的工具集用于代码辅助和通用问答,支持网络搜索增强回答、文档解释生成、文件系统操作等功能。
一个基于TypeScript的MCP服务器,集成Google Gemini Pro模型
一个基于Gemini API和Google搜索的MCP服务器,通过与AI助手(如Cline)结合使用,提供最新信息的智能回答功能。
LangExtract MCP Server是一个基于FastMCP的服务器,通过Google Gemini模型从非结构化文本中提取结构化信息,为Claude Code等AI助手提供文本信息提取能力,支持智能缓存和持久连接。
基于Google Gemini 2.5 Flash API的MCP图像生成与编辑服务器,支持文本生成图像、图像编辑、迭代创作和风格迁移功能
GemForge是将Google的Gemini AI与MCP生态系统连接的企业级工具,提供实时网络访问、高级推理、代码分析和多文件处理等功能,支持60多种文件格式,具备智能模型选择和强大的错误处理机制。
Gemini UI设计服务器是一个基于MCP协议的企业级UI/UX设计和前端实现专家系统,通过集成Google Gemini 2.5 PRO提供专业的UI组件设计、代码审查、前端代码生成和架构咨询服务
Gemini DeepSearch MCP是一个自动化研究代理,利用Google Gemini模型和Google搜索进行深度多步骤网络研究,生成高质量、带引用的答案。
该项目展示了如何利用Google的Gemini 2.5 Pro模型通过函数调用功能与MCP协议下的航班搜索工具交互,实现自然语言查询航班信息并返回格式化结果。
一个基于Google Gemini模型的MCP服务器,提供文本生成图像和图像转换功能,支持高质量图像生成、智能文件名生成和本地存储。
MCP Gemini API服务器是一个为Cursor和Claude设计的Google Gemini API代理服务,提供文本生成、图像分析、视频分析和网络搜索等功能。
一个MCP服务器项目,提供基于token数量自动选择OpenAI O3或Google Gemini 2.5 Pro模型的服务,支持文件路径递归嵌入提示词,适用于代码审查和复杂问题解决。
一个本地STDIO MCP服务器,提供搜索和检索Google Gemini API文档的工具,支持全文搜索、自动更新文档内容
该项目是一个基于Python的多MCP服务器管理框架,通过SSE协议实现与Google Gemini API的交互,包含日历管理和浏览器自动化两大功能模块,支持通过配置文件动态加载多个服务。
OmniLLM是一个MCP服务器,作为Claude与其他大型语言模型(如ChatGPT、Azure OpenAI和Google Gemini)之间的桥梁,提供统一的AI访问接口。