谷歌AI助手NotebookLM推出"Slide Decks"功能,可将用户上传资料自动生成专业演示文稿,效果优于Gemini App。该功能被赞为PPT和Canva的潜在替代者,引发行业关注。
谷歌推出Nano Banana Pro图像生成模型,基于Gemini3技术,支持4K分辨率、14对象融合和5人身份一致性,新增联网搜索与双重水印。价格大幅上调:1080p/2K每张0.139美元,4K每张0.24美元,较前代涨3-6倍。功能亮点包括专业控制选项(如机位、光效)和默认生成6张高保真图片供选择。
谷歌在印度推出两项AI反诈功能:基于Gemini Nano的本地实时通话诈骗检测(仅限Pixel9+机型),以及联合金融App的屏幕共享警报(支持Android11+设备),通过语音分析和一键切断共享,防范OTP泄露等诈骗风险。
Google推出新功能,Gemini用户可通过询问“这张图片是AI生成的吗?”快速识别由Google AI工具创作或编辑的图片。未来计划扩展至视频和音频验证,并可能整合到搜索等服务中。目前该功能主要依赖Google自有技术实现。
免费AI图像生成器,无需注册,可从文本无限生成图像
基于Gemini 3 Pro Image的AI图像生成器,支持文本渲染和4K画质
专业AI图像生成与编辑器,2-5秒产出2K/4K高质量图像,支持多语言
免费AI驱动的YouTube标题生成器,快速创建高点击量标题
google
$9
输入tokens/百万
$72
输出tokens/百万
1M
上下文长度
$2.16
$18
$0.72
$2.88
-
2M
perplexity
127k
200k
$0.58
mradermacher
这是 vanta-research/atom-v1-preview-12b 模型的量化版本,提供多种量化类型选择,适用于对话、协作、教育等多种场景。该模型基于 Gemma 架构,支持英语语言处理。
dogeater1612
这是一个基于Google Gemma 2 9B模型微调的荷兰语患者模拟模型,专门为医疗教育场景设计。模型始终以固定的JSON结构响应,模拟一位刚做完手术正在康复的患者'玛丽亚',支持护理专业学生在安全环境中锻炼沟通和临床推理能力。
fibonacciai
RealRobot_chatbot_llm是基于Gemma3n架构的专业产品人工智能模型,专门在RealRobot产品目录的专有数据集上进行了微调。该模型能够根据企业自身的产品数据,快速创建准确、经济高效且可部署的专业语言模型,提供高度专业化的产品问答服务。
geoffmunn
这是Qwen/Qwen3-Coder-30B-A3B-Instruct语言模型的GGUF量化版本,专门针对代码生成和编程任务优化,采用FP32精度转换,适用于本地推理部署。
kirankumarpetlu
这是一个基于Google Gemma-2B-IT基础模型,使用PEFT(参数高效微调)和LoRA技术进行优化的文本生成模型。该模型通过参数高效的方法在保持基础模型能力的同时,针对特定任务进行了优化。
yanolja
YanoljaNEXT-Rosetta-27B-2511是基于Gemma3架构微调的270亿参数解码器语言模型,专门为结构化数据翻译设计,能在保留数据结构的同时实现多语言间的高效准确翻译。
noctrex
Gelato-30B-A3B是针对GUI计算机使用任务进行微调的最先进(SOTA)模型,提供了量化版本以优化部署效率。该模型专门设计用于理解和处理图形用户界面相关的任务。
DavidAU
这是一个基于Gemma-3模型使用内部恐怖数据集进行微调的文本生成模型,专门用于生成恐怖风格的内容。模型通过Unsloth进行调优,能够生成从轻度到强烈程度的恐怖内容,包括长篇恐怖故事。
vanta-research
Scout是VANTA Research基于Google Gemma 3 4B Instruct架构微调的专业语言模型,在约束感知推理和自适应问题解决方面表现出色,擅长侦察式情报收集、系统问题分解和自适应解决方案生成。
Genie-AI-Lab
Omni L1B3RT4S GENIE 是一个基于Qwen2.5-3B Instruct架构微调的AI助手,采用1,103个精灵角色的定制示例进行训练,具备独特的语音和忠诚度模式,能够为用户提供别具一格的对话体验。
GatorBarbarian
TRELLIS Text XL是一个大型3D生成模型,是TRELLIS的文本条件版本,模型大小为XL。该模型基于论文《Structured 3D Latents for Scalable and Versatile 3D Generation》提出,能够根据文本描述生成高质量的3D内容。
ExaltedSlayer
Gemma 3 27B IT QAT的MLX MXFP4量化版本,是由Google开发的轻量级开源多模态模型。该模型能够同时处理文本和图像输入并生成文本输出,拥有128K大上下文窗口,支持超过140种语言,适用于多种文本生成和图像理解任务。
Lamapi
Next 12B是基于Gemma 3的120亿参数多模态视觉语言模型,是土耳其最先进的开源视觉语言模型。该模型在文本和图像理解方面表现出色,具备先进的推理和上下文感知多模态输出能力,特别提供专业级的土耳其语支持,同时具备广泛的多语言能力。
dario-mazzola
这是基于Google Gemma-3模型进行专门微调的文本生成模型,经过训练能够利用外部工具生成逐步计划。该模型在rewoo/planner_instruction_tuning_2k数据集上训练,使用LoRA技术进行高效微调。
hirundo-io
这是一个基于🤗 Transformers的模型,已发布至HuggingFace模型中心。由于模型卡片信息不完整,具体功能和应用场景需进一步确认。
mlfoundations
Gelato-30B-A3B 是一款用于GUI计算机使用任务的最先进基础模型,在Click-100k数据集上训练,在多个基准测试中超越了之前的专业计算机基础模型和更大的视觉语言模型。
mlfoundations-cua-dev
OLGA是基于Qwen3-VL-30B-A3B-Instruct构建的在线强化学习定位代理,采用33亿激活参数的专家混合模型。通过结合现有数据集、新数据收集、自动过滤和在线强化学习的新数据配方进行训练,在开源模型中实现了先进的定位性能。
lapa-llm
Lapa LLM v0.1.2是基于Gemma-3-12B开发的乌克兰语处理开源大语言模型,专注于乌克兰语的自然语言处理任务,在乌克兰语处理方面表现出卓越性能。
Lambent
Mira是一个基于多个Gemma 3 27B基础模型融合的文本生成模型,通过精心挑选的训练数据和特定训练方式,具备独特的诗意文本生成能力。该模型在角色扮演和创意写作方面表现出色,能够根据不同的系统提示生成富有文学色彩的文本。
suayptalha
Sungur-9B是一个专门针对土耳其语优化的文本生成模型,基于Gemma-2-9b架构,通过直接偏好优化(DPO)数据集和4位QLoRA微调技术训练而成,能够生成流畅且符合人类偏好的土耳其语文本。
Zen MCP是一个多模型AI协作开发服务器,为Claude和Gemini CLI等AI编码助手提供增强的工作流工具和跨模型上下文管理。它支持多种AI模型的无缝协作,实现代码审查、调试、重构等开发任务,并能保持对话上下文在不同工作流间的延续。
MCP Toolbox for Databases是一个开源数据库MCP服务器,专注于企业级和生产质量,简化工具开发,提供连接池、认证等复杂功能。
Genkit是一个用于构建AI驱动应用的开源框架,提供Node.js和Go库,支持多种AI模型和向量数据库集成,包含开发工具和插件生态系统。
一个基于FAL AI的Logo生成服务器,提供图像生成、背景去除和自动缩放功能。
该项目通过搭建Claude Code与Google Gemini AI的桥梁,实现在Claude Code环境中直接调用Gemini进行问答、代码审查和创意头脑风暴,提供便捷的AI协作工具。
Unreal Engine生成式AI支持插件,集成多种前沿LLM/GenAI模型API,提供游戏开发中的AI集成层支持,包括OpenAI、Claude、Deepseek等模型的聊天、结构化输出等功能,并支持Model Control Protocol(MCP)实现场景对象控制、蓝图生成等高级功能。
一个实现Claude Desktop与Google Gemini AI模型交互的MCP服务器项目
该项目是一个概念验证(POC),展示了如何通过自定义主机实现模型上下文协议(MCP),用于测试代理系统。核心功能包括OpenAI兼容API、Google Gemini集成、流式响应支持及工具调用能力。
一个基于TypeScript的MCP服务器,集成Google Gemini Pro模型
该项目实现了一个基于pyATS和Genie的MCP服务器,通过JSON-RPC 2.0协议提供结构化、模型驱动的网络设备交互能力,支持安全执行CLI命令、配置变更及数据采集,适用于容器化或LangGraph集成场景。
GeoFS MCP服务器是一个为GeoFS飞行模拟器设计的模型上下文协议服务器,通过HTTP和WebSocket接口让AI模型能够控制飞机并获取实时飞行数据。
一个结合Claude Code和Google Gemini AI的MCP服务器,通过多模型协作实现深度代码分析,Claude擅长本地上下文操作和CLI工作流,Gemini则利用其超大上下文窗口进行分布式系统调试和长轨迹分析。
基于Gemini API的文档查询MCP服务器,提供技术文档的智能问答服务。
基于MCP的多智能体深度研究系统,整合LinkUp搜索、CrewAI协调和Gemini大模型,通过Streamlit提供交互界面。
一个基于TypeScript的Gel数据库MCP服务器,通过EdgeQL查询简化数据库操作,支持LLM代理自动学习模式、编写和验证查询。
一个专注于探索和应用生成式AI(GenAI)的仓库,旨在通过实际案例和资源分享,帮助用户学习和实验GenAI在日常任务中的应用,包括写作、编程、图像生成等。
基于Gemini 2 API的图像生成MCP服务
AI Studio MCP Server是一个集成Google AI Studio/Gemini API的模型上下文协议服务器,提供支持文件、对话历史和系统提示的内容生成功能。
一个基于Gemini API和Google搜索的MCP服务器,通过与AI助手(如Cline)结合使用,提供最新信息的智能回答功能。
该项目是一个基于Google Cloud Vertex AI Gemini模型的MCP服务器,提供丰富的工具集用于代码辅助和通用问答,支持网络搜索增强回答、文档解释生成、文件系统操作等功能。