汉堡大学与莱布尼茨媒体研究所研究发现,ChatGPT的新闻推荐因接口不同差异显著。五周内分析2.4万条新闻问题发现,API接口多引用维基百科等非新闻来源,而网页界面更倾向新闻媒体。研究聚焦德国用户体验,揭示AI回答来源偏好。
StepFun AI发布开源项目Step-Audio-EditX,基于30亿参数音频语言模型,将语音编辑转化为类似文本标记的可控操作,突破传统波形处理模式。该技术有望实现"像编辑文本一样编辑语音"的直观交互,相关论文已发布于arXiv平台(编号2511.03601)。
特斯拉股东批准马斯克天价薪酬方案后,他在X平台发布旗下AI工具Grok生成的动画视频,展示雨中角色用合成声音表达爱意,24分钟后再次更新动态。
一项针对德语区2.4万条新闻AI回答的研究发现,用户访问ChatGPT的方式会显著影响其新闻源推荐。网页界面倾向推荐主流媒体及合作方,而API接口则呈现更多元化选择。两者在新闻源多样性、集中度和政治倾向方面均存在统计学显著差异。
Nana Banana 2是下一代文本到图像和编辑引擎,提供快速高质量视觉效果。
Google Gempix2是由Gemini 3驱动的图像编辑器,功能升级,输出高质量图像。
全球可访问的无水印AI视频生成平台,支持文本、图像转视频等功能。
免费AI图像编辑器和生成器,可去背景、提升画质、生成AI艺术图像。
xai
$21.6
输入tokens/百万
$108
输出tokens/百万
256k
上下文长度
openai
$144
$576
200k
google
$9
$72
1M
deepseek
$3.6
$15.48
128k
$2.16
$18
anthropic
$540
minimax
-
alibaba
$0.72
nvidia
$4.03
$15.98
upstage
65.5k
$2.88
DavidAU
这是一个增强版的多模态视觉语言模型,基于Qwen3-VL-8B-Thinking模型,通过Brainstorm 20x技术扩展至12B参数,采用NEO Imatrix增强的GGUF量化。模型具备强大的图像理解、文本生成和多模态推理能力,在视觉感知、文本质量和创意场景方面都有显著提升。
noctrex
这是MiniMax-M2-THRIFT模型的MXFP4_MOE量化版本,在原模型基础上进行了压缩处理,包括25%的专家剪枝(从256到192)并设置top_k=8,同时保留了编码模型的特性,可用于文本生成任务。
unsloth
aquif-3.5系列是2025年11月3日发布的巅峰之作,包含Plus和Max两个版本,提供先进的推理能力和前所未有的100万标记上下文窗口,在各自类别中实现了最先进的性能。
Qwen3-Coder-REAP-363B-A35B是通过REAP方法对Qwen3-Coder-480B-A35B-Instruct进行25%专家剪枝得到的稀疏混合专家模型,在保持接近原模型性能的同时显著降低了参数规模和内存需求,特别适用于资源受限的代码生成和智能编码场景。
moonshotai
Kimi K2 Thinking 是月之暗面(Moonshot AI)开发的最新一代开源思维模型,具有强大的深度推理能力和工具调用功能。该模型采用混合专家架构,支持原生INT4量化,拥有256k上下文窗口,在多个基准测试中表现出色。
这是一个基于Mistral架构的图像文本转文本量化模型,参数规模为24B,专门针对指令跟随任务进行了优化训练,支持多模态输入处理。
MiniMax-M2是一款专为最大化编码和智能体工作流程而构建的小型混合专家模型,总参数达2300亿,激活参数为100亿。该模型在编码和智能体任务中表现卓越,同时保持强大的通用智能,具有紧凑、快速且经济高效的特点。
dinhthuan
NeuTTS-Air越南语文本转语音模型是基于260多万条越南语音频样本,从NeuTTS-Air基础模型微调而来的高质量越南语语音合成模型。该模型能够实现自然流畅的越南语语音合成,支持语音克隆功能,并针对生产环境进行了优化。
本项目是对Qwen3-Coder-30B-A3B-Instruct模型进行MXFP4_MOE量化的成果,将上下文大小从256k扩展到1M,为代码生成和编程任务提供了更优化的模型版本,具有提升性能和节省资源的价值。
lmstudio-community
Qwen3-VL-2B-Thinking是由Qwen推出的视觉语言模型,基于2B参数规模,使用MLX进行8位量化,专门针对Apple Silicon芯片进行了优化。该模型支持图像和文本的多模态理解与生成任务。
ycngin2024
这是一个经过微调的Whisper语音识别模型,基于unsloth/whisper-large-v3-turbo架构,使用Unsloth和Huggingface TRL库实现了2倍训练加速,显著提升了训练效率。
Qwen3-VL是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。该版本为2B参数的思考增强版,专门优化了推理能力。
Mungert
gpt-oss-safeguard-20b是基于GPT-OSS-20b微调的安全推理模型,专门用于大语言模型输入输出过滤、在线内容标注以及信任与安全用例的离线标注。该模型采用Apache 2.0许可证,支持自定义策略和透明决策过程。
Qwen
Qwen3-VL-30B-A3B-Instruct是通义系列中最强大的视觉语言模型,采用混合专家模型架构,具备出色的文本理解与生成能力、深入的视觉感知与推理能力,支持256K长上下文和视频理解,可在多种设备上进行推理。
bartowski
这是英伟达Qwen3-Nemotron-32B-RLBFF大语言模型的GGUF量化版本,使用llama.cpp工具进行多种精度量化,提供从BF16到IQ2_XXS共20多种量化选项,适用于不同硬件配置和性能需求。
OPPOer
基于Qwen-Image-Edit进行模型剪枝的版本,移除了20层,保留40层权重,最终模型大小为13.6B参数。这是一个图像编辑模型,支持多图像输入和文本引导的图像合成与编辑。
Qwen3-VL-2B-Instruct-GGUF是通义千问系列的多模态视觉语言模型的GGUF量化版本,具备20亿参数,支持图像理解和文本生成的无缝融合,可在CPU、GPU等设备上高效运行。
这是Qwen3-VL-2B-Thinking模型的Llamacpp imatrix量化版本,提供了多种量化类型的文件,可在不同硬件环境下高效运行。该模型是一个2B参数的多模态视觉语言模型,具备思维链推理能力。
这是Qwen3-VL-2B-Instruct模型的量化版本,使用llama.cpp工具和imatrix方法生成了多种量化级别的模型文件,便于在不同硬件环境下高效运行。该模型是一个2B参数的多模态视觉语言模型,支持图像和文本的交互。
Qwen3-VL-2B-Instruct是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持以及强大的空间和视频动态理解能力。该模型采用2B参数规模,支持指令交互,适用于多模态AI应用。
Opik是一个开源的LLM评估框架,支持追踪、评估和监控LLM应用,帮助开发者构建更高效、更经济的LLM系统。
API 200是一个开源API集成平台,提供第三方API的快速接入和管理功能,包含自动生成代码、文档、认证、缓存和错误处理等特性,支持自托管部署和MCP服务。
一个集成OpenAI Sora 2视频生成API的MCP服务器,提供视频生成、混剪、状态查询和自动下载功能
FreeCAD MCP是一个通过Claude Desktop控制FreeCAD的插件,支持从2D图纸创建3D模型等多种设计功能。
Open Data MCP是一个开源项目,旨在通过MCP协议将公开数据集快速接入LLM应用。项目提供CLI工具实现2分钟接入(当前支持Claude),并建立社区协作框架让开发者能轻松贡献和发布公开数据集。核心目标是构建连接所有LLM应用与数百万公开数据集的基础设施。
DBCode是一款VS Code数据库管理插件,支持20+种数据库连接,提供数据编辑、自然语言查询、ER图生成、可视化分析等功能,帮助开发者在IDE内高效完成数据库操作。
一个基于AWS Lambda、CloudFront和Cognito认证的无服务器MCP协议实现项目,提供完整的云端MCP服务器基础设施,支持OAuth 2.0认证、实时流传输和可扩展架构。
一个基于Cline的Solana区块链数据查询服务,提供21种常用RPC方法,支持通过自然语言交互获取账户、区块、交易等链上信息。
该项目实现了一个基于pyATS和Genie的MCP服务器,通过JSON-RPC 2.0协议提供结构化、模型驱动的网络设备交互能力,支持安全执行CLI命令、配置变更及数据采集,适用于容器化或LangGraph集成场景。
基于Gemini 2 API的图像生成MCP服务
MSSQL MCP服务器是一个增强型数据库管理工具,通过标准接口为语言模型提供全面的Microsoft SQL Server数据库访问能力,支持23种数据库操作工具,包括模式检查、查询执行、存储过程管理等高级功能。
一个通过JSON-RPC 2.0协议控制微软画图的服务器,支持启动画图程序、绘制图形、设置颜色和工具属性等功能。
一个用Scala 3编写的MCP协议服务器,支持多种工具功能。
Titanmind WhatsApp MCP是一个基于Titanmind平台的WhatsApp营销和消息服务工具,提供对话管理、模板创建与批量发送等功能,支持24小时内自由格式消息和模板工作流自动处理。
基于Google Gemini 2.5 Flash API的MCP图像生成与编辑服务器,支持文本生成图像、图像编辑、迭代创作和风格迁移功能
该项目演示了如何使用OAuth 2.1授权流程和AWS Cognito保护MCP服务器,包含资源服务器、授权服务器、动态客户端注册等核心功能实现。
一个利用AI生成游戏资源的工具,支持2D和3D资源创建,集成Hugging Face和MCP协议。
一个基于Gemini Flash 2 AI模型的数据分析与研究MCP服务器,提供数据解析、智能分析、报告生成和邮件自动发送功能。
Gemini UI设计服务器是一个基于MCP协议的企业级UI/UX设计和前端实现专家系统,通过集成Google Gemini 2.5 PRO提供专业的UI组件设计、代码审查、前端代码生成和架构咨询服务
该项目展示了如何利用Google的Gemini 2.5 Pro模型通过函数调用功能与MCP协议下的航班搜索工具交互,实现自然语言查询航班信息并返回格式化结果。