QuestMobile报告显示,2025年三季度中国AI原生应用Top10榜单中,蚂蚁集团旗下AI健康应用AQ表现突出,排名上升至第7位,成为唯一入围的健康类应用。其用户规模已超过通义、文小言等通用AI产品,发布仅3个多月便实现快速增长,第三季度复合增长率达83.4%。
人工智能初创公司Mercor完成3.5亿美元融资,由Felicis领投,Benchmark等跟投。该公司由三位蒂尔研究员创立,业务重心从招聘决策转向为AI模型训练招募高技能人才。
OpenAI发布GPT-5新模型,重点升级心理健康回应功能。数据显示,每周约0.15%活跃用户(约100万人)在对话中透露自杀意图。为此,OpenAI联合全球60国300位专家优化响应机制,以应对严峻的用户求助需求。
美国Tahoe Bio公司发布30亿参数AI模型Tahoe-x1,专为解析基因、细胞与药物关系设计。该模型基于Transformer架构,标志AI从辅助工具升级为生命系统建模引擎,有望推动癌症靶点发现和个性化疗法发展。
MailAI是AI邮件助手,实现自动化管理,每周省10+小时,提升300%生产力。
Your360 AI借助语音AI实现360反馈,将同行见解转化为职业发展计划。
谷歌VEO 3.1 AI视频生成器,可创建8秒高质量带原生音频的视频。
Google的Veo 3.1 AI视频生成器,可将文本或图片转为逼真的1080p视频
xai
$21.6
输入tokens/百万
$108
输出tokens/百万
256k
上下文长度
$2.16
$3.6
1M
nvidia
-
128k
deepseek
$3.96
$15.77
alibaba
$0.72
131.1k
anthropic
200k
$0.86
$1.3
upstage
64k
mistral
perplexity
127k
tencent
$18
32k
$2.88
noctrex
这是阿里巴巴通义深度研究30B-A3B模型的量化版本,采用MXFP4_MOE量化技术并额外添加imatrix量化,旨在优化模型性能和资源使用效率,适用于文本生成任务。
Nanbeige
Nanbeige4-3B-Thinking是第四代Nanbeige大语言模型家族中的30亿参数推理模型,通过提升数据质量和训练方法实现了先进的推理能力。该模型在数学、科学、创意写作、工具使用等多个领域表现出色,支持多阶段课程学习和强化学习训练。
bartowski
这是inclusionAI的Ling-mini-2.0模型的量化版本,使用llama.cpp的imatrix技术进行量化处理,提供了从32.54GB的BF16到4.66GB的IQ2_XS等多种量化选项,可在多种硬件环境中高效运行。
maomao0819
BEVANet是一个专为实时语义分割设计的深度学习模型,在Cityscapes等数据集上表现出色,在RTX3090上实现了81.0%的mIoU和32.8FPS的优异性能,平衡了精度与速度的需求。
mradermacher
A2Search-3B-Instruct是基于zfj1998/A2Search-3B-Instruct的静态量化版本,提供多种量化类型选择。这是一个30亿参数的大语言模型,专门针对搜索和指令跟随任务进行优化,支持英语语言处理。
Minibase
这是一个紧凑的西班牙语到英语翻译模型,针对准确性和效率进行了优化。模型大小为386MB,支持4096个令牌的上下文长度,能够高效精准地完成翻译任务,平均响应时间约245ms。
mlx-community
这是Qwen3-VL-30B-A3B-Instruct模型的4位量化MLX格式版本,由mlx-community转换和维护。该模型是一个300亿参数的多模态视觉语言模型,支持图像理解和文本生成任务。
redis
这是一个基于sentence-transformers库微调的BiEncoder模型,专门为LangCache语义缓存任务优化。模型将句子和段落映射到384维向量空间,支持语义相似度计算和语义搜索等任务。
D1rtyB1rd
Looking_Glass-llama是一个用于测试的中间模型,基于llama 3架构,专门训练用于思考任务。该模型计划进行合并和持续训练,目前存在一定的重复性问题,建议使用较高的温度值和重复惩罚系数。
bullpoint
GLM-4.6-AWQ是对智谱AI的GLM-4.6(357B MoE)进行高性能AWQ量化的模型,专为vLLM推理进行了优化,能有效提升生产部署的吞吐量。该模型采用4位量化技术,在保持高精度的同时显著减少显存占用。
radicalnumerics
RND1是一个实验性的扩散语言模型,拥有300亿参数,采用稀疏专家混合架构。该模型从预训练的自回归基础模型转换而来,支持基于扩散的文本生成,每个标记仅激活30亿参数,在计算效率和模型容量之间取得平衡。
IBM Granite-4.0-H-Tiny是经过苹果硅芯片优化的混合Mamba-2/Transformer模型,采用3位量化技术,专为长上下文、高效推理和企业使用而设计。该模型结合了Mamba-2架构和专家混合技术,在保持表达能力的同时显著降低内存占用。
unsloth
Granite-4.0-H-Small是IBM开发的具有320亿参数的长上下文指令模型,基于Granite-4.0-H-Small-Base微调而成。该模型结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习对齐和模型合并等技术,在指令遵循和工具调用能力方面有显著提升,特别适合企业级应用。
Granite-4.0-H-Micro是IBM开发的30亿参数长上下文指令模型,基于Granite-4.0-H-Micro-Base微调而来。该模型结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习对齐和模型合并等技术开发,具备结构化的聊天格式,在指令遵循和工具调用能力方面表现优异。
Ashmotv
animat3d_style_wan-lora是基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频生成,可为图像生成带来独特的3D动画风格效果。该模型基于Wan2.2-T2V-A14B基础模型进行微调,支持多种主流AI平台使用。
Granite-4.0-Micro是IBM开发的30亿参数长上下文指令模型,基于Granite-4.0-Micro-Base微调而来。该模型结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习对齐和模型合并等技术开发,具备增强的指令遵循和工具调用能力,特别适用于企业级应用。
Granite-4.0-H-Micro是IBM开发的30亿参数长上下文指令模型,基于Granite-4.0-H-Micro-Base微调而来。该模型结合了开源指令数据集和内部合成数据集进行训练,具备增强的指令遵循和工具调用能力,特别适合企业级应用。
Lambent
Mira是一个基于多个Gemma 3 27B基础模型融合的文本生成模型,通过精心挑选的训练数据和特定训练方式,具备独特的诗意文本生成能力。该模型在角色扮演和创意写作方面表现出色,能够根据不同的系统提示生成富有文学色彩的文本。
jeevanrushi07
OpenLLaMA 3B v2是一个基于Transformer架构的开源大语言模型,拥有30亿参数。该模型采用MIT许可证,主要用于英文文本生成任务,支持聊天机器人等多种应用场景。
Granite-4.0-H-Small是IBM开发的具有320亿参数的长上下文指令模型,基于Granite-4.0-H-Small-Base微调而成。该模型结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习对齐和模型合并等技术开发,在指令遵循和工具调用能力方面有显著提升。
BlenderMCP通过MCP协议将Blender与Claude AI连接,实现AI辅助3D建模与场景控制
302AI BrowserUse MCP Server是一个基于AI的浏览器自动化服务器,通过Model Context Protocol (MCP)实现自然语言控制浏览器和网络研究。
Tripo MCP Server是一个连接AI助手与Tripo AI的接口项目,支持通过自然语言生成3D资产并导入Blender。
Blender MCP VXAI 是一个强大的集成工具,允许用户通过自然语言控制 Blender,实现 3D 建模、动画和场景的创建与修改。它简化了复杂操作,并支持实时导出到项目中。
Awesome MCP Servers 是一个全面的Model Context Protocol (MCP)服务器集合,涵盖了7158个MCP服务器,分为33个类别,包括AI集成、艺术媒体、浏览器自动化、云服务、数据库、开发者工具、文件系统、金融、游戏、硬件、医疗、基础设施、知识管理、位置地图、市场营销、监控、多媒体处理、操作系统、项目管理、科学研究、安全、社交媒体、旅行交通、实用工具和版本控制等。
一个支持多链交互的EVM兼容区块链服务MCP服务器,提供统一的区块链操作接口,支持30+网络和ENS解析。
Lokka是一个基于模型-上下文-协议(MCP)的服务器,用于通过自然语言操作Microsoft Graph和Azure RM API,实现对Azure和Microsoft 365租户的查询与管理。
FreeCAD MCP是一个通过Claude Desktop控制FreeCAD的插件,支持从2D图纸创建3D模型等多种设计功能。
Tripo MCP Server是一个连接AI助手与Tripo AI的接口工具,支持通过自然语言生成3D资产并导入Blender。
RhinoMCP是一个连接Rhino 3D建模软件与AI代理的工具,通过Model Context Protocol实现双向交互,支持3D对象操作、文档检查和脚本执行。
一个提供只读访问Outlook/微软365日历的MCP服务器,支持通过API或命令行工具查询日历事件。
OpenManus是一个无需邀请码即可实现各种想法的开源项目,由MetaGPT团队成员在3小时内构建完成。它提供了一个简单的实现,允许用户创建自己的智能代理,并支持多种语言和配置。项目欢迎建议、贡献和反馈,未来计划包括更好的规划、实时演示、回放功能、RL微调模型和全面的基准测试。
OpenSCAD MCP服务器是一个通过文本或图像生成参数化3D模型的服务,支持多视角重建、AI图像生成、远程CUDA处理和工作流审批,最终输出OpenSCAD兼容的模型文件。
一个用Scala 3编写的MCP协议服务器,支持多种工具功能。
Azure OpenAI DALL-E 3集成服务器,通过MCP协议提供图像生成与下载功能
FastMCP-Scala是一个基于Scala 3的高层次、开发者友好的库,用于构建模型上下文协议(MCP)服务器。它提供了ZIO效果处理、注解驱动的API、自动JSON模式生成以及与Java MCP SDK的无缝集成。
Cinema4D MCP Server是一个连接Cinema 4D与Claude的桥梁,通过提示词辅助进行3D场景操作和建模。
Volatility MCP是一个将Volatility 3内存取证工具与FastAPI及MCP协议集成的AI助手项目,通过REST API使内存分析插件可被AI助手和Web应用访问。
Artemis MCP是一个加密货币数据分析工具,提供API连接验证、数据获取和公式生成功能,支持Python 3.11+和uv环境。
OpenSCAD MCP服务器是一个通过文本或图像生成参数化3D模型的工具,支持多视角重建和远程处理。