在2026年达沃斯论坛上,月之暗面总裁张予彤指出,其AI产品Kimi仅用美国顶尖实验室1%的资源就取得显著成果,挑战了“算力至上”的行业观念,展现了中国团队高效利用资源、以低成本实现重大突破的能力。
在2026年达沃斯论坛上,月之暗面总裁张予彤分享了中国大模型发展的“中国经验”。她强调,公司并非依赖巨额算力,而是仅用美国顶尖实验室1%的资源,就成功开发出Kimi K2等模型,展示了在有限条件下实现技术突破的创新路径。
AI开源框架vLLM核心团队成立初创公司Inferact,以80亿美元投前估值完成1.5亿美元种子轮融资,由a16z和光速创投领投,标志着AI行业重心正从模型训练转向推理商业化。
中国AI公司月之暗面在达沃斯论坛宣布,其Kimi模型仅用美国顶尖实验室1%的计算资源,便研发出性能领先的开源大模型,部分指标超越美国闭源模型,展示了高效创新的技术路径。
Vadu AI免费生成AI视频和图像,支持17种语言,多种模型可选。
五个 AI 模型在 NASDAQ 100 进行交易竞争,完全自主,无人干预。
免费在线工具,可将图像转为可定制模型,有超10k专业模板
全球首个带推理智能与16位HDR输出的AI视频模型,创作高效专业
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
Baidu
128
$2
$20
$6
$24
redis
这是一个由Redis开发的、针对LangCache语义缓存任务进行微调的CrossEncoder模型。它基于成熟的`cross-encoder/ms-marco-MiniLM-L6-v2`模型,在超过100万对LangCache句子对数据集上训练,专门用于计算两个文本之间的语义相关性得分,以优化缓存命中率。
ai-sage
GigaChat3-10B-A1.8B 是 GigaChat 系列的高效对话模型,基于混合专家(MoE)架构,拥有 100 亿总参数和 18 亿活跃参数。它采用了创新的多头潜在注意力(MLA)和多令牌预测(MTP)技术,旨在优化推理吞吐量和生成速度。模型在 20T 令牌的多样化数据上训练,支持包括中文在内的 10 种语言,适用于需要快速响应的对话场景。
hitonet
Hito 1.7B 是一个专为 llama.cpp、Ollama、LM Studio 等工具优化的 GGUF 量化版本模型,具备 17 亿参数,采用嵌套认知推理(NCR)方法,能够实现结构化、自我纠错的思维模式,提升推理准确性与透明度。
AlekseyCalvin
这是一个针对 Z-Image Turbo DiT 模型的低秩适配器(LoRA),专门用于生成具有历史照片风格的图像。该模型基于 1900-1910 年代摄影师 Sergey Prokudin-Gorsky 的 150 张彩色照片训练而成,能够为现代图像生成注入独特的早期彩色摄影美学,如暖色调光晕和特定色彩质感。
drbaph
Z-Image(造相)是一个拥有60亿参数的高效图像生成基础模型,专门解决图像生成领域的效率和质量问题。其蒸馏版本Z-Image-Turbo仅需8次函数评估就能达到或超越领先竞品,在企业级H800 GPU上可实现亚秒级推理延迟,并能在16G VRAM的消费级设备上运行。
PrimeIntellect
INTELLECT-3是一个拥有1060亿参数的混合专家(MoE)模型,通过大规模强化学习训练而成。在数学、编码和推理基准测试中展现出卓越性能,模型、训练框架和环境均以宽松许可协议开源。
Shawon16
这是一个基于VideoMAE-base架构在未知数据集上微调的视频理解模型,专门用于手语识别任务。模型在20个训练周期后达到了18.64%的准确率。
Arko007
Zenyx_114M-Tiny-Edu-Instruct 是一个实验性的小型指令微调语言模型,拥有约1.14亿参数。它基于TinyEdu-50M基础模型构建,在FineWeb-Edu数据集上预训练,并在OpenHermes-2.5和CodeFeedback-Filtered混合数据集上进行了指令微调。该模型旨在探索极小架构下指令微调的极限,验证损失收敛至约1.04。
ExaltedSlayer
Gemma 3是谷歌推出的轻量级开源多模态模型,本版本为12B参数的指令调优量化感知训练模型,已转换为MLX框架的MXFP4格式,支持文本和图像输入并生成文本输出,具有128K上下文窗口和140+语言支持。
这是基于MCG-NJU/videomae-base模型在未知数据集上微调的视频理解模型,经过20个epoch的训练,在评估集上达到13.31%的准确率。该模型专门针对视频分析任务进行优化。
jayn7
腾讯混元视频1.5模型的量化GGUF版本,专门用于文本到视频生成任务,支持720P高清视频生成,提供多种量化精度版本以优化使用效率。
本项目提供腾讯混元视频1.5文本到视频模型的量化GGUF版本,支持480P视频生成任务,包含蒸馏模型和完整模型两个版本,可与ComfyUI-GGUF等工具配合使用。
腾讯混元视频1.5模型的量化GGUF版本,专门用于图像转视频和视频生成任务。提供480P分辨率的蒸馏模型和标准模型,支持多种量化精度,包括Q4_K_S、Q8_0和FP16等。
DreadPoor
Strawberry_Smoothie-TEST 是一个使用 mergekit 工具合并三个12B参数模型得到的混合模型,结合了Unity-12B、Chaos-Unknown-12b和Smoothie-12B-Model_Stock的优势,旨在提供更好的文本生成和对话能力
evilfreelancer
这是ai-sage/GigaChat3-10B-A1.8B模型的量化版本,采用GGUF格式,需要特定的llama.cpp分支支持。模型采用混合专家架构,总参数量约118亿,其中激活参数量约18亿。
prithivMLmods
VibeThinker-1.5B是微博AI推出的15亿参数密集语言模型,基于Qwen2.5-Math-1.5B微调,专门针对数学和算法编码问题设计。采用'频谱到信号原理'框架训练,在多个数学竞赛测试中超越规模更大的模型,训练成本约7800美元,支持最长约40k词元的输出。
GigaChat3-10B-A1.8B是GigaChat系列的对话模型,基于混合专家(MoE)架构,共有100亿参数,其中18亿为活跃参数。该模型采用多头潜在注意力和多令牌预测技术,支持25.6万令牌的长上下文,在多语言对话和推理任务中表现出色。
kayte0342
ChronoEdit-14B是NVIDIA开发的一款具备时间推理能力的图像编辑和世界模拟模型,拥有140亿参数。它通过两阶段推理过程实现物理感知的图像编辑和基于动作条件的世界模拟,从预训练视频生成模型中提炼先验知识。
mlx-community
VibeThinker-1.5B的4位量化版本,基于MLX框架针对苹果芯片优化,是一个拥有15亿参数的密集语言模型,专门用于数学推理和算法编码问题
GigaChat3-10B-A1.8B-base是GigaChat系列的基础预训练模型,采用混合专家(MoE)架构,总参数100亿,活跃参数18亿。模型集成了多头潜在注意力(MLA)和多令牌预测(MTP)技术,在推理时具备高吞吐量优势。
1Panel MCP Server是为1Panel设计的模型上下文协议服务器实现,支持多种安装和运行方式。
1Panel MCP Server是为1Panel设计的模型上下文协议服务器实现。
CCXT MCP Server是一个通过Model Context Protocol (MCP)让AI模型与加密货币交易所API交互的服务器,使用CCXT库支持100多家交易所的交易功能。
Pulse CN MCP Server是一个实时获取中国互联网热门内容的MCP协议服务器,支持微博、今日头条等18个平台的热搜数据,为AI模型提供最新中文趋势信息。
MCP字符工具是一个为大型语言模型提供字符级文本分析能力的服务器,解决LLM因分词而难以处理单个字符的问题,提供14+种字符计数、拼写分析和文本比较工具。
YaraFlux MCP Server是一个基于模型上下文协议(MCP)的YARA扫描服务器,为AI助手提供文件YARA规则分析能力。该项目采用模块化架构,集成了19个MCP工具,支持YARA规则管理、文件扫描、安全存储等功能,可无缝集成Claude Desktop等AI助手。
Prompt Decorators是一个标准化大型语言模型提示增强与转换的框架,提供规范定义和Python实现,包含140+预置装饰器,支持MCP协议集成。
Code Graph RAG MCP是一个先进的模型上下文协议服务器,通过智能图表示和多语言代码分析能力,提供13种专业工具进行代码理解、关系映射和语义搜索。
一个连接大型语言模型与《卫报》自1999年以来所有文章档案的MCP服务器,提供实时新闻、新闻分析和历史研究功能。
MCP AI Hub是一个基于Model Context Protocol的服务器,通过LiteLM统一接口提供对100+AI模型(包括OpenAI、Anthropic、Google等)的访问,支持多种传输协议和灵活配置。
ImageGen MCP Server是一个支持多种AI图像生成模型(包括GPT-Image-1、Google Imagen 4、Flux 1.1等)的MCP服务器,提供灵活的图像生成、尺寸调整和输出格式选项,可无缝集成到各种MCP客户端中。
DINO-X MCP是一个通过DINO-X和Grounding DINO 1.6 API赋能大型语言模型进行细粒度目标检测和图像理解的项目。它能够实现精确的对象定位、计数、属性分析以及场景理解,支持自然语言驱动的视觉任务和工作流集成。
基于Google Gemini 1.5 Pro模型的内容智能摘要服务
DINO-X MCP是一个结合大型语言模型与DINO-X、Grounding DINO 1.6 API的项目,旨在实现细粒度物体检测和图像理解,支持自然语言驱动的视觉任务和自动化场景。
Insights Knowledge Base (IKB) MCP Server 是一个即插即用的免费知识库,内置10,000+高质量洞察报告,支持本地安全存储和私有文档解析。项目优化了数据处理效率,提供每周报告更新,并计划未来集成嵌入模型和增强报告系统。
Python Alfresco MCP Server是一个基于FastMCP 2.0框架构建的Alfresco内容服务模型上下文协议服务器,提供全文搜索、文档管理、元数据操作等15种工具,支持STDIO/HTTP/SSE多种传输协议,适用于Alfresco社区版和企业版。
YouTube MCP服务器是一个通过YouTube Data API v3提供实时YouTube数据访问的综合模型上下文协议服务器,支持14种功能,包括视频详情获取、频道分析、内容评估和字幕提取等,适用于AI助手集成。
ReactBits MCP服务器是一个为AI助手提供访问ReactBits.dev组件库的模型上下文协议服务,包含135+个动画React组件,支持组件发现、智能搜索、样式选择等功能。
本分析报告总结了2025年3月19日在X平台上讨论的最有趣的MCP(模型上下文协议)服务器,重点关注了它们在AI驱动工作流程中的实用性。报告通过X平台的讨论和博客文章,识别了最受欢迎和推荐的MCP服务器,包括Reddit、Notion、Google Sheets、Gmail和Discord等,这些服务器因其自动化能力和易用性而受到青睐。此外,还提到了SendAI Kit和Dolphin-MCP等具有特定功能的服务器,以及Anthropic提供的预构建服务器。
CCXT MCP服务器通过标准化的模型上下文协议,为AI交易策略提供与100多家加密货币交易所的无缝对接,实现无需编码的自动化交易。