10月16日,百度飞桨发布视觉语言模型PaddleOCR-VL,以0.9B参数在权威评测OmniDocBench V1.5中获92.56分,超越DeepSeek-OCR等主流模型登顶全球OCR榜单。截至10月21日,Huggingface趋势榜前三均为OCR模型,百度飞桨位列第一。
百川大模型发布医疗大模型Baichuan-M2Plus,升级应用百小应并开放API接口。评测显示,该模型医疗幻觉率显著低于通用大模型,较DeepSeek降低约3倍,表现优于美国OpenEvidence应用。
百川大模型发布医疗大模型Baichuan-M2Plus,升级百小应应用并开放API。该模型在医疗幻觉率上表现突出,较通用模型大幅降低,相比现有医疗产品DeepSeek降低约3倍,并超越美国OpenEvidence。基于创新的六源循证技术,提升了医疗问答的准确性。
百度文心X1.1在SuperCLUE-CPIF中文指令遵循测评中以75.51分位列国产大模型第一。该基准评估10个国内外知名模型在中文复杂指令执行能力,包括GPT-5、DeepSeek等,重点关注任务类型与指令遵循表现。
全球首个由深度学习驱动的在线 OCR 工具,97% 准确率。
AI Fiesta是一个让您与世界顶尖AI模型如ChatGPT、Gemini Pro、Claude、Perplexity、Deepseek和Grok交流的平台。
聊天机器人AI产品集合,包括GPT-4o, Gemini, Qwen, Deepseek, Claude & Grok。
PPTDetector是准确检测AI生成内容的AI检测器,可检测由ChatGPT,GPT,Gemini,Grok,Claude,Deepseek生成的pptx。
deepseek
$3.6
输入tokens/百万
$15.48
输出tokens/百万
128k
上下文长度
minimax
-
1M
$3.96
$15.77
$4.03
$15.98
baidu
$4
$16
$0.86
$1.3
$0.72
$2.88
$2
$8
32k
$1.94
$7.92
$1.01
$2.02
4.1k
noctrex
这是DeepSeek-MoE-16B-Chat模型的MXFP4_MOE量化版本,专门针对文本生成任务进行了优化,提供了更高效的推理解决方案。
deepseek-ai
DeepSeek-OCR是DeepSeek AI开发的一款先进的光学字符识别模型,专注于探索视觉文本压缩的边界,能够高效地从图像中提取和转换文本内容。
Thrillcrazyer
Qwen-1.5B_THIP是基于DeepSeek-R1-Distill-Qwen-1.5B在DeepMath-103k数学数据集上使用TRL框架进行GRPO方法微调的数学推理模型。该模型专门针对数学问题解决进行了优化,具备较强的数学推理能力。
moxin-org
本项目对DeepSeek-V3-0324进行了llama.cpp混合精度量化,解决了模型在边缘设备上部署的难题,提升了模型的运行效率和资源利用率。
MikeKuykendall
这是DeepSeek公司的DeepSeek-MoE-16B模型的Q4_K_M量化版本,通过llama.cpp的Rust绑定启用了MoE(专家混合)CPU卸载功能,显著减少显存使用。
kathywu95
这是一个基于DeepSeek-V3架构的随机权重生成模型,专门用于测试和开发目的。模型使用随机初始化的权重,参数规模经过精简,适合快速原型开发和功能验证。
QuantTrio
DeepSeek-V3.2-Exp-AWQ是基于DeepSeek-V3.2-Exp模型的量化版本,通过vLLM框架实现高效文本生成。该模型引入了DeepSeek稀疏注意力机制,在长上下文训练和推理效率上有显著提升,同时保持了模型输出质量。
变换器库是一个强大的自然语言处理工具库,提供丰富的预训练模型和便捷的使用接口,广泛应用于文本生成、分类、翻译等NLP任务,极大提升开发效率。
prithivMLmods
Mintaka-Qwen3-1.6B-V3.1是一个高效的、专注于科学推理的模型,基于Qwen-1.6B构建,并在DeepSeek v3.1合成轨迹(10,000条记录)上进行训练。它针对随机事件模拟、逻辑问题分析和结构化科学推理进行了优化,在符号精度和轻量级部署之间取得了平衡。
BBQGOD
DeepSeek-GRM-16B 是一个基于 Self-Principled Critique Tuning (SPCT) 的生成式奖励模型,能为查询-响应生成透明的'原则→批判→分数'评估流程,可用于大语言模型的强化学习、评估和数据收集等任务。
DeepSeek-V3.1是基于DeepSeek-V3.1-Base进行后训练的大型语言模型,具有128K上下文长度,支持混合思维模式、智能工具调用和代码代理功能。该模型在多项基准测试中表现出色,特别在数学推理、代码生成和搜索代理任务上有显著提升。
ubergarm
基于DeepSeek-V3.1模型的GGUF格式量化版本,使用ik_llama.cpp分支进行最优量化。该模型在特定内存占用下实现最佳困惑度表现,提供从IQ5_K到IQ1_S等多种量化方案,满足不同内存和性能需求。
bartowski
这是DeepSeek-V3.1模型的量化版本,使用llama.cpp的imatrix技术进行量化处理,旨在提升模型在不同硬件上的运行效率和性能。该版本提供多种量化级别,从高质量Q8_0到极低质量IQ1_M,满足不同硬件配置和性能需求。
mlx-community
这是DeepSeek-V3.1-Base模型的4位量化版本,使用mlx-lm工具转换而成,专门为Apple Silicon芯片优化,提供高效的大语言模型推理能力。
DeepSeek-V3.1是DeepSeek团队开发的大规模语言模型,支持思考模式和非思考模式,在多个基准测试中表现出色,具备强大的文本理解、生成和推理能力。
recursechat
DeepSeek-R1是通过大规模强化学习训练的推理模型,在数学、代码和推理任务上表现出色,无需监督微调即可展现强大的推理能力,包括自我验证、反思和生成长思维链等。
yanmyoaung04
这是基于Unsloth的DeepSeek-R1-Distill-Llama-8B模型微调的网络安全专用版本,专注于生成和理解网络安全相关内容,为威胁情报总结、漏洞分析等任务提供支持。
bobchenyx
这是DeepSeek-V3-0324的量化版本,采用特定量化方法处理,旨在不同场景下实现更高效的使用,支持多种量化规格以平衡性能与效率。
willcb
这是一个🤗 Transformers模型中心的模型卡片,由于缺乏具体信息,无法提供详细的模型介绍。建议查看原始模型页面获取完整信息。
Mungert
AceReason-Nemotron-7B是一款通过强化学习训练的数学和代码推理模型,基于DeepSeek-R1-Distilled-Qwen-7B开发,在多个推理基准测试中表现出色。
DeepSeek MCP服务器是一个为DeepSeek API设计的模型上下文协议服务器,支持与Claude Desktop等MCP兼容应用无缝集成,提供匿名API访问和智能对话管理。
DeepSeek MCP服务器项目,为Claude Desktop等应用提供匿名API代理服务,支持多轮对话和自动模型切换。
Unreal Engine生成式AI支持插件,集成多种前沿LLM/GenAI模型API,提供游戏开发中的AI集成层支持,包括OpenAI、Claude、Deepseek等模型的聊天、结构化输出等功能,并支持Model Control Protocol(MCP)实现场景对象控制、蓝图生成等高级功能。
结合DeepSeek推理与Claude生成的两阶段AI对话服务
Deepseek R1的MCP服务器实现,支持Node.js环境,提供强大的语言模型推理服务。
一个由Claude构建的DeepSeek推理服务项目
通过集成DeepSeek R1的推理引擎增强Claude的复杂任务处理能力
一个基于Model Context Protocol的AI导师服务器,通过Deepseek-Reasoning提供代码审查、设计评估、写作反馈和创意头脑风暴等第二意见服务
一个MCP服务器,允许Claude Code在需要深入分析复杂问题时咨询更强大的AI模型(如o3、Gemini 2.5 Pro、DeepSeek Reasoner)。
DeepClaude MCP是一个整合DeepSeek和Claude AI能力的服务器应用,通过双模型协同提供更强大的AI响应服务。
一个实现MCP协议的服务器,用于在Claude Desktop中集成Deepseek模型
Deepseek R1的MCP服务器实现,支持与Claude Desktop集成,提供强大的语言模型推理服务。
一个生产级MCP服务器,集成DeepSeek API,提供代码审查、文件管理、API账户管理等功能,支持多模型选择和JSON格式响应。
该项目通过集成DeepSeek R1的推理引擎增强Claude的复杂任务处理能力,提供多步骤精确推理支持。
一个基于DeepSeek API的MCP类服务器原型,提供终端命令执行和AI聊天集成功能。
一个基于DeepSeek-V3开发的MCP天气查询智能体项目,通过配置API密钥和运行客户端脚本来实现功能。
Deepseek Thinker MCP Server是一个提供Deepseek推理内容的MCP服务,支持OpenAI API和本地Ollama两种模式,可集成到AI客户端中。
结合DeepSeek推理与Claude生成能力的MCP服务
MCP DeepSeek演示项目是一个基于MCP协议的客户端应用,集成DeepSeek AI实现工具调用和实时通信,包含Next.js前端和SSE服务端。
本地化运行的智能代理系统,结合推理模型与工具调用模型