DeepSeek於2月11日灰度更新網頁端和APP端,14日正式官宣爲新長文本模型結構測試。此次更新支持最高100萬token超長上下文,知識庫更新至2025年5月。但API服務仍爲V3.2版本,僅支持128K上下文。業內視此次更新爲下一代V4模型發佈前的技術預熱和壓力測試,引發對V4的廣泛期待。更新後,DeepSeek的交互風格也發生明顯變化。
國產大模型GLM-5在2026年初實現重大突破,開源後在全球權威榜單Artificial Analysis中位列第四,評分與Claude Opus4.5相當。其核心創新包括:參數規模擴展至744B,預訓練數據達28.5T;集成DeepSeek稀疏注意力機制,在保持長文本理解能力的同時降低部署成本;在編程與工程領域表現突出。
樂奇AI眼鏡推出“自定義智能體”功能,支持開發者將私有模型直接接入眼鏡,打破硬件閉環生態。該功能強調開放與連接,通過標準化接口廣泛適配各類模型,推動AI眼鏡向深度定製化發展。
百度千帆推出AI編碼訂閱服務Coding Plan,覆蓋代碼編寫、邏輯理解及深度優化全流程,集成GLM-4.7和DeepSeek-V3.2等領先模型,支持一鍵切換,無需修改本地配置,提升開發效率。
AI Fiesta是一個讓您與世界頂尖AI模型如ChatGPT、Gemini Pro、Claude、Perplexity、Deepseek和Grok交流的平臺。
DeepSeek R1-0528 是一款開源大模型,性能媲美 OpenAI o3 模型。
基於DeepSeek R1和V3模型的瀏覽器側邊欄AI工具,提供問答、創作、翻譯等功能
DeepSeek-V3/R1 推理系統是一個高性能的分佈式推理架構,專為大規模 AI 模型優化設計。
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
$2
$20
$4
$16
Baidu
128
Bytedance
$1.2
$3.6
4
Dogacel
這是一個基於原始DeepSeek-OCR模型的優化版本,專門支持在蘋果金屬性能著色器(MPS)和CPU上進行推理的OCR模型。它能夠從圖像中提取文本並轉換為結構化格式,支持多語言文檔識別。
GilbertAkham
這是一個基於DeepSeek-R1-Distill-Qwen-1.5B的多任務微調模型,通過LoRA適配器在多個數據集上進行訓練,具備強大的多任務泛化和推理能力,能夠處理廣泛的自然語言和基於推理的任務。
strangervisionhf
這是一個基於DeepSeek-OCR的圖像文本識別模型,專門解決了在最新版本transformers庫中的兼容性問題,使模型能夠在transformers v4.57.1等最新版本中順利運行。
mlx-community
DeepSeek-OCR-8bit是基於DeepSeek-OCR模型轉換的MLX格式版本,專門針對蘋果芯片優化的視覺語言模型,支持多語言OCR識別和圖像文本理解任務。
DeepSeek-OCR-6bit是基於DeepSeek-OCR模型轉換的MLX格式版本,專門針對蘋果芯片優化。這是一個視覺語言模型,具備強大的光學字符識別能力,能夠從圖像中提取和識別文本信息。
quocnguyen
該模型是基於DeepSeek-OCR轉換的MLX格式視覺語言模型,專門用於光學字符識別(OCR)任務,支持多語言文本識別和圖像理解
這是一個基於DeepSeek-OCR模型轉換的MLX格式模型,支持多語言圖像文本識別和文本生成功能,專門針對OCR任務優化。
noctrex
這是DeepSeek-MoE-16B-Chat模型的MXFP4_MOE量化版本,專門針對文本生成任務進行了優化,提供了更高效的推理解決方案。
deepseek-ai
DeepSeek-OCR是DeepSeek AI開發的一款先進的光學字符識別模型,專注於探索視覺文本壓縮的邊界,能夠高效地從圖像中提取和轉換文本內容。
Thrillcrazyer
Qwen-1.5B_THIP是基於DeepSeek-R1-Distill-Qwen-1.5B在DeepMath-103k數學數據集上使用TRL框架進行GRPO方法微調的數學推理模型。該模型專門針對數學問題解決進行了優化,具備較強的數學推理能力。
moxin-org
本項目對DeepSeek-V3-0324進行了llama.cpp混合精度量化,解決了模型在邊緣設備上部署的難題,提升了模型的運行效率和資源利用率。
MikeKuykendall
這是DeepSeek公司的DeepSeek-MoE-16B模型的Q4_K_M量化版本,通過llama.cpp的Rust綁定啟用了MoE(專家混合)CPU卸載功能,顯著減少顯存使用。
kathywu95
這是一個基於DeepSeek-V3架構的隨機權重生成模型,專門用於測試和開發目的。模型使用隨機初始化的權重,參數規模經過精簡,適合快速原型開發和功能驗證。
QuantTrio
DeepSeek-V3.2-Exp-AWQ是基於DeepSeek-V3.2-Exp模型的量化版本,通過vLLM框架實現高效文本生成。該模型引入了DeepSeek稀疏注意力機制,在長上下文訓練和推理效率上有顯著提升,同時保持了模型輸出質量。
prithivMLmods
Mintaka-Qwen3-1.6B-V3.1是一個高效的、專注於科學推理的模型,基於Qwen-1.6B構建,並在DeepSeek v3.1合成軌跡(10,000條記錄)上進行訓練。它針對隨機事件模擬、邏輯問題分析和結構化科學推理進行了優化,在符號精度和輕量級部署之間取得了平衡。
BBQGOD
DeepSeek-GRM-16B 是一個基於 Self-Principled Critique Tuning (SPCT) 的生成式獎勵模型,能為查詢-響應生成透明的'原則→批判→分數'評估流程,可用於大語言模型的強化學習、評估和數據收集等任務。
DeepSeek-V3.1是基於DeepSeek-V3.1-Base進行後訓練的大型語言模型,具有128K上下文長度,支持混合思維模式、智能工具調用和代碼代理功能。該模型在多項基準測試中表現出色,特別在數學推理、代碼生成和搜索代理任務上有顯著提升。
ubergarm
基於DeepSeek-V3.1模型的GGUF格式量化版本,使用ik_llama.cpp分支進行最優量化。該模型在特定內存佔用下實現最佳困惑度表現,提供從IQ5_K到IQ1_S等多種量化方案,滿足不同內存和性能需求。
bartowski
這是DeepSeek-V3.1模型的量化版本,使用llama.cpp的imatrix技術進行量化處理,旨在提升模型在不同硬件上的運行效率和性能。該版本提供多種量化級別,從高質量Q8_0到極低質量IQ1_M,滿足不同硬件配置和性能需求。
unsloth
DeepSeek-V3.1是DeepSeek-AI開發的大語言模型,是DeepSeek-V3的升級版本。該模型支持混合思考模式和非思考模式,在工具調用、代碼生成、數學推理等方面表現出色,支持128K上下文長度。
DeepSeek MCP服務器是一個為DeepSeek API設計的模型上下文協議服務器,支持與Claude Desktop等MCP兼容應用無縫集成,提供匿名API訪問和智能對話管理。
DeepSeek MCP服務器項目,為Claude Desktop等應用提供匿名API代理服務,支持多輪對話和自動模型切換。
Unreal Engine生成式AI支持插件,集成多種前沿LLM/GenAI模型API,提供遊戲開發中的AI集成層支持,包括OpenAI、Claude、Deepseek等模型的聊天、結構化輸出等功能,並支持Model Control Protocol(MCP)實現場景對象控制、藍圖生成等高級功能。
一個實現MCP協議的服務器,用於在Claude Desktop中集成Deepseek模型
DeepClaude MCP是一個整合DeepSeek和Claude AI能力的服務器應用,通過雙模型協同提供更強大的AI響應服務。
MCP Toolz 是一個用於Claude Code的MCP服務器工具,支持跨會話保存上下文和待辦事項,並能獲取ChatGPT、Claude、Gemini和DeepSeek等多AI模型的反饋。
一個基於Node.js的Deepseek R1語言模型MCP服務器實現,支持8192令牌上下文窗口,提供穩定的Claude Desktop集成和模型參數配置。
Deepseek R1的MCP服務器實現,支持Node.js環境,提供強大的語言模型推理服務。
Deepseek R1的MCP服務器實現,支持與Claude Desktop集成,提供強大的語言模型推理服務。
一個生產級MCP服務器,集成DeepSeek API,提供代碼審查、文件管理、API賬戶管理等功能,支持多模型選擇和JSON格式響應。
一個MCP服務器,允許Claude Code在需要深入分析複雜問題時諮詢更強大的AI模型(如o3、Gemini 2.5 Pro、DeepSeek Reasoner)。
一個利用Deepseek R1模型的思維鏈進行推理的MCP服務工具,支持在Claude Desktop等客戶端中使用。
Second Opinion MCP是一個多AI模型諮詢平臺,允許用戶在Claude對話中即時獲取來自OpenAI、Gemini、Grok、Claude、HuggingFace、DeepSeek和OpenRouter等不同AI模型的第二意見,支持代碼對比、創意寫作、問題解決和跨模型分析等功能。
DeepSeek MCP服務器是一個為DeepSeek API設計的模型上下文協議服務器,支持與Claude Desktop等MCP兼容應用無縫集成,提供匿名API訪問、多輪對話支持和自動模型回退等功能。
一個使用DeepSeek-V3模型的MCP演示項目,通過命令行交互查詢天氣信息,支持獲取警報和天氣預報功能。
DeepSeek MCP服務器是一個用於連接DeepSeek API與MCP兼容應用(如Claude Desktop)的中間服務,支持多種模型參數配置和聊天功能。