騰訊が自社開発の大型モデル「混元2.0(Tencent HY2.0)」を正式にリリースし、同時にDeepSeek V3.2も段階的に騰訊エコシステムに統合されました。現在、この2つのモデルは元宝、imaなどの騰訊のAIネイティブアプリで最初にローンチされており、騰訊クラウドも関連モデルのAPIおよびプラットフォームサービスを同時に公開しています。新たにリリースされたTencent HY2.0はミックスエキスパート(MoE)アーキテクチャを採用しており、総パラメータ数は4...
小米はAI大規模モデルを今後10年のコア戦略に位置付け、過去4四半期の投資増加率は50%超と予想を上回る進展。世界的人材募集を開始し、最高年収1000万元で人材不足を補完。元DeepSeek幹部の加入でMiMoチームが発足。....
快手クェルンAIは2.6バージョンをリリースし、"音画同出"機能を実現しました。一度に画面、音声、サウンド効果および環境雰囲気を生成できるため、コンテンツ制作の効率が向上します。
DeepSeek-V3.2正式版と極限推論版が同時リリース。Web、アプリ、APIをワンクリックで切り替え可能。最大の特徴は「思考プロセス」と「ツール呼び出し」の深層統合で、長鎖推論と効率的タスク実行を両立。....
AI Fiestaは、ChatGPT、Gemini Pro、Claude、Perplexity、Deepseek、Grokなどの世界トップレベルのAIモデルと交流できるプラットフォームです。
DeepSeek R1-0528はオープンソースの大規模モデルで、OpenAI o3モデルに匹敵するパフォーマンスを持っています。
DeepSeek R1およびV3モデルに基づくブラウザサイドバーAIツールで、質疑応答、創作、翻訳などの機能を提供します。
DeepSeek-V3/R1推論システムは大規模AIモデルの最適化向けに設計された高性能な分散推論アーキテクチャです。
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
Baidu
128
$4
$16
$2
$20
Dogacel
これは、元のDeepSeek-OCRモデルをベースにした最適化バージョンで、Appleのメタルパフォーマンスシェーダー(MPS)とCPUでの推論をサポートするOCRモデルです。画像からテキストを抽出し、構造化された形式に変換することができ、多言語のドキュメント認識をサポートします。
GilbertAkham
これはDeepSeek-R1-Distill-Qwen-1.5Bをベースとしたマルチタスク微調整モデルで、LoRAアダプタを使用して複数のデータセットで訓練され、強力なマルチタスク汎化と推論能力を備え、幅広い自然言語と推論ベースのタスクを処理できます。
strangervisionhf
これはDeepSeek - OCRに基づく画像テキスト認識モデルで、最新バージョンのtransformersライブラリでの互換性問題を特別に解決し、モデルがtransformers v4.57.1などの最新バージョンでスムーズに動作できるようにします。
sanchezalonsodavid17
これはDeepSeek-OCRのモーダルバランス量子化(MBQ)バリエーションで、ビジュアルエンコーダに4ビットNF4量子化を採用することでメモリ使用量を削減し、同時にプロジェクターと言語/デコーダのBF16精度を維持し、一般的なGPUでのローカルデプロイメントと高速なCPU試験が可能です。
mlx-community
DeepSeek-OCR-8bitは、DeepSeek-OCRモデルを変換したMLX形式のバージョンで、Appleチップに特化して最適化されたビジュアル言語モデルで、多言語OCR認識と画像テキスト理解タスクをサポートします。
DeepSeek-OCR-6bitは、DeepSeek-OCRモデルを変換したMLX形式のバージョンで、Appleチップ向けに最適化されています。これは視覚言語モデルで、強力な光学文字認識能力を備え、画像からテキスト情報を抽出および認識することができます。
quocnguyen
このモデルはDeepSeek-OCRを基に変換されたMLX形式のビジュアル言語モデルで、光学文字認識(OCR)タスクに特化しており、多言語のテキスト認識と画像理解をサポートします。
これはDeepSeek-OCRモデルを変換したMLX形式のモデルで、多言語の画像テキスト認識とテキスト生成機能をサポートし、OCRタスクに特化して最適化されています。
noctrex
これはDeepSeek-MoE-16B-ChatモデルのMXFP4_MOE量子化バージョンで、テキスト生成タスクに特化して最適化され、より効率的な推論ソリューションを提供します。
deepseek-ai
DeepSeek-OCRはDeepSeek AIが開発した高度な光学文字認識モデルで、視覚テキスト圧縮の限界を探求し、画像からテキスト内容を効率的に抽出および変換できます。
Thrillcrazyer
Qwen-1.5B_THIPは、DeepSeek-R1-Distill-Qwen-1.5Bをベースに、DeepMath-103k数学データセット上でTRLフレームワークを使用してGRPO方法で微調整された数学的推論モデルです。このモデルは、数学問題の解決に特化して最適化されており、強力な数学的推論能力を備えています。
moxin-org
このプロジェクトでは、DeepSeek-V3-0324に対してllama.cppの混合精度量子化を行い、モデルのエッジデバイスへのデプロイの難題を解決し、モデルの実行効率とリソース利用率を向上させました。
MikeKuykendall
これはDeepSeek社のDeepSeek - MoE - 16BモデルのQ4_K_M量子化バージョンで、llama.cppのRustバインディングを通じてMoE(専門家混合)のCPUオフロード機能が有効になっており、VRAMの使用量を大幅に削減します。
kathywu95
これはDeepSeek - V3アーキテクチャに基づくランダムウェイト生成モデルで、テストと開発目的に特化しています。モデルはランダムに初期化されたウェイトを使用し、パラメータ規模が削減されており、迅速なプロトタイプ開発と機能検証に適しています。
QuantTrio
DeepSeek-V3.2-Exp-AWQはDeepSeek-V3.2-Expモデルに基づく量子化バージョンで、vLLMフレームワークを通じて効率的なテキスト生成を実現します。このモデルはDeepSeek疎な注意力メカニズムを導入し、長文脈の訓練と推論の効率を著しく向上させると同時に、モデルの出力品質を維持しています。
prithivMLmods
Mintaka-Qwen3-1.6B-V3.1は、科学的推論に特化した効率的なモデルで、Qwen-1.6Bをベースに構築され、DeepSeek v3.1合成軌跡(10,000件の記録)で訓練されました。ランダムイベントのシミュレーション、論理問題の分析、構造化された科学的推論に最適化されており、記号精度と軽量デプロイのバランスを取っています。
BBQGOD
DeepSeek-GRM-16BはSelf-Principled Critique Tuning (SPCT)に基づく生成型報酬モデルで、クエリ-応答に対して透明な「原則→批判→スコア」の評価プロセスを生成し、大規模言語モデルの強化学習、評価、データ収集などのタスクに使用できます。
DeepSeek-V3.1はDeepSeek-V3.1-Baseをベースに事後学習を行った大規模言語モデルで、128Kのコンテキスト長を持ち、混合思考モード、スマートツール呼び出し、コードエージェント機能をサポートしています。このモデルは複数のベンチマークテストで優れた成績を収めており、特に数学的推論、コード生成、検索エージェントタスクで顕著な向上が見られます。
ubergarm
DeepSeek-V3.1モデルに基づくGGUF形式の量子化バージョンで、ik_llama.cppブランチを使用して最適な量子化を行います。このモデルは特定のメモリ使用量で最適な困惑度を達成し、IQ5_KからIQ1_Sまでのさまざまな量子化スキームを提供し、さまざまなメモリとパフォーマンスの要件を満たします。
bartowski
これはDeepSeek-V3.1モデルの量子化バージョンで、llama.cppのimatrix技術を使用して量子化処理を行い、さまざまなハードウェアでのモデルの実行効率とパフォーマンスを向上させることを目的としています。このバージョンでは、高品質のQ8_0から極低品質のIQ1_Mまで、さまざまな量子化レベルを提供し、さまざまなハードウェア構成とパフォーマンス要件を満たします。
DeepSeek MCPサーバーは、DeepSeek API用に設計されたモデルコンテキストプロトコルサーバーで、Claude DesktopなどのMCP互換アプリとシームレスに統合でき、匿名APIアクセスとスマートな対話管理を提供します。
DeepSeek MCPサーバープロジェクトは、Claude Desktopなどのアプリケーションに匿名APIプロキシサービスを提供し、多輪対話と自動モデル切り替えをサポートします。
Unreal Engineの生成型AIサポートプラグインで、最新のLLM/GenAIモデルAPIを統合し、ゲーム開発におけるAI統合層のサポートを提供します。OpenAI、Claude、Deepseekなどのモデルのチャット、構造化出力などの機能を備え、Model Control Protocol(MCP)をサポートしてシーンオブジェクトの制御やブループリントの生成などの高度な機能を実現します。
MCPプロトコルを実装したサーバーで、Claude DesktopにDeepseekモデルを統合するために使用されます。
MCP DeepSeekデモプロジェクトは、MCPプロトコルに基づくクライアントアプリケーションで、DeepSeek AIを統合してツール呼び出しとリアルタイム通信を実現しています。Next.jsフロントエンドとSSEサーバーを含んでいます。
Node.jsベースのDeepseek R1言語モデルのMCPサーバー実装で、8192トークンの文脈ウィンドウをサポートし、安定したClaude Desktop統合とモデルパラメータ設定を提供します。
Deepseek R1モデルの思考チェーンを利用して推論を行うMCPサービスツールで、Claude Desktopなどのクライアントで使用できます。
DeepSeek APIを統合した本番レベルのMCPサーバーで、コードレビュー、ファイル管理、APIアカウント管理などの機能を提供し、多モデル選択とJSON形式の応答をサポートします。
Deepseek R1のMCPサーバー実装で、Node.js環境をサポートし、強力な言語モデル推論サービスを提供します。
MCPサーバーは、Claude Codeが複雑な問題の深い分析が必要なときに、o3、Gemini 2.5 Pro、DeepSeek Reasonerなどのより強力なAIモデルに相談できるようにします。
Deepseek R1のMCPサーバー実装で、Claude Desktopとの統合をサポートし、強力な言語モデル推論サービスを提供します。
DeepClaude MCPは、DeepSeekとClaudeのAI能力を統合したサーバーアプリケーションで、デュアルモデルの協調により、より強力なAI応答サービスを提供します。
DeepSeek MCPサーバーは、DeepSeek API用に設計されたモデルコンテキストプロトコルサーバーで、Claude DesktopなどのMCP互換アプリとシームレスに統合でき、匿名APIアクセス、多輪会話サポート、自動モデルバックアップなどの機能を提供します。
DeepSeek - V3モデルを使用したMCPデモプロジェクトで、コマンドラインで対話して天気情報を照会し、警報や天気予報の取得機能をサポートします。
DeepSeek MCPサーバーは、DeepSeek APIとMCP互換アプリケーション(Claude Desktopなど)を接続する中間サービスで、複数のモデルパラメーター設定とチャット機能をサポートしています。
Second Opinion MCPは、複数のAIモデルを利用した相談プラットフォームで、ユーザーがClaudeの会話中にOpenAI、Gemini、Grok、Claude、HuggingFace、DeepSeek、OpenRouterなどのさまざまなAIモデルから即座にセカンドオピニオンを取得できます。コード比較、クリエイティブライティング、問題解決、モデル間分析などの機能をサポートしています。
Model Context Protocol (MCP)に基づくサーバーで、DeepSeek - R1の推論機能にアクセスでき、非推論モデルが強化された思考によってより良い応答を生成できるようにします。