情報

AIニュース

AIの最先端を探索、業界トレンドを完全マスター

AIニュース日報

毎日更新！AIホットトピックス＆業界最前線

情報

AIツールを探す

精確な製品選定＆多角的市場調査

AI製品ランキング

話題のAI製品総合力＆バズ度ランキング（年間/月間/デイリー）

AIプロダクト登録

AI製品を登録して、認知度アップ＆ユーザー獲得を加速！

ツール

AIツールディレクトリ

AIツール総合ナビ！あなたにピッタリのツールが見つかる

情報

AIモデルファインダー

全種類AIモデル完備！開発から研究まで、あなたのニーズを完全サポート

LLMプロバイダー

信頼できるAIモデルパートナーを見つけよう！安心のサポート体制

AIモデル登録

AIモデル・サービスを登録して、ターゲットユーザーに確実にリーチ！

ツール

LLM比較選定

AI大規模モデル徹底比較！あなたにピッタリのモデルが見つかる

LLMコスト計算機

AIモデルのコストを正確に把握！スマートな予算計画で無駄を削減

LLMアリーナ

マルチモデルリアルタイム評価、モデル出力結果迅速比較

情報

MCPサーバー

人気AI-MCPサービスを集約、あなたに適したサービスを迅速発見

MCPクライアント

MCPクライアントに簡単接続、強力なAI機能を呼び出し

MCPケースチュートリアル

MCP使用テクニックを学習、入門から上級まで

MCPランキング

人気MCPサービス性能ランキング、最適選択をサポート

MCPサービス提出

あなたのMCPサービスを公開・プロモーション

ツール

MCP実験場

MCPサービスを自由にテスト、オンラインで迅速体験

MCPインスペクター

MCPサービス迅速テスト、迅速リリース

GEO順位最適化サービス

GEOサービスにより、御社の企業やブランドのAI検索における支配的な表示を実現

AIデータセット

AI計算力

AIチュートリアル

硅基モーションがDeepSeek-R1などの推論モデルAPIをアップグレードし、128Kの上下文長さをサポート

AIbase基地

公開日AIニュース · 1 分で読めます · May 22, 2025

シリコンクラウド（SiliconCloud）は、その DeepSeek-R1を含む推論モデルAPIについて重要なアップデートを行いました。このアップデートでは、開発者が長期間の文脈と柔軟なパラメータ設定に対応できるようにすることが目的です。今回のアップデートでは、複数の推論モデルの最大文脈長が128Kに拡張され、モデルがより十分に思考し、出力内容もさらに完成度が高くなりました。

今回のアップデートでは、Qwen3やQWQ、GLM-Z1などの有名なモデルが最大文脈長128Kをサポートしており、DeepSeek-R1は96Kをサポートしています。この改善により、コード生成やエージェントアプリケーションなど複雑な推論タスクに強力な支援を提供します。

さらに重要なのは、シリコンクラウドが「思考チェーン」（思考過程）と「応答内容」の長さを個別に制御できる機能を導入したことです。この方法により、開発者はモデルの推論能力をより効果的に活用できます。最大応答長（max_tokens）は現在、ユーザーに提供される最終的な出力を制限するために使用され、思考予算（thinking_budget）はモデルの思考プロセス中のトークン使用量を専門的に制御します。このような設計により、開発者は実際のタスクの複雑さに応じて、モデルの思考深さと出力長を柔軟に調整することができます。

例えば、シリコンクラウドプラットフォームのQwen3-14Bを使用する場合、ユーザーはthinking_budgetとmax_tokensを設定することで、それぞれモデルの最大思考チェーン長と最大応答長を制御できます。推論の過程で、思考段階で生成されたトークン数がthinking_budgetに達すると、Qwen3シリーズの推論モデルは思考チェーン推論を強制終了します。他の推論モデルの場合には、考え中の内容を続ける可能性があります。

また、最大応答長がmax_tokensを超えるか、文脈長がcontext_lengthの制限を超えてしまう場合、モデルの応答内容は切断され、応答内のfinish_reasonフィールドにはlengthが記載され、長さ制限による出力終了であることが示されます。

APIの詳細については、シリコンクラウドの公式ドキュメントをご覧ください。シリコンクラウドの継続的な革新により、ユーザー体験はさらに向上し、多くの新機能が順次リリースされます。

https://docs.siliconflow.cn/ja/userguide/capabilities/reasoning

ポイント:

🔹 最大128Kの文脈長をサポートし、モデルの思考力と出力能力を向上させます。

🔹 思考チェーンと応答内容の長さを個別に制御でき、開発者の柔軟性を向上させます。

🔹 長さ制限に達すると、モデルの出力が切断され、その理由が明示されます。

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成