快手が非技術ユーザー向けのAIデスクトップエージェント「KroWork」を発表。自然言語指示でファイル処理、ブラウザ自動化、アプリ生成などのオフィス業務をサポート。繰り返し作業をローカルアプリに変換可能で追加費用不要。全操作はセキュアなサンドボックス環境で実行され、データはクラウドにアップロードされずプライバシーを保護。....
テスラは、車載音声サービスにByteDanceのDoubao大規模言語モデルを統合し、DeepSeekChatがAIインタラクション機能を提供するデュアルモデル方式を採用。これにより、車載AI技術の現地化を推進。2025年8月のVolcano Engineとの提携に続く中国市場での重要なアップデートで、同社の市場での地位を強化する。....
アリババ・グランドは、自動車用AIエージェントを発表し、千問大モデルを基盤として、車載ナビゲーションの「受動的なコマンド応答」から「積極的な意図理解」への変革を実現しました。このシステムは「言語の脳」と「空間の脳」の二つのエンジン構造を採用しており、前者は日常言語を解釈し、後者は物理的な世界で意図を検証し、ルート資源とマッチングします。ユーザーがシステムにあわせるのではなく、システムがユーザーのニーズに合わせるという課題を解決し、スマートクォータの体験を向上させることを目的としています。
国家安全部はAI用語「トークン」の安全警告を発し、1日あたりの呼び出し量が140兆回を超え、データ漏洩と金融詐欺のリスクに警戒が必要と指摘。AI情報の最小単位として計量・価格設定・取引が可能なトークンは、スマート時代の「決済単位」となっている。2026年3月までに中国のトークン呼び出し量は2024年初頭比で1000倍以上増加し、応用場面がテキスト生成から拡大している。....
Melody Genieは1位のAI歌詞生成ツールで、7種類の専用ツールがあり、多言語と多数のアーティストのスタイルに対応しています。
無料のAIテキスト読み上げツールで、100種類以上のリアルな音声、50種類以上の言語に対応、登録なしで試用可能です。
Saveto AIは、150種類以上の言語を迅速かつ正確に文字起こしおよび翻訳でき、多様なシーンに適用されます。
AIエージェント専用の中国語コミュニティで、エージェントが自主的に投稿?コメント?相互作用を行うサイバーマンション
Google
$0.7
入力トークン/百万
$2.8
出力トークン/百万
1k
コンテキスト長
Anthropic
$7
$35
200
$21
$105
Alibaba
$2
$20
-
$3.9
$15.2
64
Moonshot
$4
$16
256
Bytedance
$0.8
128
Deepseek
$12
Tencent
$1
32
$0.75
Openai
$8.75
$70
400
$1.75
$14
$525
$0.63
$3.15
131
24
RinggAI
これは通話記録分析用に特別に開発された混合言語AIモデルで、ヒンディー語、英語、およびヒンディー語と英語の混合通話の文字起こし内容を処理できます。モデルはQwen2.5 - 1.5B - Instructをベースに微調整されており、強力な多言語理解と情報抽出能力を備えています。
bartowski
これはai-sageのGigaChat3-10B-A1.8Bモデルを定量処理したバージョンで、llama.cppのimatrix定量技術を採用し、さまざまなハードウェア条件下でより効率的に動作します。モデルはロシア語と英語をサポートし、主にテキスト生成タスクに使用されます。
prithivMLmods
VibeThinker-1.5Bは微博AIが開発した15億パラメータの密集型言語モデルで、Qwen2.5-Math-1.5Bをベースに微調整され、数学やアルゴリズムコーディングの問題に特化して設計されています。「スペクトルから信号への原理」のフレームワークを用いてトレーニングされ、複数の数学コンテストのテストでより大規模なモデルを上回り、トレーニングコストは約7800ドルで、最大約40kトークンの出力をサポートします。
allenai
Olmo 3はAllen Institute for AIによって開発された一連の言語モデルで、7Bと32Bの2種類の規模があり、命令式と思考式の2種類のバリエーションがあります。このモデルは長鎖思考に優れており、数学やコーディングなどの推論タスクの性能を効果的に向上させることができます。多段階訓練方式を採用しており、教師付き微調整、直接嗜好最適化、検証可能な報酬による強化学習が含まれます。
Olmo 3はAllen Institute for AIによって開発された全新型の言語モデルファミリーで、7Bと32Bの2種類の規模があり、指令(Instruct)と思考(Think)の2種類のバリエーションがあります。このモデルは長鎖型の思考を用いて、数学やコーディングなどの推論タスクの性能を向上させ、言語モデル科学の発展を推進することを目的としています。
Olmo 3 7B RL-Zero Mathは、Allen AIによって開発された、数学的推論タスクに特化して最適化された70億パラメータの言語モデルです。RL-Zero強化学習方法を用いて数学データセットで訓練され、数学的推論能力を効果的に向上させます。
Olmo-3-32B-Think-DPOはAllen AIが開発した32Bパラメータの言語モデルで、直接嗜好最適化(DPO)を用いて訓練され、長鎖的な思考推論能力を備え、数学やコーディングなどの複雑な推論タスクで優れた性能を発揮します。
unsloth
Qwen3-VL-2B-InstructはQwenシリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認知と推論能力、長いコンテキストサポート、強力な空間およびビデオ動的理解能力を備えています。このモデルは2Bのパラメータ規模を採用し、命令対話をサポートし、マルチモーダルAIアプリケーションに適しています。
nineninesix
KaniTTSは、リアルタイム対話型AIアプリケーション向けに最適化された高速、高音質のテキスト音声変換モデルです。2段階パイプラインを用いて、大規模言語モデルと高効率オーディオコーデックを組み合わせ、卓越した速度とオーディオ品質を実現します。このモデルはスペイン語をサポートし、4億のパラメータを持ち、サンプリングレートは22kHzです。
KaniTTSは、リアルタイム対話型人工知能アプリケーション向けに最適化された高速かつ高忠実度のアラビア語テキスト音声変換モデルです。2段階パイプラインアーキテクチャを採用し、大規模言語モデルと効率的なオーディオコーデックを組み合わせることで、卓越した速度とオーディオ品質を実現し、対話型AI、障害者支援、研究など多くの分野の音声合成ニーズを満たすことができます。
ApertusはスイスのAIによって開発された完全にオープンな多言語大規模言語モデルで、70億と80億の2種類のパラメータ規模を提供します。このモデルは1000種類以上の言語をサポートし、完全にコンプライアンスでオープンな学習データを使用し、その性能はクローズドソースモデルに匹敵します。Apertusは15Tのトークンで事前学習され、段階的なコース学習方法を採用し、最大65,536トークンのコンテキスト長をサポートします。
KaniTTSは、リアルタイム対話型AIアプリケーション向けに最適化された高速かつ高忠実度のテキスト音声変換モデルです。2段階のパイプラインアーキテクチャを採用し、大規模言語モデルと効率的なオーディオコーデックを組み合わせることで、卓越した速度と音質を実現し、複数の言語をサポートし、エッジ/サーバーデプロイメントに適しています。
Salesforce
CoDAはSalesforce AI Researchによって開発された拡散モデルに基づくコード生成言語モデルで、双方向コンテキスト理解能力を備え、強力なコード生成と補完タスク用に設計されています。このモデルはわずか17億のパラメータで、低い計算要件を維持しながら卓越したコード生成性能を実現しています。
Mungert
LFM2はLiquid AIによって開発された次世代のハイブリッドモデルで、エッジAIとデバイス端末のデプロイメントに特化して設計されており、品質、速度、メモリ効率の面で新しい基準を確立しています。このモデルは革新的なハイブリッドLiquidアーキテクチャを採用し、乗算ゲートと短い畳み込みを備えており、多言語処理をサポートしています。
geoffmunn
これはQwen/Qwen3-0.6B言語モデルのGGUF量子化バージョンで、6億のパラメータを持つコンパクトな大規模言語モデルで、低リソースデバイスでの超高速推論用に設計されています。llama.cpp、LM Studio、OpenWebUI、GPT4Allなどのフレームワークをサポートし、どこでもオフラインでプライベートAIを使用できます。
nvidia
NVIDIA Qwen3-8B FP4モデルは、アリババのQwen3-8Bモデルの量子化バージョンで、最適化されたTransformerアーキテクチャを採用した自己回帰型言語モデルです。このモデルはFP4量子化技術を使用し、パフォーマンスを維持しながらメモリ使用量と計算要件を大幅に削減し、AIエージェントシステム、チャットボット、RAGシステムなどのアプリケーションシナリオに適しています。
manuelcaccone
Gemma-3 ActuaryEnough2は精算分野に特化したAIモデルで、11,000以上の精算質問と回答のペアを使って微調整学習されており、簡単な保険の質問を厳密な精算専門用語に変換することができます。このモデルはActuaryEnoughをサポートし、オープンソース形式で教育や研究目的で公開されています。
NVIDIA-Nemotron-Nano-9B-v2はNVIDIAが最初から訓練した大規模言語モデルで、推論および非推論タスク用に設計されています。Mamba2-Transformer混合アーキテクチャを採用し、多言語処理をサポートし、制御可能な推論能力を備え、ユーザーが思考予算を指定でき、商用アプリケーションやAIエージェントシステムで優れた性能を発揮します。
mlx-community
GLM-4.5-Air-6bitは、智譜AIのGLM-4.5-Airモデルを変換した6ビット量子化バージョンで、MLXフレームワーク用に最適化され、大規模言語モデルの高効率な推論能力を提供します。
GLM-4.5-Air-8bitは、智譜AIのGLM-4.5-Airモデルから変換された8ビット量子化バージョンで、MLXフレームワーク用に特別に最適化されています。このモデルは、オリジナル版の強力な自然言語処理能力を維持しながら、量子化技術によってメモリ使用量と計算要件を削減し、Apple Siliconデバイスで効率的に動作するのに適しています。
Redis MCPサーバーは、Redis用に設計された自然言語インターフェースサービスで、AIエージェントが自然言語でRedisデータをクエリし管理でき、MCPプロトコルを統合し、複数のデータ構造と検索機能を提供します。
LangCare MCP FHIRサーバーは、企業レベルのMCPサーバーで、FHIR R4電子カルテシステム用に設計されており、AIアシスタントが患者の健康記録に安全にアクセスし管理できるようにします。4種類の汎用FHIR操作ツールを提供し、40種類以上の臨床ワークフローガイドと対話型UIアプリケーションを内蔵し、EPIC、Cerner、GCPなどの複数のバックエンドをサポートし、Go言語で記述されており、企業レベルのセキュリティとHIPAAコンプライアンスを備えています。
AIとKubernetes管理を組み合わせたインテリジェントなシステムで、自然言語対話を通じてクラスターの診断、リソースの監視、およびログ分析を実現し、K8sの運用を簡素化します。
Gossiphsは、ゼロコンフィグ、高性能の汎用コードファイル関係分析ツールで、複数のプログラミング言語をサポートし、tree - sitterとgitに基づいて分析を行い、Python SDKとMCPプロトコルをサポートし、AIとの統合を容易にします。
Rustを用いて開発されたローカライズされたAI財務管理システムで、自然言語入力、インテリジェント分析、税務計算、債務追跡をサポートし、すべてのデータはローカルのSQLiteデータベースに保存されます。
Blender用MCP-Linkは、BlenderをAIで制御可能な3D創作プラットフォームに変換するプラグインです。モデルコンテキストプロトコル(MCP)を通じて、Blenderの完全なPython APIをAIエージェントに公開し、自然言語でBlenderの操作を制御できます。
Postmancerは、AIアシスタント用に設計されたMCPサーバーで、自然言語でRESTful APIとのやり取りをサポートします
AiryLark MCPは専門レベルの翻訳サービスインターフェースで、三つの段階からなるプロセスにより翻訳品質を保証し、多言語間の相互翻訳と分野用語の識別をサポートし、技術文書、学術論文などの専門シナリオに適しています。
AgentRPCは、ネットワークと言語の境界を越えてAIエージェントの関数呼び出しを接続するための汎用的なRPC層です。
OLS MCPサーバーは、大型言語モデルにオントロジ照会サービスを提供するツールで、EBIオントロジ照会サービスAPIに接続することで、AIアシスタントが生物医学分野のオントロジ用語、概念、階層構造を正確に取得するのを支援します。
AivisSpeechテキスト読み上げエンジン用に設計されたMCPサーバー。日本語音声合成、複数の音声キャラクター選択、パラメータ設定をサポートし、AIアシスタントとのシームレスな統合を実現します。
これはMCPプロトコルに基づく『コーラン』検索エンジンサーバーで、AIアシスタントに正確で幻想のない『コーラン』の経文照会サービスを提供することを目的としています。専用の検索エンジンを利用してアラビア語の標準化、語根と語形の一致を処理し、返される経文テキストの絶対的な正確性を保証し、AIはユーザーの自然言語クエリの意図を理解するだけです。
Prefect用に設計されたMCPサーバーで、AIアシスタントが自然言語でPrefectと対話でき、フロー管理、デプロイ管理などの複数の機能をサポートします。
Axiomデータプラットフォーム用に実装されたModel Context Protocolサーバーで、AIエージェントがAPLクエリ言語を通じてデータにアクセスできます
剪映ビデオ制作MCPサーバーはModel Context Protocolに基づく自動化ツールで、AIアシスタントが自然言語で専門的なビデオコンテンツを作成できるようにし、自動的に剪映の草稿を作成し、素材を追加し、エフェクトを適用し、プロジェクトファイルをエクスポートすることをサポートします。
SolidPilotはオープンソースのSolidWorks AIアシスタントで、モジュール式アーキテクチャを採用し、MCPプロトコルを通じてClaudeなどのローカル言語モデルとやり取りします。Python層、C#アダプター層、COMブリッジなどの技術コンポーネントを含んでいます。
MS SQL MCPサーバーは、コーディング不要のブリッジツールで、AIアシスタントが直接Microsoft SQL Serverデータベースをクエリし、探索できます。データベースの発見、テーブル構造の表示、安全な読み取り専用SQLクエリの実行、自然言語からSQLへの変換機能をサポートしています。
このプロジェクトは、Model Context Protocol (MCP) 標準に基づくドキュメント処理サーバーです。ベクトルデータベースと MCP インターフェースを構築することで、AI アシスタントが外部のドキュメントリソースにアクセスできるようにし、大規模言語モデルの知識制限を突破します。プロジェクトにはドキュメント処理パイプラインと MCP サーバーの 2 つの主要コンポーネントが含まれており、複数の埋め込みモデルとファイル形式をサポートし、最新の技術ドキュメントの検索やプライベートコードベースの理解などのシナリオに適用できます。
このプロジェクトは、大規模言語モデル(LLM)やその他のAIエージェント用に設計されたサーバーツールで、電子健康記録(EHR)と安全に対話するためのものです。SMART on FHIR標準を通じて安全なデータアクセスを実現し、モデルコンテキストプロトコル(MCP)を利用してツールセットを提供し、AIと多様なEHRシステムの間の安全なゲートウェイおよびツールパッケージとして機能します。
markymarkはMarkdownや構造化データファイル用の言語サーバーとAIエージェントツールで、ナビゲーション、リファクタリング、検索、診断機能を提供し、LSPとMCPプロトコルをサポートします。