快手が非技術ユーザー向けのAIデスクトップエージェント「KroWork」を発表。自然言語指示でファイル処理、ブラウザ自動化、アプリ生成などのオフィス業務をサポート。繰り返し作業をローカルアプリに変換可能で追加費用不要。全操作はセキュアなサンドボックス環境で実行され、データはクラウドにアップロードされずプライバシーを保護。....
アリババグループの百霊大規模モデルチームは、本日、パラメータ数が1兆に達するフラッグシップモデル「Ling-2.6-1T」をオープンソース化しました。このモデルはパラメータの積み重ねを追求せず、命令実行、ツール適応、長いコンテキスト能力の最適化に重点を置いています。革新的なハイブリッドアーキテクチャにより、強化学習報酬戦略を活用してトークンコストを削減し、効率的な「高速思考」メカニズムを実現しています。....
アリババは、企業の生産から個人のモバイルまで全シーンをカバーするAIエージェント製品「QoderWake」と「Qoderモバイル版」を発表。QoderWakeは生産向けデジタル従業員としてソフトウェアエンジニアや運営業務を担い、「デジタルプログラマー」役割が社内で活用され、コード変更の概要整理などを自律実行する。....
テンセントWorkBuddyエージェントがチャイナユニコムクラウドと提携し、AIクラウドデスクトップに事前統合。算力とアルゴリズムを融合し、事前設定・高コンプライアンス・自律タスク実行可能なクラウドオフィスエコシステムを構築。従来のオフィス環境の複雑な導入や長期デバッグ問題を解決し、企業や開発者の利用障壁を低減。....
オープンソースのLLMルーターで、リクエストを最も費用対効果の高いモデルにルーティングし、AIトークンコストを70%節約します。
TelegramにワンクリックでOpenClawをデプロイ。サーバーや技術知識不要。プライベートAIアシスタントが24時間稼働
オープンソースの自ホスト型個人用AIアシスタントで、スケジュール管理や数百のプラットフォームの統合が可能で、データのプライバシーを保護します。
サンダースピーク AI 音声入力ソフト。タイピングより4倍速く、創作効率を向上。
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
Baidu
128
$6
$24
$2
$20
$4
$16
bartowski
これはp-e-w/gpt-oss-20b-hereticモデルの量子化バージョンで、llama.cppのimatrix技術を使用して量子化処理が行われています。このモデルは200億パラメータの大規模言語モデルで、高品質から低品質まで様々な量子化オプションを提供し、ファイルサイズは41.86GBから11.52GBまでで、さまざまなハードウェア条件に適しています。
これはPrecog-123B-v1モデルのllama.cpp量化バージョンで、さまざまなハードウェア構成と使用シナリオのニーズに応えるために、複数の量化タイプを提供しています。このモデルは1230億のパラメータを持つ大型言語モデルで、最適化されているため、さまざまなハードウェアで効率的に動作します。
samwell
NV-Reason-CXR-3B GGUFはNVIDIA NV-Reason-CXR-3Bビジュアル言語モデルの量子化バージョンで、エッジデバイスへのデプロイに最適化されています。これは30億パラメータのモデルで、胸部X線分析に特化しており、GGUF形式に変換され、量子化処理が施されているため、モバイルデバイス、デスクトップデバイス、組み込みシステムで効率的に動作します。
allenai
Olmo 3は、Allen Institute for AI (Ai2)によって開発された全く新しい32Bパラメータの言語モデルファミリーで、Base、Instruct、Thinkなどのバリエーションが含まれています。このモデルはDolma 3データセットを基に訓練され、65,536の長文脈処理をサポートし、言語モデル科学の発展を推進することを目的としています。モデルは完全にオープンソースで、Apache 2.0ライセンスに従っています。
unsloth
Qwen3-VLは通義シリーズで最も強力なビジュアル言語モデルで、テキスト理解と生成、ビジュアル認知と推論、コンテキスト長、空間およびビデオの動的理解、エージェントインタラクション能力などの面で全面的にアップグレードされています。このモデルは密集アーキテクチャとハイブリッドエキスパートアーキテクチャを提供し、エッジデバイスからクラウドまでの柔軟なデプロイをサポートします。
Qwen3-VLはアリババが開発した新世代のビジュアル言語モデルで、テキスト理解、ビジュアル感知、空間理解、長文脈処理、エージェントインタラクションなどの分野で全面的にアップグレードされ、エッジデバイスからクラウドまで柔軟にデプロイできます。
SadraCoding
SDXL-Deepfake-Detectorは、AI生成顔を正確に検出するツールで、デジタル世界の真実性を維持することに特化し、視覚的な虚偽情報に対抗するためのプライバシー保護とオープンソースのソリューションを提供します。このモデルは、事前学習モデルを微調整することで、軽量かつ高精度な検出を実現します。
本プロジェクトはQwen3-VL-32B-Instructモデルに基づくllama.cpp GGUF量子化バージョンで、様々な量子化タイプを提供して異なるハードウェアと性能要件を満たします。特定のデータセットとimatrixオプションを組み合わせて量子化を行い、量子化の品質を保証し、ARMとAVXマシンの性能を向上させるためにオンラインで重みを再パッケージ化することをサポートします。
Granite-4.0-H-350MはIBMが開発した軽量指令モデルで、350Mのパラメータを持ち、多言語処理と指令遵守において優れた性能を発揮し、デバイス端末デプロイと研究シナリオ向けに設計されています。
sanchezalonsodavid17
これはDeepSeek-OCRのモーダルバランス量子化(MBQ)バリエーションで、ビジュアルエンコーダに4ビットNF4量子化を採用することでメモリ使用量を削減し、同時にプロジェクターと言語/デコーダのBF16精度を維持し、一般的なGPUでのローカルデプロイメントと高速なCPU試験が可能です。
TheStageAI
TheWhisper-Large-V3-Turboは、OpenAI Whisper Large V3モデルの高性能ファインチューニング版で、TheStage AIによって多プラットフォームのリアルタイム、低遅延、低消費電力の音声テキスト変換推論に最適化されています。ストリーミング文字起こし、単語のタイムスタンプ、拡張可能なパフォーマンスをサポートし、リアルタイム字幕、会議、デバイス端末の音声インターフェイスなどのシーンに適しています。
maomao0819
BEVANetは、リアルタイムセマンティックセグメンテーション用に設計されたディープラーニングモデルで、Cityscapesなどのデータセットで優れた性能を発揮し、RTX3090で81.0%のmIoUと32.8FPSの優れた性能を達成し、精度と速度のバランスを保っています。
mlx-community
LFM2-8B-A1Bは、Appleシリコンチップ用に最適化された8ビット量子化のMLX構築バージョンで、エキスパート混合(MoE)アーキテクチャを採用し、総パラメータは約80億、各トークンのアクティブパラメータは約10億で、デバイス端での高速推論をサポートします。
nvidia
NVIDIA GPT-OSS-120B Eagle3は、OpenAIのgpt-oss-120bモデルをベースに最適化されたバージョンで、ハイブリッドエキスパート(MoE)アーキテクチャを採用し、総パラメータ数が1200億、アクティブなパラメータ数が50億です。このモデルは商用および非商用の使用をサポートし、テキスト生成タスクに適しており、特にAIエージェントシステムやチャットボットなどのアプリケーション開発に適しています。
QuantTrio
Qwen3-VL-30B-A3B-Thinking-AWQは、Qwen/Qwen3-VL-30B-A3B-Thinkingモデルを量子化したバージョンで、通義シリーズの中で最も強力な視覚言語モデルです。このバージョンは、テキスト理解と生成、視覚知覚と推論、コンテキスト長、空間およびビデオの動的理解、エージェントインタラクション能力などの面で全面的にアップグレードされています。
nineninesix
KaniTTSは、リアルタイム対話型AIアプリケーション向けに最適化された高速かつ高忠実度のテキスト音声変換モデルです。2段階のパイプラインアーキテクチャを採用し、大規模言語モデルと効率的なオーディオコーデックを組み合わせることで、卓越した速度と音質を実現し、複数の言語をサポートし、エッジ/サーバーデプロイメントに適しています。
mradermacher
Zen-Eco-4B-Instructは4Bパラメータの大規模言語モデルで、指令追従とツール使用のシナリオに特化して最適化されています。本プロジェクトでは、このモデルの複数のGGUF量子化バージョンを提供し、さまざまな精度と性能要件をサポートし、さまざまなハードウェアでのデプロイと使用を容易にします。
VLA-Adapter
VLA-Adapterは、Libero-Spatial上で訓練されたマイクロビジョン言語アクションモデルで、Prismatic-VLMアーキテクチャを採用し、大規模言語モデルのバックボーンとしてQwen2.5-0.5Bのみを使用しています。このモデルは、ロボットのベンチマークテストで、パラメータ規模がより大きいオープンソースのVLAモデルを上回り、高性能なビジョン - 言語 - アクションの理解と実行を実現しています。
quelmap
Lightning-4bは、ローカルデバイスのデータ分析タスク用に設計・学習された言語モデルで、16GBメモリのノートパソコンでもスムーズに動作し、データを大規模言語モデルプロバイダーに送信する必要がなく、データのプライバシーとセキュリティを確保します。
google
VaultGemmaは、Googleが差分プライバシー技術に基づいて事前学習した軽量言語モデルで、強力なプライバシー保護機能を備えています。差分プライバシーランダム勾配降下法(DP - SGD)を用いて事前学習を行い、学習データに数学的なプライバシー保証を提供します。パラメータは10億未満で、様々な自然言語処理タスクに適しています。
assistant-uiは、生産レベルのAIチャットインターフェイスを迅速に構築するためのオープンソースのTypeScript/Reactライブラリで、組み合わせ可能なUIコンポーネント、ストリーミング応答、アクセシビリティなどの機能を提供し、複数のAIバックエンドとモデルをサポートしています。
これは、ブラウザ制御、芸術と文化、クラウドプラットフォーム、コマンドライン、通信、顧客データプラットフォーム、データベース、開発者ツール、データサイエンスツール、ファイルシステム、金融とフィンテック、ゲーム、知識と記憶、位置サービス、マーケティング、監視、検索、ユーティリティツールなど、複数のカテゴリをカバーする、継続的に更新されるMCPサーバーの選りすぐりのリストです。各プロジェクトにはGitHubリンクとスター数が付属しており、ユーザーがすぐに理解して使用できるようになっています。
Refact AgentはオープンソースのAIプログラミングアシスタントで、多言語のコード生成、デバッグ、最適化をサポートし、主流の開発ツールと統合し、ローカルにデプロイでき、スマートなコード補完とコード解釈機能を提供します。
Apify MCPサーバーは、モデルコンテキストプロトコル(MCP)に基づくツールで、AIアシスタントが数千の既成のクローラー、スクレイパー、自動化ツール(Apifyアクター)を通じて、ソーシャルメディア、検索エンジン、電子商取引などのウェブサイトからデータを抽出できるようにします。OAuthとSkyfireプロキシ支払いをサポートしており、HTTPSエンドポイントまたはローカルのstdio方式でClaude、VS CodeなどのMCPクライアントに統合できます。
OpenDiaはオープンソースのブラウザ拡張ツールで、AIモデルが直接ユーザーのブラウザを制御でき、既存のログイン状態、ブックマークなどのデータを利用して自動化操作を行います。複数のブラウザとAIモデルをサポートし、プライバシー保護に配慮しています。
MCPアトラシアンは、アトラシアンの製品(ConfluenceとJira)用に設計されたモデルコンテキストプロトコルサーバーで、クラウドとオンプレミスの両方のデプロイをサポートし、AIアシスタントの統合機能を提供します。
このプロジェクトは、Sonar APIを統合したMCPサーバーの実装で、Claudeにリアルタイムのネットワーク検索機能を提供します。システムアーキテクチャ、ツールの設定、Dockerデプロイ、およびマルチプラットフォーム統合ガイドが含まれています。
MCP Unityは、Model Context Protocolを実装したUnityエディター拡張で、Node.jsサーバーを通じてAIアシスタントとUnityプロジェクトのインタラクションを橋渡しし、メニュー実行、オブジェクト選択、コンポーネント更新などの機能を提供します。
FinLab AIは金融定量分析プラットフォームで、AI技術を通じてユーザーが投資戦略の超過収益(アルファ)を発見するのを支援します。豊富なデータセット、バックテストフレームワーク、および戦略サンプルを提供し、自動化されたインストールと主流のAIプログラミングアシスタントへの統合をサポートします。
Security Detections MCPは、Model Context Protocolに基づくサーバーで、LLMがSigma、Splunk ESCU、Elastic、KQL形式を含む統一されたセキュリティ検出ルールデータベースをクエリできます。最新のバージョン3.0は自律型検出エンジニアリングプラットフォームにアップグレードされ、自動的に脅威インテリジェンスからTTPを抽出し、カバレッジのギャップを分析し、SIEMネイティブ形式の検出ルールを生成し、テストを実行して検証できます。プロジェクトには71以上のツール、11の事前構築されたワークフロープロンプト、および知識グラフシステムが含まれ、複数のSIEMプラットフォームをサポートしています。
Apify MCPサーバーは、Model Context Protocol(MCP)を実装したサービスで、AIアシスタントがSSEまたはStdioを通じてApifyプラットフォーム上のさまざまなActorとやり取りし、データスクレイピング、ウェブ検索などのタスクを実行できるようにします。
Awesome MCP Serversは、包括的なモデルコンテキストプロトコル(MCP)サーバーの集合で、7158個のMCPサーバーがAI統合、アートメディア、ブラウザ自動化、クラウドサービス、データベース、開発者ツール、ファイルシステム、金融、ゲーム、ハードウェア、医療、インフラストラクチャ、知識管理、位置マップ、マーケティング、監視、マルチメディア処理、オペレーティングシステム、プロジェクト管理、科学研究、セキュリティ、ソーシャルメディア、旅行交通、ユーティリティツール、バージョン管理など33のカテゴリに分けられています。
HyperbrowserのMCPサーバーは、ウェブページのスクレイピング、構造化データの抽出、ブラウザープロキシツールを提供します。
HOPX MCPサーバーは、モデルコンテキストプロトコルに基づくサービスで、AIアシスタントが隔離されたクラウドコンテナ内でPython、JavaScript、Bash、Goのコードを実行でき、データ分析とファイル操作をサポートします。
HowToCook - MCPサーバーはAIアシスタントをプライベートシェフに変身させるプロジェクトで、HowToCookレシピデータに基づき、MCPプロトコルを通じてAIクライアントにレシピ検索、食事推薦などの機能を提供し、「今日何を食べるか」という難問を解決します。
MaaFrameworkに基づくMCPサーバーで、AIアシスタントにAndroidデバイスとWindowsデスクトップの自動化機能を提供し、OCR認識、クリック、スライド、テキスト入力などの操作をサポートし、操作プロセスを再利用可能なPipelineに変換できます。
Claude MobileはMCPサーバーで、自然言語を使ってAndroid、iOS、デスクトップ、Aurora OSデバイスを制御でき、統一された自動化操作、スマートスクリーンショット、権限管理、UIインタラクション機能を提供します。
adb - mcpは、MCPプロトコルを通じてLLMにインターフェースを提供し、Adobeツール(PhotoshopやPremiereなど)を制御するAIエージェントを作成する概念実証プロジェクトです。このプロジェクトには、MCPサーバー、Nodeコマンドプロキシサーバー、およびAdobeアプリケーションプラグインが含まれており、自然言語の命令でAdobeソフトウェアを操作でき、画像およびビデオ編集の自動化に適しています。
MCP Appiumはモデルコンテキストプロトコルに基づくインテリジェントなモバイル自動化サーバーで、AIアシスタントにクロスプラットフォームのモバイルアプリテストツールを提供します。iOSとAndroidプラットフォームをサポートし、スマート要素定位、セッション管理、自動化テスト生成などの機能を備えています。
HiMarketは即座に利用可能な企業向けAIオープンプラットフォームソリューションで、管理バックエンド、開発者ポータル、AIゲートウェイの3つの核心コンポーネントを提供し、モデルサービス、MCP ServerなどのAI機能を標準化されたAPI製品にパッケージ化して公開することをサポートします。