英伟ダCEOの黄仁勲はモーガン・スタンレー会議で、エージェントAIが歴史的な転機に立っていると強調した。彼はオープンソースプロジェクトであるOpenClawを高く評価し、「現代において最も重要なソフトウェアのリリース」と述べた。黄仁勲は、OpenClawがわずか3週間でLinuxの30年の普及実績を上回るダウンロード数を記録したと指摘し、史上最大のオープンソースソフトウェアとなったと語った。
GitHub CopilotがGPT-5.4を迅速に統合し、開発者に新モデルに基づく知的プログラミング支援を提供。公式テストでは、エージェント型ソフトウェア開発におけるタスク成功率が大幅に向上し、Codexシリーズのコード生成の強みを継承。....
GitHub CopilotがGPT-5.4モデルを統合し、AIプログラミングアシスタントが「エージェント型」ワークフローへ進化。複雑な論理推論とツール連携の精度向上を実現。....
春節休暇中、「手作り経済」が人気に。ユーザーはLingguangアプリで自然言語対話を通じて、コード不要でインタラクティブなアプリを迅速生成。低い参入障壁とゼロコストで、若者が創造性を収益化し、SNSで販売、数百から数千件の取引を実現する新ビジネスに発展。....
ナノバナナProは、クリエイティブエンジンをアップグレードし、1 - 2秒で4K画像を生成し、プロンプトを専門的な出力に変換します。
自由なクリエイティブ専門家向けに作られたワンストップの作業空間で、管理作業を減らし、クリエイティブなプロセスを向上させます。
Telegramを通じてOpenClaw AIエージェントをデプロイし、ClawDaddyが管理と設定を行います。
trnscrbはローカルで会議を文字起こしでき、複数の会議アプリケーションをサポートします。文字起こし結果はClaude Desktopで検索できます。
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
Baidu
128
$6
$24
256
$2
$20
$4
$16
Bytedance
$1.2
$3.6
4
gguf-org
flux2-dev-ggufは、FLUX.2-devに基づく画像から画像への変換モデルで、テキストプロンプトに基づいて特定のスタイルの画像を生成するために特別に設計されています。このモデルはComfyUI環境での実行をサポートし、テキスト記述をスタイル化されたビジュアルコンテンツに変換することができます。
Clemylia
ピカチュウ言語モデルはClemyliaが起こした独自の実験的な言語プロジェクトで、完全にゼロから訓練され、「ピカチュウ」の音声コーパスのみに基づいており、小型言語モデルがネイティブ言語のアイデンティティを創造する能力を示しています。
Qsana-coder-baseは小型言語モデル(SLM)で、コーディング基礎(Python、疑似コード)の概念創意のために特別に設計されています。これは実行可能な生産コードを生成するのではなく、教育や迅速なプロトタイプ設計のシナリオでコーディングの論理断片を生成し、主な目標は初心者の論理思考と概念理解を刺激することです。
jayn7
このプロジェクトは、テンセントの混元ビデオ1.5のテキストから動画へのモデルの量子化GGUFバージョンを提供し、480P動画生成タスクをサポートします。蒸留モデルと完全モデルの2つのバージョンが含まれており、ComfyUI - GGUFなどのツールと連携して使用できます。
このプロジェクトでは、騰訊のHunyuanVideo-1.5-I2V-720pモデルの量子化GGUFバージョンを提供しており、画像を動画に変換するタスクや動画生成タスクに特化しています。このモデルは、静止画像を高品質な動画コンテンツに変換することができ、性能を最適化するための複数の量子化バージョンを提供しています。
ubergarm
これはai-sage/GigaChat3-10B-A1.8B-bf16モデルのGGUF量子化バージョンで、高精度のQ8_0から極度に圧縮されたsmol-IQ1_KTまで、さまざまな量子化オプションを提供し、さまざまなハードウェア条件でのデプロイメントニーズを満たします。このモデルは32Kのコンテキスト長をサポートし、MLAアーキテクチャを採用し、対話シナリオに最適化されています。
MedSwin
このプロジェクトは、事前学習言語モデル融合技術を使用して作成された医学分野のモデルです。複数の医学関連の事前学習モデルを融合することで、医学質問応答タスクに特化して最適化され、医学シーンでの性能と効果が向上しています。
Justin331
SAM 3はMetaが発表した第3世代のプロンプト可能な分割基礎モデルで、画像とビデオの分割タスクを統一的にサポートします。前代のSAM 2と比べて、オープンボキャブラリ概念分割能力を導入し、大量のテキストプロンプトを処理でき、SA - COベンチマークテストで人間の性能の75 - 80%に達します。
MaziyarPanahi
このプロジェクトでは、Qwen3-4B-Thinking-2507モデルのGGUF形式のファイルを提供しています。これは、思考過程推論能力を持つ4Bパラメータの大規模言語モデルで、複数の量子化バージョンをサポートし、さまざまなハードウェアでのデプロイと実行が容易です。
tlennon-ie
QwenEdit2509は、画像の色彩処理に特化した低ランク適応型(LoRA)モデルです。画像の飽和度を下げ、コントラストを低下させ、カメラのログプロファイルに似た扁平で未グレーディングの外観を作り出すと同時に、ハイライトとシャドウの細部を保持します。
bartowski
これはVibeStudioのMiniMax-M2-THRIFTモデルを量子化したバージョンで、llama.cppツールと特定のデータセットを使用して生成され、複数の量子化タイプのGGUFファイルを提供し、LM Studioまたはllama.cppベースのプロジェクトでの実行をサポートします。
OpenMMReasoner
OpenMMReasonerは完全に透明な2段階のマルチモーダル推論アプローチで、教師付き微調整(SFT)と強化学習(RL)を用いてトレーニングされます。SFT段階では874Kのサンプルからなるコールドスタートデータセットを構築し、RL段階では74Kのサンプルを利用して能力をさらに向上させ、マルチモーダル推論のベンチマークテストで優れた結果を示します。
XiaomiMiMo
米モデルのエンボディメントモデル(MiMo-Embodied)は、強力なクロスエンボディメント視覚言語モデルであり、自動運転とエンボディメントAIタスクの両方で卓越した性能を発揮します。これは、この2つの重要な分野を結合した最初のオープンソースの視覚言語モデルであり、動的な物理環境における理解と推論能力を大幅に向上させました。
DevQuasar
このプロジェクトでは、cerebras/MiniMax-M2-REAP-172B-A10Bモデルの量子化バージョンを提供しており、知識を大衆に利用してもらうことを目指しています。これは1720億パラメータの大規模言語モデルで、最適化と量子化処理が施されており、デプロイコストの削減と推論効率の向上を目的としています。
TeichAI
このモデルはQwen3 - 4Bアーキテクチャに基づく知識蒸留モデルで、Gemini 2.5 Flashによって生成された約5440万個のトークンを使用してトレーニングされ、Gemini - 2.5 Flashの振る舞い、推論プロセス、知識を単一のデータセットに統合することを目的としています。
onnx-community
SAM3は概念ベースの任意分割モデルで、入力された点やボックスなどのプロンプト情報に基づいて、正確な画像分割マスクを生成することができます。このバージョンはONNX形式のSAM3トラッカーモデルで、Transformers.jsライブラリを通じてブラウザ環境で効率的に動作します。
MiroThinker-v1.0-72Bは72Bパラメータの大規模言語モデルの量子化バージョンで、知識を誰もが利用できるようにすることを目指しています。このプロジェクトはオリジナルモデルを最適化し、より効率的な推論性能を提供します。
mradermacher
このプロジェクトでは、Qwen-4B-Instruct-2507-Self-correctモデルの静的量子化バージョンを提供しています。テキスト生成、偏差緩和、自己修正などのタスクをサポートしています。このモデルはQwen-4Bアーキテクチャに基づいており、指令微調整と自己修正訓練を経て、様々な量子化バージョンを提供して異なるハードウェア要件に対応しています。
DakkaWolf
Trouper-12B GGUFは、DarwinAnim8orによってオリジナルモデルを基に開発されたテキスト生成モデルで、ロールプレイングやクリエイティブライティングのシナリオに特化して最適化されています。このモデルはMistral-Nemo-Base-12Bから微調整され、カスタムの「Actors」データセットを使用して訓練されており、生成されるテキストはより自然で、一般的な「AI言語」の特徴を避けています。
sd2-community
Stable Diffusion v2-1-baseは、テキストから画像を生成する拡散モデルで、v2-baseをベースに220kの追加ステップで微調整されています。このモデルは、テキストプロンプトに基づいて画像を生成および修正でき、複数の解像度出力をサポートし、アート創作や教育研究などのさまざまな分野に適しています。
wcgwはMCPサーバープロジェクトで、シェルとコードエディターツールが統合されており、AIがローカルマシン上でコマンドを実行し、ファイルを読み書きし、コードを編集するなどの操作ができます。アーキテクトモード、コード作成モードなどの複数のモードを提供し、タスクチェックポイント保存、ターミナル対話、構文チェックなどの機能をサポートしており、コード開発、問題解決などのシーンに適しています。
MCP GoはGo言語で実装されたモデルコンテキストプロトコル(MCP)サーバーフレームワークで、LLMアプリケーションと外部データソースやツールを接続するために使用されます。リソース管理、ツール呼び出し、プロンプトテンプレートなどの核心機能を提供し、セッション管理とミドルウェア拡張をサポートしています。
Unreal Engine のモデルコンテキストプロトコル (MCP) の統合に関するドキュメントで、MCP システムの理解、設定、使用を支援します。
Inbox Zeroは、オープンソースのAIメールアシスタント兼クライアントで、ユーザーが効率的にメールを管理し、受信トレイをゼロにするのを支援します。
Einoは、Golang用に設計されたLLMアプリケーション開発フレームワークで、シンプルで拡張可能で信頼性が高く効率的なコンポーネント抽象化と編成機能により、AIアプリケーションの開発プロセスを簡素化することを目的としています。豊富なコンポーネントライブラリ、強力なグラフ編成機能、完全なストリーム処理サポート、および高度に拡張可能なアスペクトメカニズムを提供し、開発からデプロイまでの全サイクルのツールチェーンを網羅しています。
これは、ブラウザ制御、芸術と文化、クラウドプラットフォーム、コマンドライン、通信、顧客データプラットフォーム、データベース、開発者ツール、データサイエンスツール、ファイルシステム、金融とフィンテック、ゲーム、知識と記憶、位置サービス、マーケティング、監視、検索、ユーティリティツールなど、複数のカテゴリをカバーする、継続的に更新されるMCPサーバーの選りすぐりのリストです。各プロジェクトにはGitHubリンクとスター数が付属しており、ユーザーがすぐに理解して使用できるようになっています。
Refact AgentはオープンソースのAIプログラミングアシスタントで、多言語のコード生成、デバッグ、最適化をサポートし、主流の開発ツールと統合し、ローカルにデプロイでき、スマートなコード補完とコード解釈機能を提供します。
Claude/Cursor用に設計されたOpenAPI仕様探索サーバーで、3ステップのプロセスでユーザーがAPIドキュメントを検索し理解するのを支援します。
Solana Agent Kitは、AIエージェントをSolanaプロトコルに接続するためのオープンソースツールキットで、60種類以上のブロックチェーン操作をサポートします。
アデリンは、Rustで書かれたオープンソースのSolidityスマートコントラクト静的分析ツールで、開発者やセキュリティ研究者がSolidityコードの脆弱性を発見するのを支援します。FoundryとHardhatプロジェクトをサポートし、複数の形式のレポートを生成でき、VSCode拡張機能も提供します。
HiveChatは中小チーム向けに設計されたAIチャットアプリで、複数の大規模モデルサービスプロバイダーをサポートし、グループ管理、トークン制限、サードパーティログインなどの機能を提供します。
MCPプロトコルに基づくKubernetesクラスター管理サーバーで、コマンドラインまたはチャットインターフェイスを通じてKubernetesクラスターとやり取りでき、リソース管理、Helmチャート操作などの機能を提供します。
PG - MCPは、PostgreSQLデータベース用に設計されたモデルコンテキストプロトコルサーバーです。AIエージェントがデータベースを発見、接続、クエリ、および理解するためのAPIを提供し、複数のデータベース接続、豊富なディレクトリ情報、およびクエリ実行計画分析機能をサポートします。
Klavis AIはオープンソースプロジェクトで、Slack、Discord、Webプラットフォームで簡単に使えるMCP(モデルコンテキストプロトコル)サービスを提供します。レポート生成、YouTubeツール、ドキュメント変換などのさまざまな機能があり、非技術ユーザーと開発者がAIワークフローを使用するのをサポートします。
Haiku RAGは、LanceDB、Pydantic AI、Doclingを基盤とした高度な検索強化生成システムです。ハイブリッド検索、再ランキング、質問応答エージェント、多エージェント研究プロセスをサポートし、ローカルファーストのドキュメント処理とMCPサーバー統合を提供します。
このプロジェクトは、ObsidianのLocal REST APIプラグインを通じてObsidianノートアプリとやり取りするMCPサーバーです。Obsidian内のファイルを操作および管理するためのさまざまなツールを提供し、ファイルのリスト表示、内容の取得、検索、内容の変更、ファイルの削除などが可能です。
Runnoは、JavaScriptツールキットのセットで、ブラウザやNode.jsなどの環境で複数のプログラミング言語のコードを安全に実行するためのものです。WebAssemblyとWASIを通じてサンドボックス化された実行を実現し、Python、Ruby、JavaScript、SQLite、C/C++などの言語をサポートし、Webコンポーネント、MCPサーバーなどの統合方法を提供します。
セレナは強力なオープンソースのコーディングエージェントツールキットで、大規模言語モデル(LLM)をコードベース上で直接動作するフル機能のエージェントに変えることができます。IDEに似た意味論的なコード検索と編集ツールを提供し、様々なプログラミング言語をサポートし、MCPプロトコルまたはAgnoフレームワークを介して様々なLLMと統合することができます。
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
codemcpはClaude Desktopをペアプログラミングアシスタントに変えるツールで、ユーザーがClaudeに直接ローカルコードベース上で機能の実装、エラーの修正、コードのリファクタリングを行わせることができます。