李飛飛氏のWorld LabsがMarble 3D世界モデルの公測版をリリース。テキスト・画像・動画などマルチモーダル入力に対応し、インタラクティブな仮想世界を迅速生成。開発者のAI技術応用探索を支援。....
李飛飛氏のWorld LabsがMarble3D世界モデルの公測を開始。テキストや画像などから完全な3D仮想世界を生成可能。リアルタイム編集と多形式出力に対応。実験段階から実用ツールへ移行。....
可灵AI動画モデル2.5Turboがリリースされ、先頭/末尾フレーム機能を追加。動画生成の制御性・安定性・一貫性が大幅向上。動的効果、テキスト精度、スタイル維持、美的効果で革新を実現し、プロ向けクリエイティブ制作を強化。....
人工知能専門家のリー・フェイが共同で設立したWorld Labsは、初の商業用世界モデルであるMarbleをリリースしました。テキスト、画像、動画、および3Dレイアウトの入力をサポートし、編集可能な3D環境を生成できます。製品はフリープレミアム版と有料サブスクリプション版があり、ゲーム、映画、VRなどの分野に応用されます。会社が2億3000万ドルの資金調達を完了してからわずか1年で、急速な成長を示しています。
世界初のオープンソースMoEビデオ生成モデルで、テキスト/画像から720Pビデオへの変換をサポートします。
Nano BananaはGoogleモデルによって駆動されるAI画像生成編集プラットフォームで、テキストプロンプトで操作します。
Qwen Image AIはアリババグループのQwenチームが開発したオープンソースの画像生成および編集ベースモデルで、正確な画像テキストレンダリングと高度な編集が可能です。
テキストプロンプトからインタラクティブな環境を生成するAIワールドモデルです。
moonshotai
$4.1
入力トークン/百万
$16.56
出力トークン/百万
128k
コンテキスト長
mistral
-
openai
$540
$1080
baidu
$4
$16
meta
$1.22
$4.32
1M
$18
$72
tencent
32k
google
$0.72
$2.88
sensetime
$2.8
$8.4
256k
$0.58
$2.16
10M
$3
$15
$1.44
$1.08
$14.4
$43.2
alibaba
DevQuasar
このプロジェクトは moonshotai/Kimi-K2-Thinking ベースモデルに基づいて、カスタム逆量子化スクリプトを使用して元のINT4モデルをより高品質のテキスト生成モデルに変換し、知識をすべての人に利用可能にすることを目指しています。
Leohan
MLXライブラリに基づいて開発されたテキスト生成モデルで、自然言語処理タスクに特化し、開発者に効率的なテキスト生成ソリューションを提供します。
inferencerlabs
MLXライブラリに基づいて実装されたテキスト生成モデルで、複数の量子化方式による推論をサポートし、分散計算能力を備え、Appleのハードウェア環境で効率的に動作します。
DavidAU
これは、Qwen3-VL-8B-Thinkingモデルをベースにした強化版のマルチモーダルビジュアル言語モデルです。Brainstorm 20x技術を用いて12Bパラメータに拡張され、NEO Imatrixで強化されたGGUF量子化が適用されています。このモデルは、画像理解、テキスト生成、マルチモーダル推論の能力が強く、ビジュアル感知、テキスト品質、クリエイティブなシーンでの性能が著しく向上しています。
noctrex
これはMiniMax-M2-THRIFTモデルのMXFP4_MOE量子化バージョンで、元のモデルに基づいて圧縮処理が行われており、25%のエキスパート枝刈り(256から192)が行われ、top_k=8に設定されています。同時に、エンコーディングモデルの特性が保持されており、テキスト生成タスクに使用できます。
cemoss17
nutrient-gram-qwen-3-vl-2bはQwen/Qwen3-VL-2B-Instructをベースにした微調整バージョンで、TRLを使用して教師付き微調整トレーニングを行い、主にテキスト生成タスクに使用されます。このモデルは元のマルチモーダル能力を維持したまま、特定のタスクに合わせて最適化されています。
Aquif-3.5-Max-42B-A3Bは420億パラメータの大規模言語モデルで、MXFP4_MOE量子化処理を行っており、高品質なテキスト生成能力を維持しながら推論効率を最適化しています。このモデルは先進的な混合専家アーキテクチャに基づいており、様々な自然言語処理タスクに適用できます。
kirankumarpetlu
これはGoogle Gemma-2B-ITベースモデルに基づき、PEFT(パラメータ効率的微調整)とLoRA技術を使用して最適化されたテキスト生成モデルです。このモデルは、パラメータ効率的な方法でベースモデルの能力を維持しながら、特定のタスクに対して最適化されています。
ggml-org
これはQwen3-VL-30B-A3B-Instructモデルを変換したGGUF形式のバージョンで、llama.cpp用に最適化されています。このモデルは300億パラメータのマルチモーダル視覚言語モデルで、画像理解とテキスト生成タスクをサポートします。
Clemylia
メルタは、DiscordボットMelta27をベースに開発された独特な小型言語モデルで、可愛く、魅力的で、情熱的な個性を持ち、オリジナルで独特で可愛いテキストコンテンツの生成に特化しています。
unsloth
Qwen3-VLは通義シリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル感知と推論能力、長いコンテキストのサポート、強力な空間とビデオ動的理解能力、そして優れたインテリジェントエージェント対話能力を備えています。
Qwen3-VL-32B-ThinkingはQwenシリーズで最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル感知と推論能力、長文脈処理、空間および動画の動的理解能力、そして優れたエージェント対話能力を備えています。
Qwen3-VL-8B-Thinkingは通義千問シリーズで最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認知と推論能力、長いコンテキストサポート、強力な空間とビデオ動的理解能力、そして優れたエージェント対話能力を備えています。
Qwen3-VLは通義シリーズで最も強力なビジュアル言語モデルで、テキスト理解と生成、ビジュアル認知と推論、コンテキスト長、空間およびビデオの動的理解、エージェントインタラクション能力などの面で全面的にアップグレードされています。このモデルは密集アーキテクチャとハイブリッドエキスパートアーキテクチャを提供し、エッジデバイスからクラウドまでの柔軟なデプロイをサポートします。
Qwen3-VLはQwenシリーズの中で最も強力なビジュアル言語モデルで、包括的な総合アップグレードが実現されています。これには、卓越したテキスト理解と生成能力、より深いビジュアル感知と推論能力、より長いコンテキスト長、強化された空間およびビデオ動的理解能力、そしてより強力なエージェント対話能力が含まれます。
anikifoss
このプロジェクトはMiniMax-M2モデルに対する高品質HQ4_K量子化で、テキスト生成タスクに特化して最適化されており、対話シーンに特に適しています。この量子化バージョンはimatrixを使用せず、モデルの性能を維持しています。
このプロジェクトは、Qwen3-Coder-30B-A3B-InstructモデルをMXFP4_MOE量子化した成果物で、コンテキストサイズを256kから1Mに拡張し、コード生成やプログラミングタスクに最適化されたモデルバージョンを提供し、パフォーマンスの向上とリソースの節約に価値があります。
lmstudio-community
Qwen3-VL-2B-ThinkingはQwenによって開発された視覚言語モデルで、2Bのパラメータ規模を持ち、MLXを使用して8ビット量子化が行われ、Apple Siliconチップに特化した最適化が施されています。このモデルは画像とテキストのマルチモーダル理解と生成タスクをサポートしています。
Qwen3-VLはQwenシリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認知と推論能力、長いコンテキストサポート、強力な空間とビデオ動的理解能力、そして優れたエージェントインタラクション能力を備えています。このバージョンは2Bパラメータの思考強化版で、推論能力が特別に最適化されています。
oberbics
このモデルはMetaのLlama-3.1アーキテクチャをベースに微調整されたテキスト生成モデルで、TRLライブラリとGRPO(Group Relative Policy Optimization)手法を用いて強化学習トレーニングを行い、特に論証生成タスクに最適化されています。
Klavis AIはオープンソースプロジェクトで、Slack、Discord、Webプラットフォームで簡単に使えるMCP(モデルコンテキストプロトコル)サービスを提供します。レポート生成、YouTubeツール、ドキュメント変換などのさまざまな機能があり、非技術ユーザーと開発者がAIワークフローを使用するのをサポートします。
ミニマックス公式のモデルコンテキストプロトコル(MCP)サーバーで、テキスト読み上げ、ビデオ/画像生成などのAPIとのやり取りをサポートします。
MemoryMeshは、AIモデル向けの知識グラフサーバーで、テキストロールプレイングゲームとインタラクティブな物語に特化しています。動的なスキーマ定義と自動生成ツールを通じて、AIが対話中に一貫した構造化された記憶を維持し、より豊かで動的な対話体験を実現します。
FileScopeMCPはTypeScriptベースのコード分析ツールで、ファイルの重要度スコアを計算し、依存関係を追跡し、可視化チャートを生成し、ファイルの要約を追加することで、開発者がコードライブラリの構造を迅速に理解するのを支援します。多言語のプロジェクト分析をサポートし、Mermaidチャートの生成と永続的なストレージ機能を提供し、Cursorのモデルコンテキストプロトコルと統合できます。
DB MCP Serverは、マルチデータベースをサポートするサーバーで、モデルコンテキストプロトコル(MCP)を実装し、AIアシスタントに構造化されたデータベースアクセス機能を提供します。MySQLとPostgreSQLをサポートし、複数のデータベースに同時に接続でき、専用ツールを自動生成し、明確なアーキテクチャ設計に準拠しています。
クイックスタートオートMCPは、ユーザーがClaude DesktopとCursorでAnthropicモデルコンテキストプロトコル(MCP)を迅速に登録するのを支援するツールです。RAGドキュメント検索、Difyワークフロー、リアルタイムウェブ検索などの機能を提供し、JSON設定ファイルをワンクリックで生成することができます。
Notebook Intelligence (NBI) は、JupyterLab用に設計されたAIコーディングアシスタントおよび拡張可能なAIフレームワークで、GitHub Copilotや他のLLMプロバイダーのモデル(ローカルのOllamaモデルを含む)をサポートします。コード生成、自動補完、チャットインターフェイスなどの機能により生産性を大幅に向上させ、モデルコンテキストプロトコル(MCP)サービスの統合をサポートします。
mcp-rag-serverは、Model Context Protocol (MCP)に基づくサービスで、検索強化生成(RAG)をサポートし、ドキュメントをインデックス化し、大規模言語モデルに関連するコンテキストを提供します。
CTXはコードリポジトリと大規模言語モデル(LLM)を接続するツールで、構造化されたコンテキストファイルを自動生成することで、AI開発におけるコードコンテキストの伝達効率が低い問題を解決します。コードファイル、Gitリポジトリ、ウェブページなどの複数のソースから情報を収集することができ、MCPサーバーを通じて直接AIアシスタントにプロジェクトコンテキストを提供することができます。
HLedger MCPサーバーは、モデルコンテキストプロトコルに基づくサービスで、AIアシスタントがHLedger会計データと機能に直接アクセスするためのインターフェイスを提供します。口座残高の照会、財務報告の生成、新しいエントリの追加、会計データの分析などの操作をサポートします。
このプロジェクトは、Google Cloud Vertex AI Geminiモデルに基づくMCPサーバーで、コード支援と一般的な質問応答に使用する豊富なツールセットを提供します。Web検索強化型の回答、ドキュメントの説明生成、ファイルシステム操作などの機能をサポートしています。
これはRubyベースのMCPサーバーフレームワークで、モデルコンテキストプロトコル(MCP)を実装し、大規模言語モデルがツール(乱数生成など)を呼び出すことを可能にします。プロジェクトには、プロトコル処理、ツール管理、ログ記録などの機能が含まれ、ClaudeなどのLLMとの統合をサポートします。
Qwen Max MCP Serverは、Node.js/TypeScriptに基づくモデルコンテキストプロトコルサーバーの実装で、Qwen Max言語モデル用に設計され、Claude Desktopとの統合をサポートし、安定したテキスト生成サービスを提供します。
AIビデオ生成MCPサーバーは、テキストと画像入力をサポートして動画ビデオを生成し、様々なパラメーター制御とモデル選択を提供します。
Google Geminiモデルに基づくMCPサーバーで、テキストからの画像生成と画像変換機能を提供し、高品質な画像生成、スマートなファイル名生成、ローカル保存をサポートします。
TypeScriptベースのMCPサーバーで、Flux Schnellモデルを統合してテキストから画像への生成機能を実現します。
Flux Image MCPサーバーはFlux Schnellモデルに基づく画像生成サービスで、Replicateプラットフォームを通じてAPIインターフェースを提供し、テキスト記述による画像生成をサポートします。
AI Studio MCP Serverは、Google AI Studio/Gemini APIを統合したモデルコンテキストプロトコルサーバーで、ファイル、対話履歴、システムプロンプトをサポートするコンテンツ生成機能を提供します。
MCPプロトコルに基づく画像生成サーバーで、Replicateのflux-schnellモデルを使用し、テキストプロンプトによる画像生成をサポートし、さまざまなパラメータを設定できます。
このプロジェクトでは、IBM Watsonx.aiに基づく検索強化生成(RAG)サーバーを構築し、ChromaDBを使用してベクトルインデックスを作成し、モデルコンテキストプロトコル(MCP)を通じてインターフェイスを公開します。このシステムはPDFドキュメントを処理し、ドキュメントの内容に基づいて質問に回答し、大規模言語モデルと特定分野の知識を組み合わせたスマートな質問応答機能を実現します。