ソフトバンクとOpenAIが今月合弁会社を設立、AI分野での協力を強化し、資金・技術リソースを共同投入、AI技術の研究開発と商業化を推進。....
银河通用と複数大学が共同で、世界初のクロスオントロジー全域監視ナビゲーション基盤大モデル「NavFoM」を発表。視覚・言語ナビゲーション、目標指向ナビ、視覚追跡、自動運転を統合し、屋内・外全シーンに対応。....
メイドゥーがオープンソースでマルチモーダル大規模モデルLongCat-Flash-Omniをリリースし、技術的な突破を達成しました。複数のベンチマークテストにおいて閉鎖型競合製品を上回り、業界の先端水準に達しています。このモデルはテキスト、音声、画像、動画のリアルタイム融合処理をサポートし、ほぼゼロ遅延の対話能力を持ち、ローカルマルチモーダルAIアプリケーションの新たな高みへと導いています。
Googleは近日中にAI画像生成モデル「Nano Banana2」(コード名GEMPIX2)をリリース。DeepMindチーム開発で、画像作成の効率と精度を向上し、生成AI分野の革新を加速。....
dynaresはAIを利用して、Google広告用の高いコンバージョン率を持つランディングページとキャンペーンを生成し、広告費を節約します。
学生や専門家向けのAI学習アシスタントで、プログラミングやデータサイエンスなどのスキルを個人化して学ぶことができます。
AIアバターを使って、学生の入学案内や新入社員の研修をインタラクティブな多言語体験に変え、コストを節約します。
高品質な動画を1クリックで生成し、クリエイティブを簡単に実現。
xai
$21.6
入力トークン/百万
$108
出力トークン/百万
256k
コンテキスト長
openai
$144
$576
200k
google
$9
$72
1M
$14.4
$57.6
$7.92
$31.68
deepseek
$3.6
$15.48
128k
400k
$2.16
$18
anthropic
$540
chatglm
$4.03
$7.99
$0.43
$1.01
131.1k
minimax
-
alibaba
$0.72
$432
bartowski
Apollo-V0.1-4B-Thinkingは40億パラメータの大規模言語モデルで、思考過程の推論アーキテクチャを採用し、推論タスクに特化して最適化されています。このモデルは複数の量子化バージョンを提供し、さまざまなハードウェア環境で効率的に動作します。
noctrex
これはQwen3-VL-30Bに基づく量子化バージョンのモデルで、画像テキストからテキストへの変換タスクに特化しています。このモデルは量子化技術を通じて元のモデルを最適化し、より効率的な推論ソリューションを提供します。
これはMistralアーキテクチャに基づく画像テキストをテキストに変換する量子化モデルで、パラメータ規模は24Bで、指令追従タスクに特化して最適化訓練され、マルチモーダル入力処理をサポートしています。
unsloth
Qwen3-VLは通義シリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル感知と推論能力、長いコンテキストのサポート、強力な空間とビデオ動的理解能力、そして優れたインテリジェントエージェント対話能力を備えています。
これは慧慧Qwen3-VL-8B思考消去モデルの量子化バージョンで、Qwen3-VL-8Bアーキテクチャに基づいて、画像テキスト変換タスクに特化して最適化および量子化処理が行われ、llama.cppツールを通じて効率的に実行できます。
慧慧Qwen3-VL-8B指令アブレーションモデルの量子化バージョンで、画像テキストからテキストへの変換タスクに特化しています。このモデルはQwen3-VL-8Bアーキテクチャに基づいており、指令アブレーション最適化と量子化処理を行っており、性能を維持しながら計算リソースの要求を低減できます。
慧慧Qwen3-VL-4B思考消除モデルの量子化バージョンで、Qwen3-VL-4Bモデルをベースに最適化されており、思考チェーン推論プロセスを排除するように特別に設計されています。最新のllama.cppと組み合わせて使用でき、効率的な画像テキストからテキストへの処理能力を提供します。
これはHuihui-Qwen3-VL-4B-Instruct-abliteratedモデルに基づく量子化バージョンで、画像テキストからテキストへの変換タスクに特化しており、量子化処理によってモデルの性能が最適化され、マルチモーダルアプリケーションをサポートします。
Qwen3-VL-32B-ThinkingはQwenシリーズで最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル感知と推論能力、長文脈処理、空間および動画の動的理解能力、そして優れたエージェント対話能力を備えています。
Qwen3-VL-8B-Thinkingは通義千問シリーズで最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認知と推論能力、長いコンテキストサポート、強力な空間とビデオ動的理解能力、そして優れたエージェント対話能力を備えています。
Qwen3-VLはQwenシリーズの中で最も強力なビジュアル言語モデルで、包括的な総合アップグレードが実現されています。これには、卓越したテキスト理解と生成能力、より深いビジュアル感知と推論能力、より長いコンテキスト長、強化された空間およびビデオ動的理解能力、そしてより強力なエージェント対話能力が含まれます。
catalystsec
このプロジェクトでは、MiniMax - M2モデルを4ビット量子化処理し、DWQ(動的重み量子化)方法を使用し、mlx - lmライブラリを介して達成します。このモデルはMiniMax - M2の軽量化バージョンで、良好な性能を維持しながらモデルサイズを大幅に削減します。
MiniMax-M2は、コーディングとエージェントのワークフローを最大化するために構築された小型の混合専門家モデルで、総パラメータは2300億、活性化パラメータは100億です。このモデルは、コーディングとエージェントタスクで卓越した性能を発揮し、同時に強力な汎用知能を維持し、コンパクトで高速かつ経済的に効率的な特徴を持っています。
dinhthuan
NeuTTS - Airベトナム語テキストを音声に変換するモデルは、260万以上のベトナム語オーディオサンプルに基づき、NeuTTS - Air基礎モデルから微調整された高品質のベトナム語音声合成モデルです。このモデルは、自然で流暢なベトナム語音声合成を実現でき、音声クローニング機能をサポートし、生産環境に合わせて最適化されています。
mitegvg
このモデルはVideoMAEアーキテクチャに基づく暴力検出モデルで、Kineticsデータセットで事前学習した後、暴力検出タスクに対して92エポックの微調整を行っています。モデルはVision Transformerアーキテクチャを採用し、ビデオコンテンツ分析に特化しており、ビデオ内の暴力行為を識別することができます。
peteromallet
QwenEdit InScene LoRAsは、QwenEditを微調整したモデルグループで、シーン参照に基づく画像生成能力の強化に特化しています。InSceneメインモデルとInScene Annotateの2つのコンポーネントを含み、キャラクターの一貫性とシーンの連続性を維持しながら、新しいシーンレンズを作成することができます。
mlx-community
これはKimi-Linear-48B-A3B-Instructモデルを変換した6ビット量子化バージョンで、Apple MLXフレームワーク用に最適化されています。このモデルは元のモデルの強力な指令追従能力を保持しながら、量子化技術により格納と計算の要件を大幅に削減し、Appleハードウェアで効率的に動作するのに適しています。
Gelato-30B-A3Bは、GUIコンピュータ使用タスクに対して微調整された最先端(SOTA)モデルで、デプロイ効率を最適化するために量子化バージョンを提供しています。このモデルは、グラフィカルユーザーインターフェース関連のタスクを理解して処理するように特別に設計されています。
Chandra-OCR量子化モデルは、元のChandraモデルを量子化処理したバージョンで、画像をテキストに変換するタスクに特化しており、最新のllama.cppと併用できます。
ycngin2024
これは微調整されたWhisper音声認識モデルで、unsloth/whisper-large-v3-turboアーキテクチャに基づいており、UnslothとHuggingface TRLライブラリを使用して訓練速度を2倍に加速し、訓練効率を大幅に向上させています。
wcgwはMCPサーバープロジェクトで、シェルとコードエディターツールが統合されており、AIがローカルマシン上でコマンドを実行し、ファイルを読み書きし、コードを編集するなどの操作ができます。アーキテクトモード、コード作成モードなどの複数のモードを提供し、タスクチェックポイント保存、ターミナル対話、構文チェックなどの機能をサポートしており、コード開発、問題解決などのシーンに適しています。
Inbox Zeroは、オープンソースのAIメールアシスタント兼クライアントで、ユーザーが効率的にメールを管理し、受信トレイをゼロにするのを支援します。
Einoは、Golang用に設計されたLLMアプリケーション開発フレームワークで、シンプルで拡張可能で信頼性が高く効率的なコンポーネント抽象化と編成機能により、AIアプリケーションの開発プロセスを簡素化することを目的としています。豊富なコンポーネントライブラリ、強力なグラフ編成機能、完全なストリーム処理サポート、および高度に拡張可能なアスペクトメカニズムを提供し、開発からデプロイまでの全サイクルのツールチェーンを網羅しています。
sitemcpは、ウェブサイト全体の内容を取得し、それをMCPサーバーとして使用できるツールで、カスタムマッチングページ、コンテンツセレクターなどの機能をサポートし、ドキュメントやブログサイトの迅速な検索に適しています。
Unreal Engine のモデルコンテキストプロトコル (MCP) の統合に関するドキュメントで、MCP システムの理解、設定、使用を支援します。
SupermemoryはAI駆動の記憶エンジンで、個人データを統合することでLLMにコンテキスト知識を提供し、情報のスマートな管理と検索を実現します。
MCP GoはGo言語で実装されたモデルコンテキストプロトコル(MCP)サーバーフレームワークで、LLMアプリケーションと外部データソースやツールを接続するために使用されます。リソース管理、ツール呼び出し、プロンプトテンプレートなどの核心機能を提供し、セッション管理とミドルウェア拡張をサポートしています。
Supabase MCPサーバーはオープンソースのツールで、IDEが安全にSQLを実行し、スキーマ変更を管理し、Supabase管理APIを呼び出し、Auth Admin SDKを使用できるようにします。組み込みのセキュリティ制御があります。
Kubernetesに基づくMCPサーバーで、Kubernetesクラスターの管理および操作に使用します
Claude/Cursor用に設計されたOpenAPI仕様探索サーバーで、3ステップのプロセスでユーザーがAPIドキュメントを検索し理解するのを支援します。
これは、ブラウザ制御、芸術と文化、クラウドプラットフォーム、コマンドライン、通信、顧客データプラットフォーム、データベース、開発者ツール、データサイエンスツール、ファイルシステム、金融とフィンテック、ゲーム、知識と記憶、位置サービス、マーケティング、監視、検索、ユーティリティツールなど、複数のカテゴリをカバーする、継続的に更新されるMCPサーバーの選りすぐりのリストです。各プロジェクトにはGitHubリンクとスター数が付属しており、ユーザーがすぐに理解して使用できるようになっています。
Solana Agent Kitは、AIエージェントをSolanaプロトコルに接続するためのオープンソースツールキットで、60種類以上のブロックチェーン操作をサポートします。
各wikiファイルは、そのパスに対応する追加リソース(画像など)を`.resource`ディレクトリに保存し、git lfsを使用してバージョン管理する必要があります。
Refact AgentはオープンソースのAIプログラミングアシスタントで、多言語のコード生成、デバッグ、最適化をサポートし、主流の開発ツールと統合し、ローカルにデプロイでき、スマートなコード補完とコード解釈機能を提供します。
ElevenLabs公式のMCPサーバーで、テキストを音声に変換し、音声処理APIとのやり取りが可能です。
アデリンは、Rustで書かれたオープンソースのSolidityスマートコントラクト静的分析ツールで、開発者やセキュリティ研究者がSolidityコードの脆弱性を発見するのを支援します。FoundryとHardhatプロジェクトをサポートし、複数の形式のレポートを生成でき、VSCode拡張機能も提供します。
HiveChatは中小チーム向けに設計されたAIチャットアプリで、複数の大規模モデルサービスプロバイダーをサポートし、グループ管理、トークン制限、サードパーティログインなどの機能を提供します。
スーパーゲートウェイは、標準入出力ベースのMCPサーバーをSSEまたはWebSocketを通じてアクセス可能なサービスに変換するツールです。リモートデバッグと統合を容易にします。
このプロジェクトは、ObsidianのLocal REST APIプラグインを通じてObsidianノートアプリとやり取りするMCPサーバーです。Obsidian内のファイルを操作および管理するためのさまざまなツールを提供し、ファイルのリスト表示、内容の取得、検索、内容の変更、ファイルの削除などが可能です。
PG - MCPは、PostgreSQLデータベース用に設計されたモデルコンテキストプロトコルサーバーです。AIエージェントがデータベースを発見、接続、クエリ、および理解するためのAPIを提供し、複数のデータベース接続、豊富なディレクトリ情報、およびクエリ実行計画分析機能をサポートします。