GoogleのAIノートツール「NotebookLM」が、ドキュメントから没入型の映画風ビデオを自動生成する新機能を発表。従来のスライド形式を進化させ、高度なAIモデルを活用したカスタム動画作成を実現。....
世界トップクラスの協働オフィスプラットフォームNotionは、混合モデルエコシステムへの取り組みを加速し、実験的な機能として中国発のオープンソースモデルMiniMax M2.5を導入したことを発表しました。これは、以前はClaudeやGPTなどの閉鎖型モデルが独占していた状況を打ち破るもので、中国製の大規模モデルが世界的な主要生産性ツールの核心部に正式に進出することを示しています。
BMWグループはスイスのHexagon Roboticsと提携し、ドイツ・ライプツィヒ工場にAEONヒューマノイドロボットを導入。欧州生産ライン初の具身知能技術を採用し、人間型ボディと車輪移動機能で工具交換が可能。主に高圧バッテリー組立や部品製造を担い、量産工程への統合を目指す。2025年よりプロジェクト開始。....
Googleがオープンソース拡張「Conductor」を発表。AIプログラミングのコンテキスト消失問題を解決し、Gemini CLIの拡張として、コード生成を構造化ワークフローに変換。製品知識や技術制約を永続化し、従来の対話型モデルでの情報消失を防止します。....
統合型の生成AIプラットフォームで、画像?動画の生成および編集機能を提供しています。
統合型AIクリエイティブプラットフォームで、ビデオ、画像、音楽、音声合成などの機能を統合しています。
無料の統合型AI音声創作プラットフォームで、テキストを音声に変換するなどの機能をサポートしています。
BestPDFは統合型のオンラインPDF編集と変換ツールで、機能が豊富でウォーターマークがありません。
Xai
$1.4
入力トークン/百万
$3.5
出力トークン/百万
2k
コンテキスト長
Openai
$7.7
$30.8
200
-
Anthropic
$105
$525
Alibaba
$3.9
$15.2
64
Baidu
32
Deepseek
$4
$12
128
Tencent
$0.63
$3.15
131
Huawei
Chatglm
$0.7
$1.95
16
Iflytek
$2
8
$0.3
jackcloudman
Qwen3-Next-80B-A3B-Thinkingは通義千問チームが開発した新世代の思考型大規模言語モデルで、革新的な混合注意力機構と高疎性MoEアーキテクチャを採用し、高効率推論を維持しながら強力な複雑推論能力を備え、ネイティブで262Kの文脈長をサポートします。
scb10x
Typhoon2.1-Gemma3-12Bは、Gemma3アーキテクチャに基づいて構築されたタイ語命令型大規模言語モデルで、120億のパラメータを持ち、128Kのコンテキスト長と関数呼び出し機能をサポートし、主にタイ語と英語をサポートします。
facebook
DINOv3はMeta AIが開発した多機能ビジュアル基礎モデルで、微調整なしで幅広いビジュアルタスクで専用モデルを上回ります。このモデルは高品質な密集特徴を生成でき、様々なビジュアルタスクで優れた性能を発揮し、これまでの自己監督型および弱監督型の基礎モデルを大幅に上回っています。
prithivMLmods
Qwen3は通義千問シリーズの大規模言語モデルの最新バージョンで、一連の高密度型および混合専門家(MoE)モデルを提供しています。大規模なトレーニングに基づき、Qwen3は推論能力、命令追従、エージェント機能、多言語サポートにおいて画期的な進歩を実現しました。
Typhoon2.1-Gemma3-12Bは指令型のタイ語大規模言語モデルで、120億のパラメータ、128Kのコンテキスト長、関数呼び出し機能を持っています。
Typhoon2.1-Gemma3-4Bは命令型のタイ語大規模言語モデルで、40億のパラメータと128Kのコンテキスト長を持ち、関数呼び出し機能をサポートしています。
RedHatAI
これはOpenAIのwhisper-large-v3モデルの量子化バージョンで、重みをINT4データ型に量子化することで、推論効率を大幅に向上させています。このモデルは音声認識タスクに特化しており、多言語の音声をテキストに変換する機能をサポートしており、効率的な音声処理が必要なシーンに適しています。
deepseek-ai
Janus-Proは革新的な自己回帰型フレームワークで、マルチモーダル理解と生成機能を統合しています。視覚エンコーディングパスを分離し、単一のTransformerアーキテクチャで処理することで、視覚エンコーダが理解と生成の役割間で生じる衝突を解決しました。
motexture
条件強化型テキスト動画生成モデル。時系列条件変換器で生成シーンを拡張しスムーズな遷移を実現、プロンプト補間機能をサポート
Llama3.2-Typhoon2-1Bは10億のパラメータを持つタイ語命令型大規模言語モデルで、Llama3.2-1Bをベースに構築されています。このモデルはタイ語に特化して最適化されており、さまざまな自然言語処理タスクをサポートし、優れた命令遵守能力と関数呼び出し機能を備えています。
dphn
Dolphin 2.9.3 Mistral Nemo 12bは、精心に企画・訓練された命令追従型の大規模言語モデルで、様々な対話、コーディング、エージェント機能を備え、関数呼び出しをサポートしており、Mistral - Nemo - Base - 2407をベースに微調整されています。
brad-twinkl
万能型ControlNetモデル、12種類の制御条件と5つの高度な編集機能をサポート、画像生成と編集を統合
LyliaEngine
Pony Diffusion V6 は多機能なSDXLファインチューニングモデルで、様々な獣人、獣形態または人型生物のビジュアルを生成可能、SFWとNSFWコンテンツに対応しています。
Hieraは階層型ビジョントランスフォーマーモデルで、高速性、強力な機能、ミニマリストな設計を兼ね備え、画像・動画タスクにおいて既存技術を大幅に上回る性能と計算効率を発揮
meetkai
機能型は関数/プラグイン呼び出しを解析・実行できる言語モデルで、インテリジェントな並列ツール呼び出しとツール出力結果の分析をサポートします。
機能型は関数/プラグインを解析・実行可能な言語モデルで、インテリジェントな並列ツール呼び出しをサポートし、ツール使用のタイミングや通常の対話応答を自主判断できます。
fnlp
MOSSはプラグイン拡張をサポートするオープンソースの対話型言語モデルで、パラメータ数160億、中英対話とツール呼び出し機能を備えています。
Claude Debugs For Youは、MCPサーバーを介してLLM(Claudeなど)との対話型コードデバッグを実現するVS Code拡張機能です。
DevOps AIツールキットはAIベースのプラットフォームエンジニアリングとDevOps自動化ツールで、インテリジェントなKubernetes操作と対話型ワークフローを通じて、チームにリソースデプロイ提案、問題修復、プロジェクトガバナンス、共有ヒントライブラリなどの機能を提供し、複雑なクラウドネイティブ操作を自然言語対話で実現します。
Mux Node APIライブラリは、サーバーサイドのTypeScriptまたはJavaScriptからMux REST APIに簡単にアクセスするためのライブラリです。完全なAPIドキュメント、型定義、エラー処理、自動ページング、JWTツール、Webhook検証などの機能を提供し、複数のランタイム環境をサポートします。
Graphiti MCP Serverは、AIエージェントが動的環境で時間感知型の知識グラフを構築およびクエリするための拡張版の知識グラフフレームワークです。MCPプロトコルを通じてコア機能を公開し、ユーザーの対話、企業データ、外部情報の継続的な統合をサポートし、増分更新、効率的な検索、正確な履歴クエリ機能を提供します。
ZenMemory MCPサーバーは、MCPプロトコルとSolana Agent Kitに基づいて構築された分散型AI記憶インフラストラクチャプロジェクトで、記憶保存、検索、およびブロックチェーン上の記憶コンテキスト機能を提供します。
このプロジェクトは、Google Cloud Vertex AI Geminiモデルに基づくMCPサーバーで、コード支援と一般的な質問応答に使用する豊富なツールセットを提供します。Web検索強化型の回答、ドキュメントの説明生成、ファイルシステム操作などの機能をサポートしています。
MCPプロトコルに基づくレモネードスタンドゲームサーバーで、Claudeデスクトップクライアントを通じてAI対話型ゲーム体験を提供し、動的な天候、ビジネスシミュレーション、戦略的な意思決定機能を備えています。
Dockerコンテナに基づくMCPサーバーで、AIアシスタントにコンテナ内での安全なコマンド実行とファイル操作機能を提供し、プロセス管理と対話型入力をサポートします。
MCPプロトコルに基づくSSHサーバー実装で、安全なリモートアクセスと実行機能を提供し、SQLiteデータベース統合とTypeScriptの型安全サポートを備えています。
Cursor MCPは、Claude AIとデスクトップアプリケーションをシームレスに統合するツールで、Cursor IDEを通じてAI機能と開発ワークフローを橋渡しし、実時のプログラミング支援とコンテキスト感知型のコード提案を提供します。
Pega DX MCP Serverは、モデルコンテキストプロトコル(MCP)を介してPega Infinity™アプリケーションを直感的な対話型体験に変える実験的なプロジェクトです。Pega DX APIと自然言語インターフェースの橋渡しとして機能し、GenAIエージェント、IDE、その他のMCP対応ツールが簡単な人間が読めるコマンドを使用してPega Infinity™アプリケーションと対話できるようにします。
MUXI.aiは、オープンソースのマルチAIエージェントシステムフレームワークで、永続的なメモリ、標準化された通信プロトコル、および思考チェーン追跡機能を提供し、複数のインターフェース統合をサポートします。開発者が高度なAIアプリケーションを構築するためのモジュール型で拡張可能なプラットフォームを目指しています。
Calva MCP ServerはVS Codeの拡張機能で、Clojure/ClojureScript開発にAIプログラミングアシスタント機能を提供し、REPLを接続することで対話型プログラミングを実現し、AIがコードをリアルタイムで実行およびテストできるようにします。
RustをベースにしたMCPサーバーで、Google DriveとGoogle Sheetsとのやり取り機能を提供し、ファイルリスト、表の読み書きなどの操作をサポートし、分散型プロキシワークフローに統合できます。
Trello MCPサーバーは、Model Context Protocolに基づくサーバーで、Trello APIとやり取りするツールを提供し、完全なTrello機能インターフェース、モジュール化アーキテクチャ、型安全サポートを備えています。
これは、セルフホスト型Supabaseインスタンス用に設計されたモデルコンテキストプロトコル(MCP)サーバープロジェクトです。データベース管理、スキーマクエリ、ユーザー認証、ストレージビューなどの機能を提供し、MCPクライアントツールを介した開発環境の統合をサポートしています。
Rustドキュメントのアクセスを提供するMCPサーバーで、docs.rsからのドキュメント、型情報、機能フラグ、バージョン番号、シンボル定義/ソースコードの検索に対応。
MCPエージェントのTypeScript版は、TypeScriptベースのインテリジェントなコンテキスト認識エージェントフレームワークで、モジュール型アーキテクチャ、高度なワークフロー管理、強力なロギングシステム、および柔軟な実行器などの機能を提供します。これは元のMCPエージェントのTypeScriptポート版です。
Laravel Vibesは、マシンコントロールプロトコル(MCP)サーバーを実現するための強力なLaravelパッケージで、AIエージェントのシームレスな統合をサポートします。ツール登録システム、リアルタイム通信(SSE)、APIエンドポイントなどの機能を提供し、自動検出と型安全をサポートします。
ユーザーがFastMCPを使用してカスタムMCPサーバーを作成するのを支援するツールで、対話型設定とコード生成機能を提供します。