Hermes Agent のスマートエージェントフレームワークは Nous Research によって開発され公開され、2026年2月にリリースされてから急速に登場し、世界のトークン消費量ランキングで初めて OpenClaw を上回って1位になりました。このエージェントは、小米 MiMo-V2-Pro、MiniMax M2.7、NVIDIA Nemotron 3 Super、ステップスターロック Step 3.5 Flash、およびテンセント Hy3 pr のトップ5モデルの呼び出しにおいて突出した性能を示しています。
稀宇科技の技術報告によると、M2シリーズモデルは「馬嘉祺」などの特定人名を正確に出力できず、トークナイザーによる「トークンシフト」問題が原因である。モデルが名前を「馬」と「嘉祺」に分割し、ベクトル空間が圧縮されて識別誤差が生じる。これは大規模モデル訓練における一般的だが隠れた欠陥を露呈し、特定人名の精密生成に影響を与えている。....
MiniMax M2シリーズモデルが「馬嘉祺」を出力する際に異常が発生。後訓練段階で低頻度トークンが劣化したため。トークナイザーが「馬嘉祺」を[馬, 嘉祺]に分割し、「嘉祺」は事前訓練で高頻度のため独立トークン(番号190467)に統合されたが、後続訓練で「圧迫」され出力エラーが発生。公式は技術報告書を発表し、このメカニズムを明らかにした。....
MiniMaxが自己進化モデルM2.7をオープンソース化し、同日にHuawei Ascend AIが0Day適応を完了。開発者は昇騰Atlas製品でシームレスに展開可能。モデルの核心は研究エージェントとしての自己進化・反復機能。....
マルチモーダルコンテキストにおける検索強化生成のためのベンチマークテストコードリポジトリです。
多様なモダリティに対応した音楽理解?生成システム
catalystsec
このプロジェクトでは、MiniMax - M2モデルを4ビット量子化処理し、DWQ(動的重み量子化)方法を使用し、mlx - lmライブラリを介して達成します。このモデルはMiniMax - M2の軽量化バージョンで、良好な性能を維持しながらモデルサイズを大幅に削減します。
bartowski
本プロジェクトでは、MiniMaxAIのMiniMax - M2モデルを量化処理し、llama.cppツールを使用して、様々なニーズを持つユーザーに複数の量化タイプのモデルファイルを提供し、異なるハードウェア条件下でのモデルの効率的な実行を容易にします。
redponike
MiniMax - M2は、高効率コーディングとインテリジェントエージェントワークフロー用に特別に開発されたハイブリッドエキスパートモデルで、総パラメータが2300億、活性化パラメータが100億です。このモデルは、コーディングとインテリジェントエージェントタスクで卓越した性能を発揮し、低遅延、低コスト、高スループットの特徴を持ち、作業効率を効果的に向上させます。
bullerwins
MiniMax - M2は、コーディングとエージェントワークフローを最大化するために構築された小型のハイブリッドエキスパート(MoE)モデルです。総パラメータは2300億で、活性化されるパラメータは100億のみで、コーディングとエージェントタスクで卓越した性能を発揮し、同時に強力な汎用知能を保持し、コンパクトで高速かつ経済的です。
inferencerlabs
MiniMax - M2 6.5ビットMLXは、MiniMax - M2モデルに基づく量子化バージョンで、テキスト生成タスクで優れた性能を発揮し、複数の量子化レベルをサポートします。そのうち、q6.5ビット量子化はテストで1.128の困惑度を達成し、q8と同等です。
ModelCloud
これはMiniMax M2ベースモデルに基づく4bit W4A16量子化バージョンで、ModelCloudの@QubitumがGPT - QModelツールを使用して量子化しました。このモデルはテキスト生成タスクに特化して最適化されており、良好な性能を維持しながら、モデルサイズと推論リソースの要件を大幅に削減します。
richardyoung
これは高性能の4ビット量子化版のKimi K2 Instructモデルで、MLXフレームワークを使用してApple Silicon(M1/M2/M3/M4)Mac上で実行するように最適化されています。このモデルは6710億のパラメータを持ち、128Kのコンテキストウィンドウをサポートし、品質と効率の間で優れたバランスを実現しており、ほとんどの実際のデプロイに理想的な選択肢です。
SweUmaVarsh
このモデルはTransformersライブラリに基づくモデルで、具体的な用途と機能はさらなる情報確認が必要です。
utrobinmv
m2mトランスフォーマーアーキテクチャに基づく多言語翻訳モデルで、ロシア語、中国語、英語間の双方向翻訳をサポート
entai2965
M2M100は100言語間の直接翻訳をサポートする多言語エンコーダー・デコーダーモデルで、パラメータ規模は12億です。
Swamitucats
M2M100をファインチューニングしたサンスクリット語から英語への翻訳モデルで、Itihasaデータセットからのサンスクリット語叙事詩の翻訳内容を含んでいます。
hazyresearch
M2-BERT-8Kは8000万パラメータの長文検索モデルで、論文『Benchmarking and Building Long-Context Retrieval Models with LoCo and M2-BERT』で提案されたアーキテクチャに基づいています。
8000万パラメータのM2-BERT-2kモデルチェックポイントで、長文検索タスク向けに設計されており、2048トークンのコンテキスト長をサポートします。
ai-forever
M2M100-1.2Bモデルを基に訓練されたロシア語スペルチェッカーで、スペルミスやタイプミスを修正します
M2-BERT-128は論文『Benchmarking and Building Long-Context Retrieval Models with LoCo and M2-BERT』で提案された8000万パラメータの検索モデルチェックポイント
togethercomputer
これは8000万パラメータのM2-BERT事前学習チェックポイントで、シーケンス長2048をサポートし、長文コンテキスト検索タスク向けにファインチューニングされています。
これは80MパラメータのM2-BERT事前学習モデルで、最大32768のシーケンス長をサポートし、長文コンテキスト検索タスクに最適化されています
これは8000万パラメータのM2-BERT事前学習チェックポイントで、シーケンス長は8192に達し、長文脈検索タスク向けにファインチューニングされています。
kazandaev
wmt16データセットでファインチューニングされた多言語翻訳モデルで、ロシア語から英語への翻訳タスクをサポート
anzorq
facebook/m2m100_1.2Bモデルをロシア語-カバルド語データセットでファインチューニングした翻訳モデル
MCPサーバーSSHクライアントは、SSHを介してリモートMCPサーバーに接続するツールで、キー認証と安全なチャネル通信をサポートし、AIプラットフォームに統合してリモートMCPツールを使用できます。
MCP SSHサーバーは、クライアントがSSHプロトコルを介して複数のMCPツールサービスに接続し、やり取りできる安全なリモートアクセスツールです。キー認証をサポートし、キー管理APIを提供し、複数のMCPサーバーを統一インターフェイスに集約することができます。