MiniMax M2模型採用全注意力機制,放棄線性或稀疏注意力技術。開發團隊認爲,儘管後者能節省計算資源,但全注意力在工業應用中更高效,能提升模型性能。這一決策旨在優化實際部署效果,推動AI技術發展。
崑崙萬維SkyReels平臺推出V3模型,整合Sora2、Veo3.1等頂尖AI視頻技術,提供一站式視頻創作工具,助力開發者洞悉趨勢和創新應用。
MiniMax推出新一代音樂生成模型Music2.0,憑藉顯著提升的音樂理解與表達能力,被形容爲“會唱歌的製作人”。該模型能精準捕捉人聲情緒和器樂動態,在聲音表現力上實現關鍵突破,預示着音樂創作體驗的重大變革。
MiniMax即將在1至2周內發佈新一代M2.1模型,作爲M2的關鍵升級版,旨在加速其“智能普惠”戰略。此前M2以僅爲Claude Sonnet 8%的低價和翻倍推理速度贏得開發者好評,展現公司在開源大模型領域的強勁競爭力。
MiniMax Agent是一款智能AI伴侶,利用先進的多模態技術提供支持。
MiniMax-Text-01是一個強大的語言模型,具有4560億總參數,能夠處理長達400萬token的上下文。
強大的語言模型,擁有4560億總參數,可處理長達400萬token的上下文。
引領AI視頻、音樂、文本創作新潮流
minimax
-
輸入tokens/百萬
輸出tokens/百萬
1M
上下文長度
$1
$8
4M
DevQuasar
本項目提供了cerebras/MiniMax-M2-REAP-172B-A10B模型的量化版本,致力於讓知識為大眾所用。這是一個1720億參數的大型語言模型,經過優化和量化處理,旨在降低部署成本和提高推理效率。
noctrex
這是MiniMax-M2-REAP-172B-A10B模型的MXFP4_MOE量化版本,是一個內存高效的壓縮模型。通過REAP(路由加權專家激活剪枝)方法,在保持性能的同時將模型從230B參數壓縮到172B參數,體積縮小25%,適用於資源受限的環境、本地部署和學術研究。
cerebras
MiniMax-M2-REAP-162B-A10B是MiniMax-M2的高效壓縮版本,採用REAP(路由加權專家激活剪枝)方法,在保持性能幾乎不變的情況下將模型大小減少30%,從230B參數壓縮到162B參數,顯著降低了內存需求。
MiniMax-M2-REAP-172B-A10B是MiniMax-M2的內存高效壓縮變體,採用REAP專家剪枝方法,在保持性能幾乎不變的情況下,模型大小減輕了25%,從230B參數壓縮至172B參數。
這是MiniMax-M2-THRIFT模型的MXFP4_MOE量化版本,在原模型基礎上進行了壓縮處理,包括25%的專家剪枝(從256到192)並設置top_k=8,同時保留了編碼模型的特性,可用於文本生成任務。
catalystsec
本項目對MiniMax-M2模型進行4位量化處理,使用DWQ(動態權重量化)方法,藉助mlx-lm庫達成。該模型是MiniMax-M2的輕量化版本,在保持較好性能的同時大幅減小模型體積。
unsloth
MiniMax-M2是一款專為最大化編碼和智能體工作流程而構建的小型混合專家模型,總參數達2300億,激活參數為100億。該模型在編碼和智能體任務中表現卓越,同時保持強大的通用智能,具有緊湊、快速且經濟高效的特點。
anikifoss
本項目是對MiniMax-M2模型進行的高質量HQ4_K量化,專門針對文本生成任務優化,特別適用於對話場景。該量化版本未使用imatrix,保持了模型的性能表現。
本項目是使用 mlx-lm 庫通過動態權重量化(DWQ)將 MiniMax-M2 模型量化為 3 位的成果。它能夠在資源受限的條件下,高效地進行文本生成任務,為相關應用提供了更輕量級的解決方案。
bartowski
本項目對MiniMaxAI的MiniMax-M2模型進行了量化處理,使用llama.cpp工具,為不同需求的用戶提供了多種量化類型的模型文件,方便在不同硬件條件下高效運行模型。
本項目是基於MiniMaxAI/MiniMax-M2模型的量化版本,致力於讓知識為大眾所用。提供了多個不同量化級別的模型版本,並展示了各版本的困惑度性能指標。
redponike
MiniMax-M2是一款專為高效編碼和智能體工作流打造的混合專家模型,具備2300億總參數和100億激活參數。該模型在編碼和智能體任務中表現卓越,同時具有低延遲、低成本和高吞吐量的特點,能有效提升工作效率。
這是MiniMax-M2模型的MXFP4_MOE量化版本,基於unsloth修復聊天模板的版本重新量化,能在特定場景下更高效地使用MiniMax-M2模型的能力。這是一個編碼模型,需要配合最新的llama.cpp使用。
bullerwins
MiniMax-M2是一款專為最大化編碼和智能體工作流程而構建的小型混合專家(MoE)模型。它擁有2300億總參數,僅激活100億參數,在編碼和智能體任務中表現卓越,同時保持強大的通用智能,具有緊湊、快速且經濟高效的特點。
mlx-community
這是MiniMax-M2模型的MLX格式轉換版本,使用mlx-lm 0.28.1從原始模型轉換而來,支持8位量化和分組大小為32的優化配置,專為Apple Silicon設備優化運行。
inferencerlabs
MiniMax-M2 6.5bit MLX是基於MiniMax-M2模型的量化版本,在文本生成任務中表現出色,支持多種量化級別,其中q6.5bit量化在測試中能達到1.128的困惑度,與q8相當。
MiniMax-M2-5bit 是基於 MiniMaxAI/MiniMax-M2 模型轉換而來的 5 位量化版本,專為 MLX 框架優化。該模型是一個大型語言模型,支持文本生成任務,採用 MIT 許可證發佈。
cturan
MiniMax-M2 是一個基於 llama.cpp 實驗性分支構建的大語言模型,具有混合專家架構,支持高效的文本生成和推理任務。該模型需要特定的實驗性分支才能正常運行。
這是MiniMax-M2模型的MLX格式8位量化版本,使用mlx-lm 0.28.4從原始模型轉換而來,專為Apple Silicon設備優化運行。
ModelCloud
這是一個基於MiniMax M2基礎模型的4bit W4A16量化版本,由ModelCloud的@Qubitum使用GPT-QModel工具進行量化。該模型專門針對文本生成任務進行了優化,在保持較好性能的同時顯著減少了模型大小和推理資源需求。
MiniMax Model Context Protocol (MCP) 是一個官方服務器,支持與強大的文本轉語音、視頻/圖像生成API交互,適用於多種客戶端工具如Claude Desktop、Cursor等。
MiniMax官方模型上下文協議(MCP)服務器,支持文本轉語音、視頻/圖像生成等API交互。
Minimax MCP Tools是一個集成Minimax AI能力的MCP服務器實現,提供圖像生成和文本轉語音功能。
MiniMax MCP JS是一個基於JavaScript/TypeScript實現的MiniMax MCP協議工具集,提供圖像生成、視頻生成、文本轉語音等功能,支持與MCP兼容客戶端交互。
MiniMax MCP JS是一個JavaScript/TypeScript實現的MiniMax模型上下文協議工具包,提供文本轉語音、圖像生成、視頻生成和語音克隆等功能,支持多種配置方式和傳輸模式。
MiniMax-MCP是一個多功能服務器項目,提供文本轉語音、視頻生成和圖像生成等API服務,支持開發者集成高級多媒體功能。
Minimax MCP Tools是一個集成Minimax API的MCP服務器實現,提供AI圖像生成和文本轉語音功能,支持與Windsurf編輯器無縫集成。
一個基於MiniMax Music API的MCP服務器實現,用於AI驅動的音樂生成,支持與Claude Desktop無縫集成。
Gurddy MCP服務器是一個基於gurddy優化庫的綜合約束求解和優化平臺,支持約束滿足問題、線性規劃、Minimax博弈論和SciPy高級優化,提供16種求解工具並通過Stdio和HTTP兩種MCP傳輸協議為IDE和Web客戶端提供服務
基於Minimax AI和Amazon S3的語音生成MCP服務器,提供文本轉語音功能並自動上傳音頻文件到雲端存儲
MiniMax官方提供的MCP服務,支持文本轉語音、語音克隆、視頻生成和圖像生成等多種功能,可通過API與Claude、Cursor等客戶端集成使用。
go-mcp-harbor是一個基於go-mcp SDK開發的MCP服務與客戶端示例庫,包含高德MCP客戶端和MiniMax海螺的MCP服務端及客戶端實現,支持文本轉音頻、文本轉圖像、語音克隆等功能,僅供個人開發參考。