稀宇科技(MiniMax)推出新一代旗艦模型MiniMax-M3時,將按次計費改爲按Token消耗量計費,未提前充分溝通。由於Token消耗遠超預期,導致重度用戶額度快速耗盡,引發開發者強烈不滿。6月2日晚,MiniMax發佈致歉聲明,承認溝通不足。
AI初創公司MiniMax發佈旗艦大模型M3,性能驚豔:在接近真實軟件工程場景的測試中取得59%成績,超越GPT-5.5,逼近Opus4.7,具備百萬級上下文處理能力和原生多模態特性,但發佈後引發爭議。
MiniMax M3模型正式發佈,京東雲JoyBuilder平臺同步接入並開放服務。核心亮點是推理性能大幅提升,通過自研推理框架結合PD分離部署、KV Cache緩存及投機採樣等優化技術,實現更高效的實際運行效果。
開源OpenAI Responses API網關GodeX發佈v1.1.0版本,核心升級包括:默認模型切換至MiniMax-M3,深度適配多模態理解與思考控制,實現智譜原生聯網搜索結果的還原橋接。該工具旨在爲開發者提供統一的本地網關解決方案,簡化Codex、CLI工具等複雜協議集成,加速彌合大模型生態的協議割裂。
agent minimax io執行安全驗證,防範惡意自動程序
MiniMax Agent是一款智能AI伴侶,利用先進的多模態技術提供支持。
在 ChatGPT 對話中提供迷你Map概覽,方便快速瀏覽和導航。
MiniMax-Text-01是一個強大的語言模型,具有4560億總參數,能夠處理長達400萬token的上下文。
Openai
$2.8
輸入tokens/百萬
$11.2
輸出tokens/百萬
1k
上下文長度
$7.7
$30.8
200
$0.4
-
128
$1.75
$14
400
$56
$0.7
Alibaba
$2
32
Xai
$2.1
$3.5
Minimax
$1.6
$16
Stepfun
$1
Baichuan
$38
$120
16
$8
Iflytek
8
bartowski
這是對VibeStudio的MiniMax-M2-THRIFT模型進行的量化處理版本,使用llama.cpp工具和特定數據集生成,提供多種量化類型的GGUF文件,支持在LM Studio或基於llama.cpp的項目中運行。
這是通過REAP方法對MiniMax-M2均勻裁剪25%的專家得到的172B參數大語言模型,專門針對llama.cpp進行了優化量化處理,支持多種量化級別,可在LM Studio或基於llama.cpp的項目中運行。
這是一個基於REAP方法對MiniMax-M2中40%專家進行均勻剪枝得到的139B參數大語言模型,採用GLM架構和專家混合(MoE)技術,通過llama.cpp進行多種量化處理,適用於文本生成任務。
DevQuasar
本項目提供了cerebras/MiniMax-M2-REAP-172B-A10B模型的量化版本,致力於讓知識為大眾所用。這是一個1720億參數的大型語言模型,經過優化和量化處理,旨在降低部署成本和提高推理效率。
noctrex
這是MiniMax-M2-REAP-172B-A10B模型的MXFP4_MOE量化版本,是一個內存高效的壓縮模型。通過REAP(路由加權專家激活剪枝)方法,在保持性能的同時將模型從230B參數壓縮到172B參數,體積縮小25%,適用於資源受限的環境、本地部署和學術研究。
cerebras
MiniMax-M2-REAP-162B-A10B是MiniMax-M2的高效壓縮版本,採用REAP(路由加權專家激活剪枝)方法,在保持性能幾乎不變的情況下將模型大小減少30%,從230B參數壓縮到162B參數,顯著降低了內存需求。
MiniMax-M2-REAP-172B-A10B是MiniMax-M2的內存高效壓縮變體,採用REAP專家剪枝方法,在保持性能幾乎不變的情況下,模型大小減輕了25%,從230B參數壓縮至172B參數。
cyankiwi
MiniMax-M2 AWQ - INT4是基於MiniMax-M2模型進行量化後的版本,採用INT4量化技術,在保證性能的前提下顯著減少內存使用並提高推理效率。該模型在編碼和智能體任務方面表現出色,具有卓越的綜合性能。
這是MiniMax-M2-THRIFT模型的MXFP4_MOE量化版本,在原模型基礎上進行了壓縮處理,包括25%的專家剪枝(從256到192)並設置top_k=8,同時保留了編碼模型的特性,可用於文本生成任務。
catalystsec
本項目對MiniMax-M2模型進行4位量化處理,使用DWQ(動態權重量化)方法,藉助mlx-lm庫達成。該模型是MiniMax-M2的輕量化版本,在保持較好性能的同時大幅減小模型體積。
unsloth
MiniMax-M2是一款專為最大化編碼和智能體工作流程而構建的小型混合專家模型,總參數達2300億,激活參數為100億。該模型在編碼和智能體任務中表現卓越,同時保持強大的通用智能,具有緊湊、快速且經濟高效的特點。
anikifoss
本項目是對MiniMax-M2模型進行的高質量HQ4_K量化,專門針對文本生成任務優化,特別適用於對話場景。該量化版本未使用imatrix,保持了模型的性能表現。
本項目是使用 mlx-lm 庫通過動態權重量化(DWQ)將 MiniMax-M2 模型量化為 3 位的成果。它能夠在資源受限的條件下,高效地進行文本生成任務,為相關應用提供了更輕量級的解決方案。
本項目對MiniMaxAI的MiniMax-M2模型進行了量化處理,使用llama.cpp工具,為不同需求的用戶提供了多種量化類型的模型文件,方便在不同硬件條件下高效運行模型。
本項目是基於MiniMaxAI/MiniMax-M2模型的量化版本,致力於讓知識為大眾所用。提供了多個不同量化級別的模型版本,並展示了各版本的困惑度性能指標。
redponike
MiniMax-M2是一款專為高效編碼和智能體工作流打造的混合專家模型,具備2300億總參數和100億激活參數。該模型在編碼和智能體任務中表現卓越,同時具有低延遲、低成本和高吞吐量的特點,能有效提升工作效率。
這是MiniMax-M2模型的MXFP4_MOE量化版本,基於unsloth修復聊天模板的版本重新量化,能在特定場景下更高效地使用MiniMax-M2模型的能力。這是一個編碼模型,需要配合最新的llama.cpp使用。
bullerwins
MiniMax-M2是一款專為最大化編碼和智能體工作流程而構建的小型混合專家(MoE)模型。它擁有2300億總參數,僅激活100億參數,在編碼和智能體任務中表現卓越,同時保持強大的通用智能,具有緊湊、快速且經濟高效的特點。
mlx-community
這是MiniMax-M2模型的MLX格式轉換版本,使用mlx-lm 0.28.1從原始模型轉換而來,支持8位量化和分組大小為32的優化配置,專為Apple Silicon設備優化運行。
inferencerlabs
MiniMax-M2 6.5bit MLX是基於MiniMax-M2模型的量化版本,在文本生成任務中表現出色,支持多種量化級別,其中q6.5bit量化在測試中能達到1.128的困惑度,與q8相當。
MiniMax Model Context Protocol (MCP) 是一個官方服務器,支持與強大的文本轉語音、視頻/圖像生成API交互,適用於多種客戶端工具如Claude Desktop、Cursor等。
MiniMax官方模型上下文協議(MCP)服務器,支持文本轉語音、視頻/圖像生成等API交互。
一個基於官方MCP SDK的Cursor IDE最小化MCP服務實現,用於快速啟動或實驗。
Minimax MCP Tools是一個集成Minimax AI能力的MCP服務器實現,提供圖像生成和文本轉語音功能。
MiniMax MCP JS是一個基於JavaScript/TypeScript實現的MiniMax MCP協議工具集,提供圖像生成、視頻生成、文本轉語音等功能,支持與MCP兼容客戶端交互。
MiniMax為Coding Plan用戶定製的MCP服務器,提供AI驅動的網絡搜索和圖像分析工具,專為代碼開發工作流優化,可集成到Claude Desktop、Cursor等MCP客戶端中增強編程體驗。
MiniMax MCP JS是一個JavaScript/TypeScript實現的MiniMax模型上下文協議工具包,提供文本轉語音、圖像生成、視頻生成和語音克隆等功能,支持多種配置方式和傳輸模式。
MiniMax-MCP是一個多功能服務器項目,提供文本轉語音、視頻生成和圖像生成等API服務,支持開發者集成高級多媒體功能。
基於Nix的Python MCP服務器項目,包含位置展示和時間獲取功能
Minimax MCP Tools是一個集成Minimax API的MCP服務器實現,提供AI圖像生成和文本轉語音功能,支持與Windsurf編輯器無縫集成。
MiniMind Docker是一個一體化部署解決方案,提供包含Web界面、API和MCP支持的MiniMind大語言模型服務,支持一鍵Docker部署、智能GPU管理和多語言界面。
一個基於MiniMax Music API的MCP服務器實現,用於AI驅動的音樂生成,支持與Claude Desktop無縫集成。
一個基於TypeScript的MCP服務器模板,提供示例操作和加法工具,用於AI模型與外部工具的通信。
一個基於Bun運行時的最小MCP服務項目,包含依賴安裝和運行指令
一個使用Minimal API的MCP服務器項目
Gurddy MCP服務器是一個基於gurddy優化庫的綜合約束求解和優化平臺,支持約束滿足問題、線性規劃、Minimax博弈論和SciPy高級優化,提供16種求解工具並通過Stdio和HTTP兩種MCP傳輸協議為IDE和Web客戶端提供服務
基於Minimax AI和Amazon S3的語音生成MCP服務器,提供文本轉語音功能並自動上傳音頻文件到雲端存儲
MiniMax官方提供的MCP服務,支持文本轉語音、語音克隆、視頻生成和圖像生成等多種功能,可通過API與Claude、Cursor等客戶端集成使用。
輕量級MCP服務器,將Godot LSP連接到MCP客戶端,用於GDScript語法驗證和診斷
用於測試Copilot Studio集成的簡易MCP服務器項目