AR眼鏡通過MLLM-SC框架實現高效語義處理:10毫秒內生成語義注意力熱圖,優先標記關鍵目標(如建築輪廓),降低背景數據碼率。系統利用語義引擎篩選任務相關多模態數據,優化傳輸路徑,釋放6G網絡30%帶寬,實現設備與邊緣服務器協同,提升響應效率。
華納兄弟探索公司爲提升個性化內容體驗,採用AWS Graviton處理器和Amazon SageMaker AI實例優化AI/ML推理基礎設施,實現顯著成本節約與性能提升。作爲全球領先媒體娛樂企業,其內容覆蓋電視、電影及流媒體領域。
月之暗面推出“Kimi Linear”混合線性注意力架構,在短長距離信息處理和強化學習中性能優於傳統全注意力方法。其核心Kimi Delta Attention優化了Gated DeltaNet,引入高效門控機制,提升有限狀態RNN的記憶管理效率。架構由三份KDA和一份全局MLA組成。
Apple開放FastVLM視覺語言模型,可在搭載Apple Silicon芯片的Mac上體驗。該模型基於MLX框架構建,提供近乎即時的高分辨率圖像處理,視頻字幕處理速度提升85倍,體積縮小3倍以上,支持多平臺和瀏覽器直接使用。
一款為 AI/ML 模型監控和管理而設計的工具。
提供全球最便宜的GPU雲服務,助力自託管AI/ML開發。
MLGym是一個用於推進AI研究代理的新框架和基準。
FlashMLA 是一個針對 Hopper GPU 優化的高效 MLA 解碼內核,適用於變長序列服務。
ExaltedSlayer
Gemma 3是谷歌推出的輕量級開源多模態模型,本版本為12B參數的指令調優量化感知訓練模型,已轉換為MLX框架的MXFP4格式,支持文本和圖像輸入並生成文本輸出,具有128K上下文窗口和140+語言支持。
kyr0
這是一個專為蘋果硅芯片設備優化的自動語音識別模型,通過轉換為MLX框架並量化為FP8格式,實現在蘋果設備上的快速端上語音轉錄。該模型針對逐字精度進行微調,特別適用於需要高精度轉錄的場景。
ubergarm
這是ai-sage/GigaChat3-10B-A1.8B-bf16模型的GGUF量化版本,提供了多種量化選項,從高精度的Q8_0到極度壓縮的smol-IQ1_KT,滿足不同硬件條件下的部署需求。該模型支持32K上下文長度,採用MLA架構,專為對話場景優化。
mlx-community
本模型是基於allenai/Olmo-3-7B-Instruct轉換的8位量化版本,專門為Apple MLX框架優化。它是一個70億參數的大型語言模型,支持指令跟隨和對話任務。
VibeThinker-1.5B的4位量化版本,基於MLX框架針對蘋果芯片優化,是一個擁有15億參數的密集語言模型,專門用於數學推理和算法編碼問題
ai-sage
GigaChat3-10B-A1.8B-base是GigaChat系列的基礎預訓練模型,採用混合專家(MoE)架構,總參數100億,活躍參數18億。模型集成了多頭潛在注意力(MLA)和多令牌預測(MTP)技術,在推理時具備高吞吐量優勢。
inferencerlabs
Kimi - K2 - Thinking 3.825bit MLX 是一款用於文本生成的量化模型,通過不同的量化方式在測試中取得不同的困惑度表現,其中q3.825bit量化能達到1.256的困惑度。
Ali-Yaser
本模型是基於meta-llama/Llama-3.3-70B-Instruct進行微調得到的版本,使用mlabonne/FineTome-100k數據集進行訓練,包含100k token數據。模型採用Unsloth和Huggingface TRL庫進行微調,支持英文語言處理。
Leohan
基於MLX庫開發的文本生成模型,專注於自然語言處理任務,為開發者提供高效的文本生成解決方案。
基於MLX庫實現的文本生成模型,支持多種量化方式推理,具備分佈式計算能力,可在蘋果硬件環境下高效運行。
Kimi-K2-Thinking 是由 mlx-community 從 moonshotai 原版模型轉換而來的 MLX 格式大語言模型,採用 mlx-lm 0.28.4 版本進行轉換,保留了原模型的思維鏈推理能力。
Marvis-AI
這是一個基於MLX框架優化的文本轉語音模型,從原始模型Marvis-AI/marvis-tts-100m-v0.2轉換而來,採用6位量化技術,專門為Apple Silicon硬件優化,提供高效的語音合成能力。
Qwen3-Coder-480B-A35B-Instruct是一個4800億參數的大型代碼生成模型,支持8.5bit量化,基於MLX框架優化。該模型專門針對代碼生成任務設計,在配備足夠內存的設備上能夠高效運行。
catalystsec
本項目對MiniMax-M2模型進行4位量化處理,使用DWQ(動態權重量化)方法,藉助mlx-lm庫達成。該模型是MiniMax-M2的輕量化版本,在保持較好性能的同時大幅減小模型體積。
這是一個基於 Kimi-Linear-48B-A3B-Instruct 模型轉換的 6 位量化版本,專為 Apple MLX 框架優化。該模型保留了原模型強大的指令跟隨能力,同時通過量化技術顯著降低了存儲和計算需求,適合在 Apple 硬件上高效運行。
lmstudio-community
Qwen3-VL-2B-Thinking是由Qwen推出的視覺語言模型,基於2B參數規模,使用MLX進行8位量化,專門針對Apple Silicon芯片進行了優化。該模型支持圖像和文本的多模態理解與生成任務。
這是基於moonshotai/Kimi-Linear-48B-A3B-Instruct模型轉換的4位量化版本,專為Apple MLX框架優化,提供高效的文本生成能力
本項目是使用 mlx-lm 庫通過動態權重量化(DWQ)將 MiniMax-M2 模型量化為 3 位的成果。它能夠在資源受限的條件下,高效地進行文本生成任務,為相關應用提供了更輕量級的解決方案。
這是MiniMax-M2模型的MLX格式轉換版本,使用mlx-lm 0.28.1從原始模型轉換而來,支持8位量化和分組大小為32的優化配置,專為Apple Silicon設備優化運行。
MiniMax-M2 6.5bit MLX是基於MiniMax-M2模型的量化版本,在文本生成任務中表現出色,支持多種量化級別,其中q6.5bit量化在測試中能達到1.128的困惑度,與q8相當。
該項目通過自然語言接口為MLflow提供模型上下文協議(MCP)服務,簡化機器學習實驗和模型的管理與查詢。
一個基於MLX Whisper的音頻轉錄MCP服務,支持本地文件、Base64音頻和YouTube視頻轉錄,專為蘋果M系列芯片優化。
該項目為MLflow Prompt Registry提供MCP協議支持服務,實現從MLflow中獲取和管理提示模板的功能,主要應用於Claude Desktop中便捷調用預設提示。
PromptLab是一個智能系統,通過MLflow集成將基礎用戶查詢優化為AI系統提示,提供動態模板匹配和參數提取功能。
一個基於MCP協議的MLB數據服務,提供全面的棒球統計數據訪問,包括球隊排名、賽程、球員信息等,支持AI應用集成。
一個基於Balldontlie API的MCP服務實現,提供NBA、NFL和MLB的球員、球隊及比賽信息查詢功能。
一個基於Python的ML模型溯源管理服務,使用FastAPI和SQLAlchemy構建,提供數據集管理、實體追蹤、活動日誌、代理管理和溯源關係跟蹤等功能。
MLflow Prompt Registry的MCP服務器,實現從MLflow中訪問和管理提示模板。
該項目通過Model Context Protocol (MCP)為MLflow提供自然語言交互界面,使用戶能用英語查詢和管理機器學習實驗與模型,包含服務端和客戶端組件。
一個兼容MCP協議的服務器項目,通過ASE、pymatgen和機器學習原子間勢能(MLIPs)提供原子尺度模擬功能,目前正在積極開發中。
一個基於Model Context Protocol(MCP)的服務器項目,通過MLB Stats API和pybaseball庫提供棒球統計數據訪問,包括Statcast、Fangraphs和Baseball Reference等數據源,並支持數據可視化。
一個增強Claude AI文檔搜索能力的MCP服務器項目,支持多AI/ML庫文檔搜索,集成Claude推理能力和智能網絡搜索。
MLflow Prompt Registry的MCP服務實現,支持從MLflow中獲取和管理提示模板,方便用戶在Claude Desktop中快速調用預設工作流。
一個集成Claude AI的文檔搜索助手,通過MCP服務器增強Claude的文檔檢索能力,支持多AI/ML庫文檔智能搜索與解釋。
一個基於MCP框架的MLB數據API封裝服務,提供賽程、比賽結果、球隊信息和球員查詢等功能。
MCP Servers是一個模型組合平臺(MCP)的服務器和服務集合,旨在促進各種AI/ML模型和服務的集成與部署。該項目採用模塊化架構,支持標準化通信和可擴展設計,包含天氣服務等多種服務器類型。
mcp-server-suite是一個開源的MCP服務器集合,旨在成為自動化領域的'HuggingFace'。它提供模塊化的服務器組件,支持從網頁搜索到數據庫操作等多種功能,並鼓勵社區貢獻擴展。項目包含核心服務器和規劃中的多種專業服務,涵蓋AI/ML、軟件開發和非技術場景,目標是通過標準化協議簡化自動化流程。
該項目通過自然語言接口為MLflow提供交互功能,包含服務端和客戶端組件,支持查詢實驗、模型註冊及系統信息,簡化了MLflow的管理操作。
項目摘要
HANA雲MCP服務器實現,提供模型上下文協議服務