Moonshot AI推出Kosong,作爲LLM抽象層解決多模型工具交互的技術棧維護難題。它統一消息結構、支持異步工具編排和可插拔聊天提供商,避免業務邏輯硬編碼,簡化智能體開發。該Python庫作爲代理邏輯與LLM提供商間的中間層,是Kimi CLI的核心驅動組件。
國產團隊Moonshot AI發佈Kimi Linear架構技術報告,提出可替代完全注意力機制的混合線性架構。該架構在速度、內存效率和長上下文處理三方面實現突破,顯著降低KV緩存使用,兼具高效與性能優勢,被譽爲智能體時代注意力機制新起點。
Moonshot AI旗下智能助手Kimi推出Agent會員服務,爲早期打賞用戶提供福利:訂閱會員後,打賞金額可全額轉換爲會員時長。例如,訂閱一個月可獲贈九個月額外時長,回饋用戶支持。建議有打賞記錄的用戶儘快查看App詳情,機會有限。
Moonshot AI宣佈Kimi K2模型輸出速度大幅提升,kimi-k2-turbo-preview模型達每秒60個Tokens,最高100個Tokens,優化用戶體驗。目前仍享5折優惠,每百萬Tokens輸入價格(緩存命中)2.00元,緩存未命中價格未提及。
Kimi 視覺模型可理解圖片內容,包括文字、顏色和物體形狀等。
全球首個20萬漢字智能助手
月之暗面AI助手,您的私人AI夥伴
moonshotai
$4.1
輸入tokens/百萬
$16.56
輸出tokens/百萬
128k
上下文長度
moonshot
$0.5
-
8k
$1
$8
32k
DevQuasar
本項目基於 moonshotai/Kimi-K2-Thinking 基礎模型,通過自定義反量化腳本將原始的INT4模型轉換為更高質量的文本生成模型,致力於讓知識為每個人所用。
mlx-community
Kimi-K2-Thinking 是由 mlx-community 從 moonshotai 原版模型轉換而來的 MLX 格式大語言模型,採用 mlx-lm 0.28.4 版本進行轉換,保留了原模型的思維鏈推理能力。
這是一個基於Moonshot AI技術的量化版本模型,專注於視覺語言理解與生成任務,致力於降低知識獲取門檻,讓知識為每個人所用。
Kimi K2 Thinking 是月之暗面(Moonshot AI)開發的最新一代開源思維模型,具有強大的深度推理能力和工具調用功能。該模型採用混合專家架構,支持原生INT4量化,擁有256k上下文窗口,在多個基準測試中表現出色。
這是基於moonshotai/Kimi-Linear-48B-A3B-Instruct模型轉換的4位量化版本,專為Apple MLX框架優化,提供高效的文本生成能力
Kimi Linear是一種混合線性注意力架構,在各種場景下包括短、長上下文以及強化學習擴展機制中,均優於傳統的全注意力方法。它能有效解決傳統注意力機制在長上下文任務中效率低下的問題,為自然語言處理等領域帶來更高效的解決方案。
Kimi Linear是一種高效混合線性注意力架構,在短上下文、長上下文和強化學習場景中均優於傳統全注意力方法。它通過Kimi Delta Attention (KDA)機制優化注意力計算,顯著提升性能和硬件效率,特別擅長處理長達100萬令牌的長上下文任務。
anikifoss
這是對Moonshot AI的Kimi-K2-Instruct-0905模型的高質量量化版本,採用HQ4_K量化方法,專門優化了推理性能,支持75000上下文長度,適用於文本生成任務。
這是 moonshotai/Kimi-K2-Instruct-0905 模型的 MLX 格式轉換版本,採用創新的 DQ3_K_M 動態 3 位量化技術,專門為 Apple Silicon Mac 設備優化,在保持接近 4 位量化性能的同時顯著減少內存佔用。
這是 moonshotai/Kimi-K2-Instruct-0905 模型的量化版本,致力於讓知識為每個人所用。該項目提供了優化後的模型權重,便於在各種硬件上部署和使用。
inferencerlabs
基於moonshotai/Kimi-K2-Instruct-0905基礎模型,使用改進版MLX 0.26進行動態量化的大語言模型。通過創新的動態量化策略,在保持出色性能的同時顯著降低硬件需求,可在單臺M3 Ultra設備上高效運行。
ubergarm
這是moonshotai/Kimi-K2-Instruct-0905模型的GGUF格式量化版本,使用ik_llama.cpp分支進行最優量化。該模型採用混合專家架構,支持中文對話和文本生成任務,經過多種量化方案優化,在保持高質量的同時顯著減少內存佔用。
Kimi-K2 Dynamic MLX是基於moonshotai/Kimi-K2-Instruct模型構建的文本生成項目,採用優化後的MLX庫實現高效量化性能。該模型在單臺M3 Ultra 512GB RAM機器上運行,支持多種量化方式,在測試中展現出優秀的困惑度指標。
Kimi - K2 - Instruct 是一個基於 moonshotai/Kimi - K2 - Instruct 模型的量化版本,旨在讓知識更廣泛地惠及大眾。
Kimi-Dev-72B-8bit 是基於 moonshotai/Kimi-Dev-72B 轉換的 8 位量化版本,適用於 MLX 框架的文本生成模型。
Kimi-Dev-72B-4bit-DWQ 是一個基於 moonshotai/Kimi-Dev-72B 轉換而來的 4 位量化大語言模型,適用於 MLX 框架。
Kimi K2 是一款先進的混合專家(MoE)語言模型,擁有 320 億激活參數和 1 萬億總參數,針對代理能力進行了優化。
Kimi-K2-Instruct-4bit 是一個基於 moonshotai/Kimi-K2-Instruct 轉換而來的 4bit 量化模型,適用於 MLX 框架。
Kimi-Dev-72B-4bit 是一個基於 moonshotai/Kimi-Dev-72B 轉換的 4 位量化大語言模型,專為 MLX 框架優化。
Kimi-Dev-72B-5bit 是一個基於 moonshotai/Kimi-Dev-72B 轉換的 5 位量化大語言模型,適用於 Apple 設備的 MLX 框架。