Moonshot AI推出Kosong,作为LLM抽象层解决多模型工具交互的技术栈维护难题。它统一消息结构、支持异步工具编排和可插拔聊天提供商,避免业务逻辑硬编码,简化智能体开发。该Python库作为代理逻辑与LLM提供商间的中间层,是Kimi CLI的核心驱动组件。
国产AI公司月之暗面开源思考型模型Kimi K2Thinking,在HLE基准测试中以44.9%得分超越GPT-5等国际闭源模型,同时训练成本仅460万美元,展现高性价比优势,推动AI成本革命。
上海黄浦区法院一审判决AI提示词不具备作品独创性,不构成著作权侵权。这是上海首例涉AI提示词著作权案,法院认为提示词缺乏独创性,因此不受著作权法保护。
月之暗面发布并开源Kimi K2Thinking模型,显著提升智能代理和推理能力。该模型能自主边思考边使用工具,无需用户干预,支持长达300轮工具调用和多轮深度思考,旨在高效处理复杂任务。
强大的开源Kimi K2聊天平台,通过Kimi AI在编程和数学基准测试中超越GPT-4。企业级Kimi AI,成本降低95%。
开源编码 LLM,专为软件工程任务设计。
Kimi-Audio 是一个开源音频基础模型,擅长音频理解与生成。
高效的开源专家混合视觉语言模型,具备多模态推理能力。
moonshotai
$4.1
输入tokens/百万
$16.56
输出tokens/百万
128k
上下文长度
moonshot
-
DevQuasar
本项目基于 moonshotai/Kimi-K2-Thinking 基础模型,通过自定义反量化脚本将原始的INT4模型转换为更高质量的文本生成模型,致力于让知识为每个人所用。
inferencerlabs
基于MLX库实现的文本生成模型,支持多种量化方式推理,具备分布式计算能力,可在苹果硬件环境下高效运行。
mlx-community
Kimi-K2-Thinking 是由 mlx-community 从 moonshotai 原版模型转换而来的 MLX 格式大语言模型,采用 mlx-lm 0.28.4 版本进行转换,保留了原模型的思维链推理能力。
Kimi K2 Thinking 是月之暗面(Moonshot AI)开发的最新一代开源思维模型,具有强大的深度推理能力和工具调用功能。该模型采用混合专家架构,支持原生INT4量化,拥有256k上下文窗口,在多个基准测试中表现出色。
这是一个基于 Kimi-Linear-48B-A3B-Instruct 模型转换的 6 位量化版本,专为 Apple MLX 框架优化。该模型保留了原模型强大的指令跟随能力,同时通过量化技术显著降低了存储和计算需求,适合在 Apple 硬件上高效运行。
这是基于moonshotai/Kimi-Linear-48B-A3B-Instruct模型转换的4位量化版本,专为Apple MLX框架优化,提供高效的文本生成能力
Kimi Linear是一种混合线性注意力架构,在各种场景下包括短、长上下文以及强化学习扩展机制中,均优于传统的全注意力方法。它能有效解决传统注意力机制在长上下文任务中效率低下的问题,为自然语言处理等领域带来更高效的解决方案。
Kimi Linear是一种高效混合线性注意力架构,在短上下文、长上下文和强化学习场景中均优于传统全注意力方法。它通过Kimi Delta Attention (KDA)机制优化注意力计算,显著提升性能和硬件效率,特别擅长处理长达100万令牌的长上下文任务。
anikifoss
这是对Moonshot AI的Kimi-K2-Instruct-0905模型的高质量量化版本,采用HQ4_K量化方法,专门优化了推理性能,支持75000上下文长度,适用于文本生成任务。
这是 moonshotai/Kimi-K2-Instruct-0905 模型的 MLX 格式转换版本,采用创新的 DQ3_K_M 动态 3 位量化技术,专门为 Apple Silicon Mac 设备优化,在保持接近 4 位量化性能的同时显著减少内存占用。
这是 moonshotai/Kimi-K2-Instruct-0905 模型的量化版本,致力于让知识为每个人所用。该项目提供了优化后的模型权重,便于在各种硬件上部署和使用。
基于moonshotai/Kimi-K2-Instruct-0905基础模型,使用改进版MLX 0.26进行动态量化的大语言模型。通过创新的动态量化策略,在保持出色性能的同时显著降低硬件需求,可在单台M3 Ultra设备上高效运行。
ubergarm
这是moonshotai/Kimi-K2-Instruct-0905模型的GGUF格式量化版本,使用ik_llama.cpp分支进行最优量化。该模型采用混合专家架构,支持中文对话和文本生成任务,经过多种量化方案优化,在保持高质量的同时显著减少内存占用。
ssweens
Kimi-VL-A3B-Thinking-2506是月之暗面开发的多模态视觉语言模型,支持图像和文本的联合理解与推理,具备思维链推理能力,能够处理复杂的视觉语言任务。
AI-MO
Kimina-Prover-Distill-0.6B是由Project Numina和Kimi团队开发的定理证明模型,专注于Lean 4中的竞赛风格问题解决能力。它是Kimina-Prover-72B模型的蒸馏版本,在MiniF2F-test上达到了68.85%的准确率。
Kimi-K2 Dynamic MLX是基于moonshotai/Kimi-K2-Instruct模型构建的文本生成项目,采用优化后的MLX库实现高效量化性能。该模型在单台M3 Ultra 512GB RAM机器上运行,支持多种量化方式,在测试中展现出优秀的困惑度指标。
Kimi - K2 - Instruct 是一个基于 moonshotai/Kimi - K2 - Instruct 模型的量化版本,旨在让知识更广泛地惠及大众。
prithivMLmods
由 Project Numina 和 Kimi 团队开发的定理证明模型,专注于 Lean 4 中的竞赛风格问题解决能力。
Kimi-Dev-72B-8bit 是基于 moonshotai/Kimi-Dev-72B 转换的 8 位量化版本,适用于 MLX 框架的文本生成模型。
Kimi-Dev-72B-4bit-DWQ 是一个基于 moonshotai/Kimi-Dev-72B 转换而来的 4 位量化大语言模型,适用于 MLX 框架。