微软在2026年Build大会上宣布,利用AI智能体技术将x86应用高效转换为Windows on Arm原生应用,解决软件兼容性这一关键挑战。通过与英伟达等硬件巨头合作,Windows on Arm生态已显著扩展,加速PC产业向Arm架构转型。
中兴通讯与腾讯达成深度战略合作,联合推出搭载腾讯原生办公智能体WorkBuddy的全新AI云电脑。此次合作不仅实现硬件与软件融合,更在底层技术架构上深度交融,推动消费级与企业级云终端加速迈入大模型时代。
微软发布“Project Solara”平台,专为AI智能体产品提供技术支持,旨在让AI摆脱传统屏幕束缚,融入企业级移动设备。微软CEO纳德拉与高通总裁深入对话,探讨开发新型硬件的必要性并达成共识。
Meta计划于明年测试一款AI驱动的新型吊坠,这标志着其从智能眼镜向贴身可穿戴设备扩展。该设备基于去年一项神秘收购的技术开发,旨在深化人工智能在衣物配饰中的应用。此举不仅展现Meta在硬件领域的野心,也预示着AI可穿戴市场将迎来巨头竞争新阶段。
Openai
$7.7
Input tokens/M
$30.8
Output tokens/M
200
Context Length
Alibaba
$8
$240
52
Bytedance
$0.8
$2
128
$0.15
$1.5
256
-
32
Tencent
$0.4
Anthropic
$105
$525
Iflytek
Google
$140
$280
$3
$9
16
$1
4
$0.35
$0.7
131
bartowski
这是对TheDrummer的Magidonia-24B-v4.3大语言模型进行量化处理后的版本。通过使用llama.cpp的imatrix量化技术,生成了从BF16到IQ2_XS等多种精度的GGUF格式文件,旨在不同硬件条件下(尤其是资源受限环境)更高效地运行模型,同时尽可能保持模型性能。
这是微软Fara-7B模型的量化版本,使用llama.cpp的imatrix技术进行优化。该模型支持多种量化级别,从高精度的bf16到极低精度的IQ2_M,满足不同硬件配置和性能需求。
这是ArliAI的GLM-4.5-Air-Derestricted模型的GGUF量化版本,使用llama.cpp和imatrix技术进行优化量化处理,提供多种量化级别选择,适用于不同硬件配置和性能需求。
这是TheDrummer的Snowpiercer-15B-v4模型的量化版本,使用llama.cpp和imatrix技术进行量化处理。该版本提供了从BF16到IQ2_S等多种量化级别,满足不同硬件条件和性能需求的用户。模型使用特定数据集进行校准优化,支持在线重打包功能以提升在ARM和AVX硬件上的性能。
这是对ai-sage的GigaChat3-10B-A1.8B模型进行的量化处理版本,采用llama.cpp的imatrix量化技术,可在不同硬件条件下更高效地运行。模型支持俄语和英语,主要用于文本生成任务。
这是p-e-w/gpt-oss-20b-heretic模型的量化版本,使用llama.cpp的imatrix技术进行量化处理。该模型是一个200亿参数的大语言模型,提供了多种量化选项,从高质量到低质量不等,文件大小从41.86GB到11.52GB,适用于不同硬件条件。
Marvis-AI
这是一个基于MLX框架优化的文本转语音模型,从原始模型Marvis-AI/marvis-tts-100m-v0.2转换而来,采用6位量化技术,专门为Apple Silicon硬件优化,提供高效的语音合成能力。
mlx-community
这是一个基于 Kimi-Linear-48B-A3B-Instruct 模型转换的 6 位量化版本,专为 Apple MLX 框架优化。该模型保留了原模型强大的指令跟随能力,同时通过量化技术显著降低了存储和计算需求,适合在 Apple 硬件上高效运行。
QuantStack
本项目是基于Flux架构的文本到图像模型Nepotism的量化版本,采用SVDQuant技术进行优化。提供了INT4和FP4两种量化格式,分别适用于不同世代的GPU硬件,在保持图像生成质量的同时显著减少模型大小和内存占用。
这是基于TheDrummer/Rivermind-24B-v1模型的llama.cpp量化版本,使用imatrix技术进行优化量化,提供多种量化级别以适应不同硬件配置,可在多种环境下高效运行。
本项目是对Qwen3-VL-32B-Thinking模型进行量化处理的成果,借助量化技术可在不同硬件条件下更高效地运行该模型,满足多样化的使用需求。
Project0 SVDQ 是基于 Flux Dev 和 Flux Krea 的文本到图像模型的量化版本,采用 SVDQuant 技术进行优化,提供 INT4 和 FP4 两种量化格式,分别适用于不同世代的 GPU 硬件。
spooknik
基于Flux.1开发的文本到图像生成模型的量化版本,采用SVDQ量化技术,提供INT4和FP4两种量化格式,适用于不同硬件平台的高效图像生成。
这是inclusionAI的Ling-flash-2.0模型的Llamacpp imatrix量化版本。通过先进的量化技术,在保持模型性能的同时显著减少了内存占用和计算量,提高了运行效率。支持多种量化级别,适用于不同硬件配置。
这是inclusionAI的Ling-mini-2.0模型的量化版本,使用llama.cpp的imatrix技术进行量化处理,提供了从32.54GB的BF16到4.66GB的IQ2_XS等多种量化选项,可在多种硬件环境中高效运行。
mradermacher
本项目是基于TECHNOPRAVIN01/Qwen2.5-14B-Valor模型的静态量化版本,提供多种量化类型以满足不同硬件条件下的使用需求。该模型通过量化技术减小了模型大小,同时保持了较好的性能表现。
这是AgentFlow agentflow-planner-7b模型的GGUF量化版本,使用llama.cpp的imatrix技术进行量化,提供多种量化级别选择,适用于不同硬件配置下的高效推理。
这是TheDrummer的Cydonia-24B-v4.2.0模型的量化版本,使用llama.cpp和imatrix技术进行优化处理,为不同硬件和需求提供了多种量化类型选择,方便用户在不同场景下高效运行模型。
CenKreChro-SVDQ 是基于 Chroma 和 Flux Krea 合并的文本到图像生成模型的量化版本,采用 SVDQuant 技术进行优化,提供 INT4 和 FP4 两种量化格式,分别适用于不同世代的 GPU 硬件。
这是gustavecortal的Beck-8B模型的量化版本,通过llama.cpp的imatrix量化技术处理,提供多种量化级别选择,在保持模型性能的同时显著减小模型大小,适合不同硬件配置下的部署。