美光与Anthropic达成战略合作,将围绕AI内存架构设计、技术研发与供应链保障展开协同,重点突破高带宽存储器、DRAM及固态硬盘在AI训练和推理中的应用,标志着算力竞争从模型延展至底层硬件。
凌川科技完成数亿元A+轮融资,由啟赋资本领投,百度风投等跟投,用于下一代AI芯片研发、量产及海外拓展。公司成立于2024年3月,北京市人工智能基金与快手集团共同发起,专注智能视频与生成式视频等多模态大模型底层算力硬件。
LM Studio与苹果在WWDC2026演示中,仅用四台Mac Studio便成功运行月之暗面万亿参数大模型Kimi K2.6,打破云端GPU垄断。该模型总参数1万亿,采用MoE架构,激活参数320亿,支持长上下文、多模态及智能体任务,让消费级硬件承载前沿AI成为现实。
亚马逊正就向外部企业出售自研AI芯片Trainium进行深度商谈,一改过去仅以云服务提供算力的模式,有望以硬件形式进入企业自建数据中心。此举标志AI算力市场竞争升级,从云端租赁转向芯片直销的新博弈阶段。
无审查、私密 AI 聊天,运行于去中心化硬件,具可验证收据。
检测硬件,了解本地可运行的AI模型,支持GPU、CPU和RAM分析
确保AI可解释、可审计、安全的硬件解决方案
私有、无审查的AI家用硬件设备
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
bartowski
这是由Mistral AI开发的大型语言模型Mistral-Large-3-675B-Instruct-2512的GGUF量化版本。原始模型拥有6750亿参数,专为指令遵循任务设计。本项目使用llama.cpp工具,结合imatrix校准数据集,生成了从Q8_0到IQ1_S共20多种不同精度的量化模型文件,旨在平衡模型性能、推理速度与存储/内存占用,使其能在更广泛的硬件上运行。
这是对ai-sage的GigaChat3-10B-A1.8B模型进行的量化处理版本,采用llama.cpp的imatrix量化技术,可在不同硬件条件下更高效地运行。模型支持俄语和英语,主要用于文本生成任务。
ubergarm
这是ai-sage/GigaChat3-10B-A1.8B-bf16模型的GGUF量化版本,提供了多种量化选项,从高精度的Q8_0到极度压缩的smol-IQ1_KT,满足不同硬件条件下的部署需求。该模型支持32K上下文长度,采用MLA架构,专为对话场景优化。
amd
Llama-3.1-8B-onnx-ryzenai-npu是由AMD基于Meta的Llama-3.1-8B模型开发的优化版本,专门针对AMD Ryzen AI NPU进行优化部署。该模型通过Quark量化、OGA模型构建器和NPU专用后处理技术,在保持高质量文本生成能力的同时,显著提升了在AMD硬件上的推理效率。
mradermacher
这是 liushiliushi/ConfTuner-Ministral 模型的静态量化版本,适用于文本生成和置信度估计任务。该模型基于 Mistral 架构,经过微调以提供可信赖的AI输出,支持多种量化级别以满足不同硬件需求。
这是基于mookiezii/Discord-Hermes-3-8B模型进行量化处理后的版本,提供了多种量化格式的GGUF模型文件,适用于不同硬件环境和性能需求的对话AI应用场景。
DevQuasar
这是慧慧Qwen3-4B思维模型的量化版本,基于Qwen2-4B架构构建,致力于通过量化技术让AI知识更易于获取和使用,降低硬件门槛。
lmstudio-community
GLM 4.5 Air是由Zai-Org开发的高效文本生成模型,经过bartowski使用llama.cpp进行GGUF量化处理,在保持性能的同时显著降低了硬件需求,适合在消费级硬件上运行。
这是AI21 Labs的Jamba-Mini-1.7模型的量化版本,使用llama.cpp的imatrix技术进行优化,为不同硬件配置提供了多种量化选择,支持高效推理。
这是慧慧AI基于Qwen3-14B模型的量化版本,旨在通过模型压缩技术让大语言模型更加轻量化,降低硬件需求,使知识获取更加普及和便捷。
EXAONE-3.5-7.8B-Instruct是由LG AI研发的78亿参数多语言指令调优大语言模型,支持英语和韩语。该版本经过llama.cpp的imatrix量化处理,提供多种量化级别,可在消费级硬件上高效运行。
Aion-RP-Llama-3.1-8B的Llamacpp imatrix量化版本,提供多种量化选项以适应不同硬件需求。
shuttleai
一款高效的文生图AI模型,仅需4步即可生成高质量图像,支持多种硬件优化格式。
featherless-ai-quants
这是一个基于Meta-Llama-3-8B-Instruct模型的GGUF量化版本,由Featherless AI团队优化。该模型经过多种量化处理,显著提升了性能并减少了资源需求,适合在各种硬件上部署使用。
这是Jina AI开发的reader-lm-1.5b模型的GGUF量化版本,使用llama.cpp b3715版本进行imatrix量化。该模型是一个15亿参数的多语言文本生成模型,支持多种量化格式,适用于不同硬件配置和性能需求。
Awesome MCP Servers 是一个全面的Model Context Protocol (MCP)服务器集合,涵盖了7158个MCP服务器,分为33个类别,包括AI集成、艺术媒体、浏览器自动化、云服务、数据库、开发者工具、文件系统、金融、游戏、硬件、医疗、基础设施、知识管理、位置地图、市场营销、监控、多媒体处理、操作系统、项目管理、科学研究、安全、社交媒体、旅行交通、实用工具和版本控制等。
基于mcp-server的项目,支持AI大模型高效调用spinq的量子计算硬件资源,提供Windows和macOS的一键安装脚本,自动检测Python环境并安装依赖。
mcp2tcp是一个连接物理硬件与AI大模型的桥梁项目,通过MCP协议实现自然语言控制硬件设备。
一个专业的串口通信MCP服务器,为AI助手提供全面的串口通信能力,支持嵌入式系统、物联网设备和硬件调试,具有跨平台支持和多种数据格式处理功能。
这是一个为Commodore 64 Ultimate(官方现代C64电脑)设计的MCP服务器,通过REST API让AI助手(如Claude、ChatGPT)能够远程控制C64硬件,支持程序加载、内存操作、磁盘管理等功能。
RegenNexus UAP是一个通用适配器协议,用于连接设备、机器人、应用和AI代理,提供低延迟、高安全性的通信,支持多种硬件和MCP集成。
一个为FIRST机器人竞赛队伍设计的工具,可同时搜索WPILib、REV、CTRE等多个官方文档库,通过自然语言提问快速获取编程和硬件配置答案,支持VS Code集成和AI助手优化。
mcp2mqtt是一个连接物联网设备与AI大模型的桥梁项目,通过MCP和MQTT协议实现自然语言控制硬件设备。
一个状态化的蓝牙低功耗(BLE)模型上下文协议(MCP)服务器,为开发工具和AI代理提供与真实BLE硬件交互的能力,支持扫描、连接、读写、订阅通知等操作,并可扩展设备协议规范和插件。
一个轻量级服务器,通过简单API暴露Mac系统信息,帮助AI助手获取实时硬件和系统数据,主要用于Mac用户的AI和深度学习实验。
这是一个通过MCP协议控制Commodore 64 Ultimate硬件的服务器,允许AI助手(如Claude)通过网络与复古计算机进行交互,实现编程、运行游戏、播放音乐、管理磁盘等操作。
MCP2Serial是一个连接物理设备与AI大模型的桥梁项目,通过自然语言控制硬件设备,实现物联网智能化控制。
FortunaMCP是一个基于硬件熵的高性能随机数生成服务器,通过多种统计分布模型为AI应用提供真实不可预测的随机值,适用于模拟仿真和游戏场景。
一个专业的嵌入式调试MCP服务器,提供AI助手全面的嵌入式系统调试能力,支持ARM Cortex-M和RISC-V微控制器,与真实硬件集成。
IntelliGlow是一个基于MCP协议的智能照明系统,通过AI助手控制真实智能灯泡,支持语音命令、AI推理和直接硬件控制,实现自然语言交互和智能灯光管理。
JetsonMCP是一个通过SSH连接管理NVIDIA Jetson Nano边缘计算设备的MCP服务器,提供AI工作负载优化、硬件配置和系统管理功能,支持自然语言指令转换为专业操作命令。
JetsonMCP是一个MCP服务器,通过SSH连接帮助AI助手管理和优化NVIDIA Jetson Nano边缘计算系统,提供AI工作负载部署、硬件优化和系统管理功能。
KognitiveKompanion是一个现代多功能的AI交互界面,支持KDE等多种桌面环境,集成OpenAI、Ollama及AMD Ryzen AI硬件加速等多种后端,提供高级UI、上下文功能和对话管理。
IntelliGlow是一个基于MCP协议的AI智能照明控制系统,通过UDP网络直接控制真实智能灯泡,支持语音命令、AI推理和硬件控制,实现自然语言交互与智能家居的无缝对接。
KognitiveKompanion是一个现代多功能的AI交互界面,支持KDE等桌面环境,提供与OpenAI、Ollama及AMD Ryzen AI硬件加速的无缝集成。