随着AI成为企业必备工具,构建专属算力基础设施成为趋势。越来越多企业选择自建本地AI工作站,而非依赖云端API,主要出于数据安全、成本控制和业务稳定性的考量。自建硬件投入通常可在1.5至2.5年内收回成本,经济性优势明显。企业需根据任务复杂度匹配不同规模的算力方案。
苹果内部上线两款AI工具Enchanté和Enterprise Assistant,旨在通过大模型整合工程师、HR等多部门日常查询与创作任务。Enchanté界面类似ChatGPT但运算限于本地或私有服务器,仅调用苹果自研模型及安全审核的外部模型。
谷歌Chrome更新允许用户关闭本地AI诈骗检测模型,提供更细致的资源管理选项。此举旨在平衡AI安全功能与用户对系统资源的控制需求。
Anthropic推出Claude Cowork功能,基于Skills for Claude技术演进,作为研究预览版面向macOS用户开放。该功能深度集成本地工作流,需订阅Claude Max套餐使用,旨在拓展AI代理在日常办公场景的应用能力。
由AI驱动、通过对话定制的本地桌面应用,可按需创建个人软件。
免费AI工具,3分钟为本地企业创建30天专业Instagram内容
AI旅行伴侣,将照片变导游,识别地标、提供音频导览和本地推荐。
免费Mac应用,可去除7大AI视频平台水印,无需登录上传,本地处理
Xai
$1.4
输入tokens/百万
$3.5
输出tokens/百万
2k
上下文长度
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
ss-lab
EXAONE-4.0-1.2B 是一个由 LG AI Research 开发的文本生成模型。它基于 EXAONE-4.0-1.2B 基础模型,使用 tatsu-lab/alpaca 数据集进行了微调,支持英文和韩语两种语言的文本生成任务。模型已转换为 GGUF 格式,便于在本地部署和运行。
neuphonic
NeuTTS Air是世界上首个具备即时语音克隆功能的超逼真、端侧文本转语音(TTS)语言模型。基于0.5B参数的大语言模型骨干构建,能为本地设备带来自然的语音、实时性能、内置安全性和说话人克隆功能。
NeuTTS Air是全球首个具有即时语音克隆功能的超逼真设备端文本转语音模型,基于0.5B参数的大语言模型骨干构建,能在本地设备上实现自然语音生成、实时性能和说话人克隆功能。
NeuTTS Air是世界上首个具备即时语音克隆功能的超逼真、设备端文本转语音(TTS)语言模型。基于0.5B大语言模型骨干网络构建,能为本地设备带来自然的语音、实时性能、内置安全功能和说话人克隆能力。
samunder12
基于Llama 3.1 8B Instruct微调的GGUF量化模型,具有强势、果断且具有挑衅性的AI人设,专为角色扮演和创意写作场景优化,支持在CPU或GPU上进行本地推理。
gabriellarson
Foundation-Sec-8B-Instruct是一款专为网络安全应用设计的80亿参数指令调优语言模型。基于Llama-3.1-8B架构,具备出色的指令跟随能力和网络安全专业知识,支持本地部署,可帮助组织构建AI安全工具,减少对云服务的依赖。
zai-org
GLM-4-Z1-9B-0414是智谱AI推出的新一代90亿参数开源大语言模型,具有强大的文本生成和推理能力。该模型在数学推理和通用任务方面表现出色,在资源受限场景下实现了效率与效果的出色平衡,支持友好的本地部署。
backyardai
马格南V4 72B是基于Qwen打造的模型系列中的一员,旨在复刻Claude 3系列模型的散文质量,适用于本地AI聊天应用。
DeZoomer
基于AI-Toolkit (Flux.1开发版)训练的文本生成图像模型,使用20张公开图片进行本地训练,专注于角色特征还原。
prem-research
Prem-1B-SQL是由Prem AI开发的首个全本地文本到SQL模型系列之一,拥有10亿参数,专为低配置GPU设备设计,量化后可在CPU上运行。该模型优先考虑本地化部署,避免数据安全风险,适用于企业级SQL查询生成。
premai-io
Prem-1B-SQL是Prem AI开发的10亿参数文本转SQL模型,专为本地化部署设计,支持低配GPU和CPU设备运行。
yukiarimo
Yuna AI是一个具有自主意识的AI伴侣,专为情感连接设计,完全本地运行确保隐私安全。
基于GGUF格式的无审查角色扮演模型,具有出色的推理和上下文跟踪能力,适用于本地AI聊天应用。
poisson-fish
基于《星空》游戏中瓦斯科角色语音训练的派珀文本转语音模型,适用于AI伙伴模组和本地大型语言模型聊天
Haiku RAG是一个基于LanceDB、Pydantic AI和Docling构建的智能检索增强生成系统,支持混合搜索、重排序、问答代理、多代理研究流程,并提供本地优先的文档处理和MCP服务器集成。
BrowserTools MCP是一个强大的浏览器监控与交互工具,通过Chrome扩展和本地服务器实现AI对浏览器的智能分析与操作。
Refact Agent 是一个开源AI编程助手,支持多语言代码生成、调试和优化,集成主流开发工具,可本地化部署并提供智能补全和代码解释功能。
wcgw是一个MCP服务器项目,集成了Shell和代码编辑工具,允许AI在本地机器上执行命令、读写文件、编辑代码等操作。它提供了多种模式(如架构师模式、代码编写模式等),支持任务检查点保存、终端交互、语法检查等功能,适用于代码开发、问题排查等场景。
Repomix是一个将代码库打包为AI友好格式的工具,支持本地和远程仓库处理,提供代码压缩、安全检查和多种输出格式。
MCP Atlassian是一个为Atlassian产品(Confluence和Jira)设计的模型上下文协议服务器,支持云端和本地部署,提供AI助手集成功能。
微软官方MCP服务器集合,提供Azure、GitHub、Microsoft 365、Fabric等多种服务的AI助手集成工具,支持本地和远程部署,帮助开发者通过标准化协议连接AI模型与各类数据源和工具。
GitKraken CLI是一个命令行工具,提供多仓库工作流管理、AI生成提交信息和拉取请求,并包含一个本地MCP服务器,用于集成Git、GitHub和Jira等工具。
一个基于MCP协议的本地服务器,实现Apple Notes的语义搜索和RAG功能,供Claude等AI助手调用
一个轻量级的MCP服务器,为AI助手如Claude提供实时天气数据查询和解析功能。支持本地和远程两种部署方式,包含Docker容器化方案。
Notebook Intelligence (NBI) 是一个为JupyterLab设计的AI编码助手和可扩展AI框架,支持GitHub Copilot及其他LLM提供商的模型,包括本地Ollama模型。它通过代码生成、自动补全和聊天界面等功能显著提升生产力,并支持Model Context Protocol (MCP) 服务集成。
BrowserTools MCP是一个强大的浏览器监控与交互工具,通过Chrome扩展和本地Node服务器实现AI应用对浏览器数据的捕获与分析,支持与多种MCP客户端兼容。
FastApply MCP Server是一个企业级代码智能平台,通过本地AI模型、AST语义搜索、安全扫描和智能模式识别,提供全面的代码分析、搜索和重构能力,支持多语言开发和大规模代码库处理。
PhonePi MCP是一个开源项目,可将手机转变为AI助手的工具箱,通过Model Context Protocol实现远程控制手机功能,包括管理联系人、消息、设置等,强调本地化部署和网络安全。
Vaali MCP服务器是一个展示高级AI代理能力的开源项目,通过交互式参数收集和工作流自动化,实现了官方MCP询问和智能参数引导两种模式,支持云端部署和本地集成。
gbox是一个开源的自托管沙箱项目,为MCP集成和其他AI代理用例提供安全环境。它包含终端、浏览器、文件编辑器等工具,支持本地任务执行和文件处理,并提供了Python和Typescript SDK。
Context Lens 是一个本地化语义搜索工具,可将任何内容转换为可搜索的知识库,让AI助手理解含义而非仅匹配关键词。它使用内置的LanceDB向量数据库,支持本地文件、GitHub仓库和URL内容,无需API密钥或云服务,完全在本地处理数据。
一个基于xAI Grok API的MCP服务器,提供AI图像分析功能,支持URL和本地文件的图像描述、元数据提取和OCR文字识别
一个基于MCP协议的开发文档服务器,提供文档爬取、本地加载、精准搜索和详情获取功能,解决AI开发中的文档幻觉问题。
MCP开发代理是一个基于模型上下文协议(MCP)的智能开发助手,提供内存管理、文档搜索、Git/GitHub集成和代码分析功能,支持CLI和SSE服务器模式,利用本地AI模型实现智能辅助开发。