Speechify发布原生Windows客户端,从文本转语音工具升级为全栈语音助手。应用集成三类本地AI模型,支持跨应用实时听写与文档转录,对标Superwhisper等竞品。为保障响应速度与隐私,在Copilot+ PC等高性能设备上支持完全本地化运行,用户无需上传音频至云端,即可利用本地NPU或GPU驱动的Whisper模型。
微软在Windows 11开发版更新中,为任务管理器新增了NPU实时监测功能,补齐了硬件监控的最后一块拼图。随着AI PC普及,NPU成为处理AI任务的核心硬件,此次升级让用户能直观查看其负载情况,使专用芯片运行状态透明可见。
腾讯云“元宝派”电脑版上线,支持PC端免费创建或接入AI智能体,强化大模型社交协作。更新重点提升办公效率,实现电脑与手机自动同步,解决跨设备创作中聊天记录与任务进度断层问题。技术方面引入多项原生功能优化体验。
阿里回应传闻,确认正基于现有产品改造“云电脑”硬件,包括笔记本终端和迷你主机,但暂无具体发布时间。产品定位为“云电脑”,非传统PC。
GLM-PC是基于CogAgent视觉语言大模型构建的电脑智能体,旨在提升电脑使用体验。
用于评估Windows PC或Apple Mac上AI推理引擎性能的基准测试工具。
NVIDIA的AI助手,为GeForce RTX AI PC用户提供优化和控制功能
AI赋能的迷你PC,为日常计算需求设计
pcuenq
PaddleOCR-VL-0.9B 是一个基于 PaddlePaddle 框架开发的视觉语言模型,专门用于图像文本到文本的转换任务。该模型复刻自 PaddlePaddle 官方版本,支持从图像中提取和识别文本内容。
NexaAI
OmniNeural是全球首个专门为神经处理单元(NPU)设计的全多模态模型,能够原生理解文本、图像和音频,可在PC、移动设备、汽车、物联网和机器人等多种设备上运行。
TencentBAC
由腾讯PCG基础算法中心微调的多模态语言模型,基于Qwen2.5-VL-3B-Instruct优化,在同规模模型中实现多项多模态推理基准的最先进性能
基于视觉Transformer(ViT)的图像特征模型,采用自监督DINOv2方法在LVD-142M数据集上预训练。
3587jjh
一种通过像素级分类实现计算资源自适应分配的高效图像超分辨率方法
Gemma分词器的副本,用于无需访问令牌的CI/测试场景
Pclanglais
基于T5-small架构微调的文本处理模型,专注于特定任务的文本生成与转换
PCS
Sparrow是基于Donut ML基础模型在发票数据上微调而成的文档数据提取工具,旨在验证Donut在企业文档上的表现性能。
webbigdata
基于谷歌Gemma-2模型的日英/英日神经机器翻译模型gguf格式版本,可在无GPU的PC上运行
基于Stable-Diffusion-xl微调的文本生成图像模型,专门用于生成1928年原始设计的米老鼠及相关角色图像。
MonadGPT是一个基于17世纪语言风格微调的对话模型,模拟早期现代英语、法语和拉丁语的表达方式。
基于《丁丁历险记》125幅漫画分镜微调的Stable-Diffusion-xl版本,可生成丁丁、白雪及阿道克船长等经典角色。
pczarnik
基于HerBERT模型微调的波兰语命名实体识别模型,可识别人物、地点和组织三类实体
基于Stable Diffusion v1-5训练的LoRA适配权重,专门用于生成宝可梦风格的图像。
pcernuta
该模型是基于ConvNeXt-Tiny架构在香肠(klobasa)图像数据集上微调的视觉分类模型,准确率达89.58%
基于潜在扩散模型的文本生成图像系统,支持高分辨率图像合成与编辑
prithivida
基于BERT-LARGE架构的专利文本处理模型,通过PCA压缩嵌入维度以优化存储效率
基于Facebook的wav2vec2-large-xlsr-53模型,在西班牙语Common Voice数据集上微调的语音识别模型,测试WER为10.50%。
基于facebook/wav2vec2-large-xlsr-53模型微调的巴斯克语自动语音识别模型,在通用语音巴斯克语测试集上达到15.34%的词错误率(WER)。
pchanda
该模型是基于PubChem数据库中1000万SMILES字符串进行预训练的化学信息学模型,主要用于分子表示学习和化学性质预测。
KiCAD MCP是一个实现AI辅助PCB设计的协议工具,通过自然语言控制KiCAD软件完成电路板设计。
KiCad MCP Server是一个为KiCad设计的模型上下文协议(MCP)服务器,允许通过自然语言与KiCad项目交互,提供项目管理、PCB分析、BOM管理等功能。
KiCad MCP项目将MCP协议集成到KiCad电子设计软件中,通过内置MCP服务器和客户端,为PCB和原理图编辑器提供AI辅助功能。
该项目实现了一个基于MCP协议的个人上下文管理服务器,用于存储和更新用户的个性化数据,使AI助手能够跨会话保持记忆并提供个性化服务。
Illumio MCP服务器是一个提供与Illumio策略计算引擎(PCE)交互接口的服务,支持通过对话式AI管理负载、标签和流量分析。
Bridge MCP是一个基于模型上下文协议(MCP)的Windows PC控制服务器,允许任何AI通过本地代理程序完全控制计算机,包括应用程序控制、鼠标键盘操作、屏幕捕获、系统命令执行、浏览器自动化和剪贴板管理等功能。
mcpcap是一个基于Python的模块化MCP服务器,专门用于分析PCAP网络抓包文件。它提供DNS、DHCP、ICMP等协议的专业分析工具,支持本地文件路径和远程URL,无需文件上传,通过结构化JSON响应为LLM提供网络流量分析能力。
SharkMCP是一个基于Wireshark/tshark的网络数据包捕获与分析MCP服务器,为AI助手提供网络流量分析能力,支持实时抓包、PCAP文件解析及SSL/TLS解密等功能。
MCP注册中心是一个为MCP客户端提供MCP服务器列表的平台,类似于MCP服务器的应用商店。项目目前处于预览阶段,已实现API冻结,支持多种认证方式发布服务器,并提供完整的开发环境和文档。
实现PC端微信的MCP服务功能,通过配置文件指定Python虚拟环境和脚本路径
KiCAD MCP是一个实现AI辅助PCB设计的协议项目,通过自然语言控制KiCAD软件完成电路板设计、元件布局和布线等操作。
SharkMCP是一个基于Wireshark/tshark的网络数据包捕获与分析MCP服务器,为AI助手提供网络安全分析、故障排查和数据包检查能力,支持异步抓包、PCAP文件分析、SSL/TLS解密等功能。
PC端MCP服务,提供天气查询、系统控制、浏览器搜索和截图功能
PCM是一个基于MCP的反向工程工具,提供IDA集成、内存分析等功能。
该项目通过集成Planning Center Online API与MCP服务器,实现用户通过自然语言查询和操作Planning Center数据的功能。
View Control MCP Server是一个实现Model Context Protocol (MCP)的服务器,允许AI助手通过JSON-RPC 2.0协议控制本地PC的鼠标、键盘操作和屏幕截图等功能,支持与Claude Desktop和Cursor等MCP客户端集成。
JLCPCB Parts MCP Server是一个帮助用户查找JLCPCB PCBA服务兼容组件的服务器项目,提供快速搜索、用户友好界面和最新组件数据。
这是一个企业打印机信息MCP服务器,为销售和服务团队提供详细的打印机规格、定价、故障排除和设置信息,支持HP、佳能、理光等9大品牌,包含10个智能工具用于打印机搜索、对比、成本计算和故障处理。
Illumio MCP服务器是一个提供与Illumio策略计算引擎(PCE)交互接口的服务,支持通过编程方式管理工作负载、标签和流量分析。
PCP-MCP是一个通过模型上下文协议(MCP)查询性能协同工具(PCP)系统性能指标的服务器,提供CPU、内存、磁盘I/O、网络、进程等系统监控功能。