Perplexity联合哈佛商学院发布报告,对比Perplexity Computer通用AI智能体与传统搜索助手。传统助手仅解答问题,需用户手动后续操作;而AI智能体可自主规划、执行任务并输出成果。数据显示,Perplexity Computer单次会话平均自主运行26分钟,远超传统搜索助手,展现了AI智能体对知识工作的全面变革。
OpenAI近日推出为期两周的Codex推广活动,旨在解决用户因额度限制而影响AI工具使用效率的问题。用户通过邀请好友加入并使用Codex,即可获得额外权益,具体机制为:被邀请好友成功加入并发送第一条消息后,邀请者即可享受福利。
在WWDC2026上,苹果软件工程主管Craig Federighi明确新版Siri AI定位为高效实用工具,而非情感陪伴角色。他强调,Siri不会成为AI男友或女友,以避免诱导用户泄露隐私。自诞生起,Siri以提升效率为目标,升级AI后仍坚持这一原则,与市面上部分刻意拉近情感联系的AI产品形成鲜明对比。
高德云图宣布开放商业智能体生态,并启动“高德问店”公测,面向生态伙伴开放首批智能体及技能能力。该产品以空间智能为核心,整合出行、位置与商业经营技术,将大连锁品牌的智能经营能力赋能给中小微商户,旨在降低门槛,助力其提升经营效率。
Pixmax AI 是一站式平台,可创建 AI 视频、图像和音频,提高内容生产效率。
Noreja平台利用生成式流程智能技术,结合数据与知识应用GenAI提升流程效率。
实时销售支持平台,为销售代表提供AI指导,提升销售效率
Skygen是一款AI桌面自动化工具,可完成各类任务,提高工作效率。
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Openai
$7.7
$30.8
200
Google
$2.1
$17.5
1k
$0.7
$2.8
Alibaba
-
Bytedance
$0.8
$2
128
Tencent
$1
$4
Chatglm
$0.75
$3
$9
16
Anthropic
$21
$105
Baidu
32
131
$2.4
$9.6
Huawei
4
Stepfun
drbaph
Z-Image(造相)是一个拥有60亿参数的高效图像生成基础模型,专门解决图像生成领域的效率和质量问题。其蒸馏版本Z-Image-Turbo仅需8次函数评估就能达到或超越领先竞品,在企业级H800 GPU上可实现亚秒级推理延迟,并能在16G VRAM的消费级设备上运行。
Tongyi-MAI
Z-Image是一款功能强大且高效的图像生成模型,拥有60亿参数。它能有效解决图像生成领域在效率、质量和功能多样性方面的问题,为用户提供高质量的图像生成和编辑服务。
jayn7
腾讯混元视频1.5模型的量化GGUF版本,专门用于文本到视频生成任务,支持720P高清视频生成,提供多种量化精度版本以优化使用效率。
bartowski
这是allenai的Olmo-3-32B-Think模型的GGUF量化版本,通过llama.cpp工具进行多种量化处理,旨在提升模型在特定环境下的性能和效率。提供了从Q2到Q8的多种量化选项,满足不同硬件配置和性能需求。
mratsim
GLM-4.5-Iceblink-v2-106B-A12B-FP8是基于GLM-4.5-Iceblink-v2-106B-A12B模型,采用最先进的混合专家量化方法进行FP8量化的版本。该模型专门针对支持硬件FP8的Ada、Hopper或Blackwell系列GPU优化,在保持高质量输出的同时显著提升推理效率。
noctrex
这是一个基于Huihui-MiroThinker-v1.0-8B模型的量化版本,专门针对文本生成任务进行了优化,通过量化技术提高了推理效率,同时保持了模型的性能表现。
这是对MiroThinker-v1.0-30B模型进行MXFP4_MOE imatrix量化的版本,基于mradermacher的imatrix实现。该量化模型保持了原模型的文本生成能力,同时通过量化技术提高了推理效率,适用于需要高效文本生成的各种应用场景。
DevQuasar
本项目提供了cerebras/MiniMax-M2-REAP-172B-A10B模型的量化版本,致力于让知识为大众所用。这是一个1720亿参数的大型语言模型,经过优化和量化处理,旨在降低部署成本和提高推理效率。
这是kldzj/gpt-oss-120b-heretic模型的量化版本,使用llamacpp进行量化处理,提供了多种量化类型选择,包括BF16、Q8_0和MXFP4_MOE等特殊格式,显著提升了模型运行效率。
magiccodingman
这是一个基于Qwen3 VL 8B模型的混合量化版本,采用MXFP4量化技术并在密集模型上使用混合权重。该模型在保持接近Q8精度的同时,实现了更小的文件大小和更高的推理速度,是效率与精度平衡的优秀解决方案。
MedSwin
本项目是使用mergekit对预训练语言模型进行合并的成果,结合了多个医学领域的预训练模型,为医学问答任务提供了更强大的支持,可有效提升医学问题回答的准确性和效率。
cyankiwi
MiniMax-M2 AWQ - INT4是基于MiniMax-M2模型进行量化后的版本,采用INT4量化技术,在保证性能的前提下显著减少内存使用并提高推理效率。该模型在编码和智能体任务方面表现出色,具有卓越的综合性能。
Aquif-3.5-Max-42B-A3B是一个420亿参数的大型语言模型,经过MXFP4_MOE量化处理,在保持高质量文本生成能力的同时优化了推理效率。该模型基于先进的混合专家架构,适用于多种自然语言处理任务。
本项目是卡纳娜1.5-15.7B-A3B指令模型的MXFP4_MOE量化版本,可在特定场景下提升模型的运行效率。该模型基于kakaocorp/kanana-1.5-15.7b-a3b-instruct进行优化,采用混合专家架构和MXFP4量化技术。
Gelato-30B-A3B是针对GUI计算机使用任务进行微调的最先进(SOTA)模型,提供了量化版本以优化部署效率。该模型专门设计用于理解和处理图形用户界面相关的任务。
ycngin2024
这是一个经过微调的Whisper语音识别模型,基于unsloth/whisper-large-v3-turbo架构,使用Unsloth和Huggingface TRL库实现了2倍训练加速,显著提升了训练效率。
QuantStack
这是NVIDIA ChronoEdit-14B-Diffusers模型的GGUF量化版本,专门用于图像转视频任务。该模型保留了原始模型的所有功能,同时通过GGUF格式优化了部署和运行效率。
amazon
Chronos-2是一个拥有1.2亿参数的时间序列基础模型,支持零样本预测。它在单一架构内支持单变量、多变量和协变量感知任务,在多个基准测试中实现了零样本预测的最先进精度,且推理效率极高。
moonshotai
Kimi Linear是一种混合线性注意力架构,在各种场景下包括短、长上下文以及强化学习扩展机制中,均优于传统的全注意力方法。它能有效解决传统注意力机制在长上下文任务中效率低下的问题,为自然语言处理等领域带来更高效的解决方案。
Kimi Linear是一种高效混合线性注意力架构,在短上下文、长上下文和强化学习场景中均优于传统全注意力方法。它通过Kimi Delta Attention (KDA)机制优化注意力计算,显著提升性能和硬件效率,特别擅长处理长达100万令牌的长上下文任务。
Deebo是一个AI调试助手,能够加速代码错误的解决过程,通过自动化调查和多线程工作流提升开发效率。
Rsdoctor 是一款专为 Rspack 生态系统打造的构建分析工具,全面兼容 webpack,提供可视化构建分析、多维度性能诊断及智能优化建议,帮助开发者提升构建效率与工程质量。
Notion MCP Server是一个连接Notion API与LLM的中间件服务,通过Markdown转换优化交互效率。
DeepContext是一个MCP服务器,为代码助手提供基于符号感知的语义搜索功能,通过智能解析代码结构和语义关系,在大型代码库中精准定位相关代码片段,提升开发效率。
HyperTool是一个MCP服务器管理工具,允许AI动态切换和使用来自多个MCP服务器的工具集,突破工具数量限制,通过智能工具集提升AI工具选择的准确性和效率。
Cheat Engine MCP桥接器是一个将AI助手通过MCP协议连接到Cheat Engine内存分析工具的项目,允许用户通过自然语言指令直接查询和操作程序内存,大幅提升逆向工程和调试效率。
Aider MCP Server是一个实验性模型上下文协议服务器,用于将AI编码任务卸载到Aider,提高开发效率和灵活性。
一个高性能的SQLite MCP服务器,采用创新的Codemode代码生成方法,使LLM通过生成Go代码执行数据库操作,相比传统工具调用显著提升效率和降低延迟。
MCP Probe Kit 是一个强大的开发工具集,提供23个实用工具,覆盖代码质量检测、开发效率提升和项目管理全流程,专为Cursor AI设计,帮助开发者提高开发效率和质量
AI辅助洞察代理是一个MCP代理,能将自然语言问题转化为准确、可解释、可复现的数据洞察。它通过自然语言接口翻译业务问题为SQL查询,提供解释性结果(包括查询语句、指标定义、数据质量),并确保分析的可重复性,旨在弥合业务问题与数据答案之间的鸿沟,提高数据分析效率和透明度。
该项目提供了一套开发工具集,包含AI辅助模板和实用脚本,用于提升开发效率和项目管理规范性。
一个防止AI幻觉的MCP服务,当AI不确定时可以向人类提问而非盲目自信,通过简单的问答机制提升开发效率。
飞书MCP服务器为AI编码工具提供飞书文档访问能力,支持文档创建、内容操作与编辑,提升开发效率。
Cursor Rust Tools是一个MCP服务器,为Cursor中的LLM提供Rust Analyzer、Crate文档和Cargo命令的访问能力,提升AI代理在Rust开发中的效率。
VibeCheck Web测试工具是一个AI驱动的网页测试代理,通过MCP协议集成到AI编程助手(如GitHub Copilot、Cursor等)中,实现自动化测试录制、执行和发现。它利用Playwright控制浏览器,支持自然语言描述生成测试脚本,执行回归测试,并自动发现潜在测试步骤,提高开发效率和测试准确性。
一个MCP服务器,为AI编程助手提供上下文优化工具,通过精准提取信息而非处理大量终端输出和文件来节省上下文空间,提升助手效率。
MCP Research Router是一个MCP聚合器和智能路由器,能够统一管理多个MCP服务器,提供智能工具推荐和批量并行执行功能,提升工具使用效率。
CTX是一款连接代码库与大型语言模型(LLM)的工具,通过自动化生成结构化上下文文件,解决AI开发中代码上下文传递效率低下的问题。支持从代码文件、Git仓库、网页等多种来源收集信息,并可通过MCP服务器直接为AI助手提供项目上下文。
这是一个专为Local by Flywheel设计的MCP服务器,让AI助手能够直接读取WordPress数据库,自动检测MySQL实例并执行只读查询,极大提升开发效率。
MCP移动服务器是一个AI驱动的移动开发工具集,为Claude Desktop等MCP客户端提供36个强大的Flutter、Android和iOS开发工具,包括智能设备管理、自动化构建和跨平台部署功能,显著提升移动开发效率。