Anthropic正在测试Claude的“任务模式”,旨在将其打造成全能型智能体,以高效处理复杂任务。新版本采用双面板布局:右侧展示文件或上下文信息,左侧动态显示多步任务进度。
微信元宝AI助手推出新功能,用户只需发送一句话即可设置提醒。元宝能自动识别任务内容和时间,并在指定时间通过微信服务通知提醒用户,让设置提醒变得简单便捷。
OpenAI发布GPT-5.2-Codex,这是其最先进的智能体编程模型。它专为处理复杂、长期的现实编码任务设计,在基准测试中创下新纪录,并能自主完成从代码理解、环境搭建到漏洞挖掘和提交Pull Request的全流程。该模型融合了GPT-5.2的通用推理能力和GPT-5.1-Codex-Max的终端操作功能,标志着AI在软件工程实战能力上的重大突破。
Google Labs推出实验性AI邮件助理“CC”,能整合Gmail、日历和云端硬盘,提供个性化早间邮件,提醒日程、任务和文件,实现跨应用智能管理。
Dex将浏览器变为AI工作空间,了解任务与上下文,推动工作进展
BitterBot是开源AI助理,通过自然对话轻松完成现实任务。
Tendem结合AI速度与人类专家判断力,处理繁琐任务
Khorus是智能系统的通用通信层,支持AI代理协作与任务管理
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
Anthropic
$105
$525
200
$0.7
$7
$35
$17.5
$21
Alibaba
-
$4
$16
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
bartowski
这是由Mistral AI开发的大型语言模型Mistral-Large-3-675B-Instruct-2512的GGUF量化版本。原始模型拥有6750亿参数,专为指令遵循任务设计。本项目使用llama.cpp工具,结合imatrix校准数据集,生成了从Q8_0到IQ1_S共20多种不同精度的量化模型文件,旨在平衡模型性能、推理速度与存储/内存占用,使其能在更广泛的硬件上运行。
mlx-community
本模型是 Mistral AI 发布的 Ministral-3-3B-Instruct-2512 指令微调模型的 MLX 格式转换版本。它是一个参数规模为 3B 的大型语言模型,专门针对遵循指令和对话任务进行了优化,并支持多种语言。MLX 格式使其能够在 Apple Silicon 设备上高效运行。
这是对ai-sage的GigaChat3-10B-A1.8B模型进行的量化处理版本,采用llama.cpp的imatrix量化技术,可在不同硬件条件下更高效地运行。模型支持俄语和英语,主要用于文本生成任务。
DevQuasar
这是 ai-sage/GigaChat3-702B-A36B-preview-bf16 模型的量化版本,旨在为大众提供免费的知识获取途径。该模型是一个大型语言模型,专注于文本生成任务。
allenai
Olmo 3是由Allen Institute for AI开发的新一代语言模型家族,包含7B和32B的指令和思维变体。该模型在长链式思维方面表现出色,能显著提升数学和编码等推理任务的性能。所有代码、检查点和训练细节都将公开,推动语言模型科学发展。
Olmo 3是由Allen Institute for AI开发的新一代语言模型系列,包含7B和32B两种规模,有指令和思考两种变体。该模型基于Dolma 3数据集进行预训练,在Dolci数据集上进行后训练,具备长链式思维能力,在数学和编码等推理任务上表现优异。
XiaomiMiMo
米模具身模型(MiMo-Embodied)是一款强大的跨具身视觉语言模型,在自动驾驶和具身AI任务中均展现出了卓越的性能。它是首个将这两个关键领域相结合的开源视觉语言模型,显著提升了在动态物理环境中的理解和推理能力。
Olmo 3是由Allen Institute for AI开发的一系列语言模型,包含7B和32B两种规模,具有指令式和思考式两种变体。该模型在长链式思维方面表现出色,能有效提升数学和编码等推理任务的性能。采用多阶段训练方式,包括有监督微调、直接偏好优化和可验证奖励的强化学习。
Olmo-3-7B-Think-DPO是Allen Institute for AI开发的7B参数语言模型,具有长链式思考能力,在数学和编码等推理任务中表现出色。该模型经过监督微调、直接偏好优化和基于可验证奖励的强化学习等多阶段训练,专为研究和教育用途设计。
Olmo 3是由Allen Institute for AI (Ai2)开发的一系列语言模型,包含7B和32B两种规格,有Instruct和Think两种变体。该模型基于Transformer架构,具有长链思维能力,可有效提升数学和编码等推理任务的表现。
Olmo 3是由Allen Institute for AI开发的开源语言模型系列,包含7B和32B两种规格,分为指令(Instruct)和思考(Think)两种变体。该模型具有出色的长链思维能力,能够显著提升数学和编码等推理任务的表现。
Olmo 3 7B RL-Zero Math是Allen AI开发的专为数学推理任务优化的70亿参数语言模型,采用RL-Zero强化学习方法在数学数据集上进行训练,能有效提升数学推理能力。
Olmo 3是由Allen Institute for AI开发的全新语言模型家族,包含7B和32B两种规模,有指令(Instruct)和思维(Think)两种变体。该模型采用长链式思维提升数学和编码等推理任务表现,旨在推动语言模型科学发展。
Olmo-3-32B-Think-DPO是Allen AI开发的32B参数语言模型,采用直接偏好优化(DPO)训练,具备长链式思维推理能力,在数学、编码等复杂推理任务上表现优异。
EssentialAI
Rnj-1 是由 Essential AI 从头训练的一系列 80 亿参数、开放权重的密集模型。该模型针对代码和 STEM 领域进行了优化,在编程、数学推理、智能体任务和工具调用方面表现出色,能力与最先进的开放权重模型相当。
这是一个基于Moonshot AI技术的量化版本模型,专注于视觉语言理解与生成任务,致力于降低知识获取门槛,让知识为每个人所用。
ss-lab
EXAONE-4.0-1.2B 是一个由 LG AI Research 开发的文本生成模型。它基于 EXAONE-4.0-1.2B 基础模型,使用 tatsu-lab/alpaca 数据集进行了微调,支持英文和韩语两种语言的文本生成任务。模型已转换为 GGUF 格式,便于在本地部署和运行。
LiquidAI
LFM2-VL-3B是Liquid AI开发的多模态视觉语言模型,基于LFM2骨干架构构建,具备强大的视觉理解和推理能力,特别在细粒度感知任务上表现出色。该模型能够高效处理文本和图像输入,支持高达512×512分辨率的原生图像处理。
Olmo-3-7B-Think-SFT是Allen Institute for AI开发的7B参数语言模型,具有长链式思考能力,在数学和编码等推理任务中表现优异。该模型基于Dolma 3数据集预训练,并在Dolci数据集上进行了后续训练。
citizenplain
这是一个基于Wan2.1-T2V-14B模型训练的LoRA适配器,专门用于文本到视频转换任务。该模型使用AI Toolkit训练,为视频生成应用提供支持。
Zen MCP是一个多模型AI协作开发服务器,为Claude和Gemini CLI等AI编码助手提供增强的工作流工具和跨模型上下文管理。它支持多种AI模型的无缝协作,实现代码审查、调试、重构等开发任务,并能保持对话上下文在不同工作流间的延续。
wcgw是一个MCP服务器项目,集成了Shell和代码编辑工具,允许AI在本地机器上执行命令、读写文件、编辑代码等操作。它提供了多种模式(如架构师模式、代码编写模式等),支持任务检查点保存、终端交互、语法检查等功能,适用于代码开发、问题排查等场景。
Apify MCP服务器是一个实现Model Context Protocol(MCP)的服务,允许AI助手通过SSE或Stdio与Apify平台上的各种Actor交互,执行数据抓取、网页搜索等任务。
ClickUp MCP Server是一个用于将ClickUp任务与AI应用集成的模型上下文协议服务器,支持通过标准化协议管理任务、空间、列表和文件夹。
基于MCP协议的智能任务管理系统,提供AI代理的高效编程工作流框架,具备任务规划、分解、执行和记忆功能。
Aider MCP Server是一个实验性模型上下文协议服务器,用于将AI编码任务卸载到Aider,提高开发效率和灵活性。
ClickUp MCP服务器是一个用于将ClickUp任务与AI应用集成的模型上下文协议服务器,支持通过标准化协议管理任务、空间、列表、文件夹等,并提供时间跟踪、标签管理等功能。
IDA Pro MCP Server是一个插件,通过Model Context Protocol接口实现AI助手与IDA Pro的远程交互,支持二进制分析任务如反汇编、伪代码获取、函数查询等操作。
Think MCP是一个实现MCP服务器的项目,提供'think'工具以支持AI代理在复杂任务中进行结构化推理,灵感来自Anthropic的研究。该工具通过记录思考过程帮助AI处理信息、回溯或遵守策略,适用于工具输出分析、策略密集环境和顺序决策场景。
Swiss MCP是一个AI驱动的多步骤任务协调中心,能够整合多种AI工具完成复杂任务,如内容创作和全栈应用开发。
gbox是一个开源的自托管沙箱项目,为MCP集成和其他AI代理用例提供安全环境。它包含终端、浏览器、文件编辑器等工具,支持本地任务执行和文件处理,并提供了Python和Typescript SDK。
一个专注于探索和应用生成式AI(GenAI)的仓库,旨在通过实际案例和资源分享,帮助用户学习和实验GenAI在日常任务中的应用,包括写作、编程、图像生成等。
Android-MCP是一个轻量级开源项目,作为AI代理与Android设备之间的桥梁,通过MCP服务器实现真实任务操作如应用导航、UI交互和自动化测试,无需依赖传统计算机视觉或预设脚本。
Ultimate MCP Server是一个基于模型上下文协议(MCP)的AI代理操作系统,提供数十种强大工具能力,包括智能任务委派、文档处理、浏览器自动化、Excel操作等,通过标准化MCP工具实现AI代理的认知增强和复杂任务编排。
该项目展示了Model Context Protocol(MCP)的示例实现,MCP是一种标准化协议,用于增强AI助手的能力,通过自定义工具和数据源扩展其功能。项目包含多个MCP服务器示例,如任务管理器、文件浏览器和天气服务,并提供了如何设置和使用这些服务器的指南。
MyMCP是一个基于Python的应用程序,支持通过Aider工具并行执行多个AI编码任务,提供并行/顺序执行选择、详细报告和性能比较功能。
Planfix MCP Server是一个将Planfix业务管理系统与Model Context Protocol (MCP)集成的项目,提供任务管理、项目管理、CRM联系人和数据分析等功能,支持通过AI助手如Claude进行操作。
Dart MCP Server是一个基于Dart的模型上下文协议(MCP)服务器实现,提供任务管理、文档处理和空间组织功能,支持与AI助手集成。
Superdesign MCP服务器是一个设计协调器,将开源的Superdesign AI设计代理集成到Claude Code中,无需API密钥即可使用其高级设计功能。它通过MCP服务器提供结构化规范,使Claude Code的LLM能够执行设计任务,支持UI设计、组件、图标等多种设计类型,并包含迭代和设计系统提取功能。
基于Model Context Protocol(MCP)的智能任务管理系统,为AI代理提供高效编程工作流框架,具备任务规划、分解、依赖管理、验证和记忆等功能。