Best 任务代理 AI Tools & Models - Premium 任务代理 News

AI News

Anthropic发布重磅大模型Claude Sonnet 5：性能直逼旗舰，价格却大跳水

Anthropic发布新中高阶模型Claude Sonnet 5，主打性价比，性能大幅逼近旗舰Opus系列。该模型具备迄今最强代理能力，可自主规划复杂任务、自查输出，并灵活调用浏览器与终端等外部工具，在推理、编程和知识任务上表现突出。

18.9k 1 hours ago

开源 AI 代理项目 OpenClaw 正式推出 iOS 与 Android 移动版应用

OpenClaw开源AI智能体项目发布iOS与Android移动应用，用户可通过设备配对网关，随时调用AI代理执行程序编写、膳食规划等任务。该项目年初走红，此次实现全平台覆盖，进一步推动高自动化智能体落地。

13.5k 52 minutes ago

开源 AI 代理项目 OpenClaw 正式推出 iOS 与 Android 移动版应用

融资 5000 万美元！Patronus AI 打造“数字孪生世界”为 AI 智能体做压力测试

AI代理日益自主化，执行多步任务时的稳定性成为关键。Patronus AI完成5000万美元B轮融资，总融资达7000万，由Meta前研究员创立，专注构建高仿真数字测试环境，确保AI智能体在现实中安全可靠运行。

12.8k yesterday

谷歌发布 Gemini3.5Flash，原生集成计算机使用工具，替代2.5框架

谷歌将“计算机使用”工具直接集成到Gemini 3.5 Flash模型，取代旧测试框架，推动AI向可执行任务的“数字同事”演进。开发者可通过API构建智能代理，实现代理从概念到落地的跨越。

17.5k 14 hours ago

AI Products

Swytchcode

Swytchcode 位于 AI 代理和生产环境之间，支持 2000+ API，处理多项关键任务。

开发与工具

4.6k

Rezonant

Rezonant将产品愿景转化为工程就绪的工作，贯穿任务、代理和代码交付。

开发与工具

7.1k

Mindra

Mindra是AI代理编排平台，可组建团队完成任务，有3000+集成。

开发平台

4.2k

Browse.sh

browse.sh是一个开放的浏览器自动化技能目录，可让AI代理自动化网站任务。

开发与工具

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Kimi-K2

Moonshot

Input tokens/M

$16

Output tokens/M

256

Context Length

Grok Code Fast 1

Xai

$1.4

Input tokens/M

$10.5

Output tokens/M

256

Context Length

DeepSeek-V3.1

Deepseek

Input tokens/M

$12

Output tokens/M

128

Context Length

qwen-vl-max

Alibaba

$1.6

Input tokens/M

Output tokens/M

128

Context Length

GPT-5 mini

Openai

$1.75

Input tokens/M

$14

Output tokens/M

400

Context Length

GPT-5 nano

Openai

$0.35

Input tokens/M

$2.8

Output tokens/M

400

Context Length

Qwen3-235B-A22B-Instruct-2507

Alibaba

Input tokens/M

Output tokens/M

Context Length

GPT OSS 120B

Openai

$0.63

Input tokens/M

$3.15

Output tokens/M

131

Context Length

qwen-flash

Alibaba

$15

Input tokens/M

$15

Output tokens/M

Context Length

Doubao-Seed-1.6-thinking

Bytedance

$0.8

Input tokens/M

Output tokens/M

256

Context Length

MCP

Overseer

Overseer是一个通过MCP为AI代理提供任务编排的系统，采用SQLite存储和原生VCS支持（jj-lib + gix），支持任务层次管理、学习记录传递和可视化界面。

typescript

8.6k

3.5points

Mcp Shrimp Task Manager

基于MCP协议的智能任务管理系统，提供AI代理的高效编程工作流框架，具备任务规划、分解、执行和记忆功能。

typescript

15.8k

3.0points

Atlas Mcp Server

ATLAS是一个基于TypeScript和Neo4j构建的智能任务与知识管理系统，专为LLM代理设计，提供项目、任务和知识的三层管理架构。

typescript

13.2k

3.0points

Server Notify

一个基于MCP协议的服务器，用于在代理任务完成时发送桌面通知和播放提示音。

python

14.8k

2.5points

Think Mcp

Think MCP是一个实现MCP服务器的项目，提供'think'工具以支持AI代理在复杂任务中进行结构化推理，灵感来自Anthropic的研究。该工具通过记录思考过程帮助AI处理信息、回溯或遵守策略，适用于工具输出分析、策略密集环境和顺序决策场景。

python

11.1k

2.5points

Android Mcp

Android-MCP是一个轻量级开源项目，作为AI代理与Android设备之间的桥梁，通过MCP服务器实现真实任务操作如应用导航、UI交互和自动化测试，无需依赖传统计算机视觉或预设脚本。

python

18.1k

2.5points

Gru Sandbox

gbox是一个开源的自托管沙箱项目，为MCP集成和其他AI代理用例提供安全环境。它包含终端、浏览器、文件编辑器等工具，支持本地任务执行和文件处理，并提供了Python和Typescript SDK。

18.2k

2.5points

LLM Gateway

Ultimate MCP Server是一个基于模型上下文协议(MCP)的AI代理操作系统，提供数十种强大工具能力，包括智能任务委派、文档处理、浏览器自动化、Excel操作等，通过标准化MCP工具实现AI代理的认知增强和复杂任务编排。

python

10.8k

2.5points

Mcp

Webvizio MCP服务器是一个基于TypeScript的模型上下文协议服务器，提供对Webvizio API的安全结构化访问，可将网站反馈和错误报告自动转换为可执行的开发任务，供AI编码代理处理。

typescript

6.2k

2.5points

Speelka Agent

Speelka Agent是一个基于模型上下文协议(MCP)的通用LLM代理，能够调用其他MCP服务器的工具，实现复杂任务分解、多模型协作和工具编排。

9.9k

2.5points

Sequential Thinking Mcp

Sequential Thinking MCP是一个支持AI代理进行高级元认知和动态反思问题解决的MCP服务器，通过虚拟记录思维和计划来指导复杂任务的分步执行。

python

23k

2.5points

Superdesign Mcp Claude Code

Superdesign MCP服务器是一个设计协调器，将开源的Superdesign AI设计代理集成到Claude Code中，无需API密钥即可使用其高级设计功能。它通过MCP服务器提供结构化规范，使Claude Code的LLM能够执行设计任务，支持UI设计、组件、图标等多种设计类型，并包含迭代和设计系统提取功能。

typescript

14.7k

2.5points