苹果研究团队探讨了AI智能体交互中用户对自动化与控制权的平衡需求,指出当前行业过于关注操作能力而忽视用户体验。研究采用“绿野仙踪法”模拟AI交互,以获取真实用户反馈,强调设计需兼顾信任与心理边界。
阿里巴巴发布具身智能大模型RynnBrain,推动机器人从自动化向具备深度逻辑与时空感知的“智能生命”跨越。该模型深度融合感知与决策,赋予机器人时空记忆能力,成为物理AI领域的技术新标杆。
Anthropic 推出新一代旗舰AI模型Claude Opus4.6,更新节奏迅速。新版本聚焦“自主性”与“生产力”,旨在为开发者和企业办公提供深度智能化支持。技术亮点包括首次引入100万token超大上下文窗口,显著提升模型处理长文本能力。
英伟达CEO黄仁勋驳斥AI恐慌,称市场担忧AI取代软件工具是“最不合逻辑的事”。近期AI模型性能提升引发自动化担忧,导致软件股下跌。黄仁勋以比喻强调AI与软件协同发展的必然性。
领先的社区咖啡聊天软件,通过AI匹配自动化1对1介绍,提升成员参与度。
云浏览器基础设施,供AI团队和自动化使用,可通过应用或API启动,免费试用7天。
专为 Mac 用户设计的 AI 语音助手,通过语音指令实现润色、翻译及自动化办公。
开源自托管的个人 AI 助手,控制你的计算机。
Anthropic
$105
Input tokens/M
$525
Output tokens/M
200
Context Length
Xai
$1.4
$10.5
256
Bytedance
$0.8
$8
Openai
$8.75
$70
400
$3.5
$12
128
Alibaba
$0.5
-
Huawei
32
$0.7
$2.8
1k
Google
$0.35
131
$21
Moonshot
$5
$20
$2
$10
8
$30
Baidu
$1.05
$4.2
$1
prithivMLmods
ActIO-UI-7B-RLVR 是由 Uniphore 发布的 70 亿参数视觉语言模型,专门用于计算机界面自动化任务。它基于 Qwen2.5-VL-7B-Instruct,通过监督微调和可验证奖励的强化学习进行优化,在 GUI 导航、元素定位和交互规划等任务上表现出色,在 WARC-Bench 基准测试中达到了开源 7B 模型的领先水平。
microsoft
Fara-7B是微软研究院开发的专为计算机使用场景设计的小型语言模型,仅有70亿参数,在同规模模型中实现卓越性能,能够执行网页自动化、多模态理解等计算机交互任务。
almanach
Gaperon-Young-1125-1B 是一个拥有15亿参数的双语(法语-英语)语言模型,由法国国家信息与自动化研究所(Inria Paris)的ALMAnaCH团队开发。该模型在约3万亿个高质量令牌上训练,特别注重语言质量和通用文本生成能力,而非基准测试优化。
Salesforce
GTA1是基于GRPO强化学习训练的GUI接地模型,专门用于图形用户界面自动化操作。相较于依赖冗长思维链推理的方法,GRPO直接激励可操作和有根据的响应,在多个基准测试中表现出卓越的接地性能。
GTA1是基于强化学习(GRPO)训练的最先进GUI接地模型,专门用于图形用户界面自动化任务。与依赖冗长思维链推理的方法不同,GRPO直接激励可操作和有根据的响应,在多个挑战性数据集上展示了卓越的接地性能和代理性能。
Deeps03
基于Qwen/Qwen2-1.5B微调的日志分类模型,专门用于对系统或应用程序日志条目进行分类,支持正常、可疑、恶意、信息性和错误五类标签识别,助力自动化日志监控和安全分析。
zhuyaoyu
CodeV-R1-Qwen-7B是基于CodeV-R1框架,在Qwen/Qwen2.5-Coder-7B-Instruct基础上通过强化学习微调得到的模型,专注于Verilog相关任务,能有效解决电子设计自动化中自动生成硬件描述语言的难题。
mradermacher
SEOcrate-4B_grpo_new_01的静态量化版本,专门针对SEO和营销自动化领域优化,提供多种量化类型以满足不同需求,在质量和速度之间提供平衡选择。
AlexBefest
CardProjector是专为SillyTavern和通用角色创建设计的语言模型系列,通过自动化制作细节丰富、结构完善的角色卡片来辅助创作者和角色扮演者。
OTA-AI
OTA-v1是基于Qwen2.5-14B微调的专业级浏览器智能体模型,专精于浏览器环境控制,通过browser-use等框架实现高精度自动化网页操作。
fotographerai
ZenCtrl是一个自动化个性化视觉内容创作流程的智能体,能够执行多种设计任务和训练自用模型。
jeffmeloy
基于Qwen2.5-7B的优化层合并(OLM)模型,通过自动化层重组技术提升性能
MMIE
MMIE是一个专为大型视觉语言模型设计的评估基准,提供自动化评分系统测试多模态交错理解能力。
WestlakeNLP
CycleResearcher是基于强化学习与迭代反馈的自动化研究系统,专为机器学习研究训练,涵盖计算机视觉、自然语言处理等领域。
CohereLabs
Command R+ 08-2024 是一个1040亿参数的多语言大语言模型,支持检索增强生成(RAG)和工具使用,适用于复杂任务自动化。
acon96
基于TinyLlama-1.1B-Chat微调的家庭自动化控制模型,专为Home Assistant设计
ArmurAI
基于OpenHermes-2.5-Mistral-7B改造的渗透测试助手,专为Kali Linux工具集优化,提供引导式渗透测试和命令自动化支持。
FriendliAI
C4AI Command R+ 是一个开放权重的1040亿参数研究模型,具备高级功能,包括检索增强生成(RAG)和工具使用以自动化复杂任务。
CohereForAI
Command R+是Cohere实验室开发的1040亿参数开放权重研究级模型,支持多语言和复杂任务自动化。
Command R+是Cohere Labs推出的1040亿参数开放权重研究版本模型,具备检索增强生成(RAG)和工具使用能力,支持多语言和多步任务自动化。
Deebo是一个AI调试助手,能够加速代码错误的解决过程,通过自动化调查和多线程工作流提升开发效率。
PraisonAI是一个生产就绪的多AI智能体框架,具有自反思功能,旨在创建AI智能体来自动化解决从简单任务到复杂挑战的各种问题。它通过将PraisonAI智能体、AG2和CrewAI集成到一个低代码解决方案中,简化了多智能体LLM系统的构建和管理,强调简单性、定制化和有效的人机协作。
Next.js开发工具MCP服务器,为Claude、Cursor等AI编程助手提供Next.js开发工具和实用程序,包括运行时诊断、开发自动化和文档访问功能。
一个基于Playwright的MCP服务器,为LLM提供浏览器自动化能力
基于MCP协议的AI驱动浏览器自动化服务器,支持自然语言控制网页操作和深度网络研究。
Changesets是一个自动化工具,用于帮助管理多包或单包代码库的版本控制和发布流程。
Browser MCP是一个MCP服务器+Chrome扩展,通过AI应用(如VS Code、Claude等)实现浏览器自动化操作,具有快速、隐私保护、保持登录状态和规避检测等特点。
XcodeBuild MCP是一个为AI助手和MCP客户端提供Xcode相关工具集成的服务器,支持Xcode项目管理、模拟器控制和应用工具等功能,实现自动化开发流程。
Netdata是一个开源实时基础设施监控平台,提供每秒级指标收集、可视化、机器学习驱动的异常检测和自动化告警,无需复杂配置即可实现全栈监控。
OpenDia是一款开源浏览器扩展工具,允许AI模型直接控制用户浏览器,利用现有登录状态、书签等数据进行自动化操作,支持多种浏览器和AI模型,注重隐私保护。
Playwright MCP是一个基于Playwright的浏览器自动化服务器,通过结构化数据而非像素输入实现LLM与网页的交互。
Notte是一个开源的全栈网络AI代理框架,提供浏览器会话、自动化LLM驱动的代理、网页观察与操作、凭证管理等功能,旨在将互联网转化为代理友好的环境,并通过自然语言描述网站结构,降低LLM的认知负担。
Mobile Next - MCP服务器是一个用于移动自动化的平台无关接口,支持iOS和Android设备的自动化操作,无需特定平台知识。
一个基于browser-use的MCP服务器,使AI代理能够控制网页浏览器进行自动化操作。
MCP Link是一个自动化工具,能够将任何OpenAPI V3规范的API转换为MCP服务器,使现有RESTful API能够无缝接入AI驱动的应用生态系统。
302AI BrowserUse MCP Server是一个基于AI的浏览器自动化服务器,通过Model Context Protocol (MCP)实现自然语言控制浏览器和网络研究。
UE5-MCP是一个集成AI驱动的自动化工具,旨在优化Blender与Unreal Engine 5的工作流程,提供从场景生成到游戏开发的端到端解决方案。
Awesome MCP Servers 是一个全面的Model Context Protocol (MCP)服务器集合,涵盖了7158个MCP服务器,分为33个类别,包括AI集成、艺术媒体、浏览器自动化、云服务、数据库、开发者工具、文件系统、金融、游戏、硬件、医疗、基础设施、知识管理、位置地图、市场营销、监控、多媒体处理、操作系统、项目管理、科学研究、安全、社交媒体、旅行交通、实用工具和版本控制等。
DevOps AI Toolkit是一个基于AI的平台工程和DevOps自动化工具,通过智能Kubernetes操作和对话式工作流,为团队提供资源部署推荐、问题修复、项目治理和共享提示库等功能,使复杂的云原生操作可通过自然语言交互实现。
Apify MCP服务器是一个实现Model Context Protocol(MCP)的服务,允许AI助手通过SSE或Stdio与Apify平台上的各种Actor交互,执行数据抓取、网页搜索等任务。