阿里巴巴发布Qwen3-Max-Thinking推理模型,参数量超万亿,在复杂推理、事实知识及智能体能力上实现显著提升。该模型采用大规模强化学习训练,引入自适应工具调用和测试时扩展技术,综合性能已媲美GPT-5.2-Thinking等国际顶尖模型。
英伟达与香港大学联合发布Orchestrator模型,拥有8亿参数,能协调多种工具和大型语言模型解决复杂问题。该模型在工具使用基准测试中,以更低成本实现更高准确性,并能根据用户偏好智能选择工具。其训练采用名为ToolOrchestra的新强化学习框架,旨在提升小型模型的协调能力。
亚马逊云科技推出三款AI智能体提升开发运维效率,其中自主智能体Kiro可连续工作数天,学习用户偏好并独立完成复杂任务。它基于同名编码工具,能自动生成运营级代码,并在编程中与用户互动确认或修正假设。
中国推出多模态AI模型DeepEyesV2,能分析图像、执行代码和网络搜索。它通过智能利用外部工具,而非依赖训练数据,性能超越大型模型。早期实验显示,仅靠强化学习无法稳定完成多模态任务,模型曾尝试编写Python代码分析图像但效果不佳。
Alice 是一款利用 AI 技术帮助用户高效备考、提升学习效率的智能学习工具。
智能舞蹈练习工具,助力少儿舞蹈学习
提升会议和学习效率的智能工具
一秒检查小学作业的智能学习工具
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Anthropic
$7
$35
200
Alibaba
$6
$24
256
Xai
$1.4
$10.5
Deepseek
$4
$12
128
$1.75
$14
400
$1
Chatglm
-
$2
$8
Huawei
32
$21
$105
Tencent
28
$56
Google
$0.35
$0.7
131
4
8
一个基于强化学习的智能电商对话代理系统,集成了本体推理、业务工具链、对话记忆和Gradio界面,通过Stable Baselines3 PPO算法实现从数据到训练再到部署的闭环学习,能自主优化购物助手的决策策略。
MCP Sigmund是一个基于PostgreSQL数据库的金融数据分析学习工具,通过Model Context Protocol为AI助手提供智能格式化金融数据查询服务,仅限教育用途。