AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
數據集市
TW

AI資訊

查看更多

阿里突破性發布QwenLong-L1-32B:首個強化學習訓練的長文本推理模型,性能媲美Claude-3.7

阿里巴巴今日正式發佈QwenLong-L1-32B,這是一款專爲長上下文推理設計的大型語言模型,標誌着AI長文本處理能力的重大突破。該模型在性能表現上超越了o3-mini和Qwen3-235B-A22B,與Claude-3.7-Sonnet-Thinking達到相當水平。技術創新亮點QwenLong-L1-32B最大的技術突破在於其是全球首個通過強化學習訓練的長文本情境推理模型。該模型基於QwenLong-L1框架開發,採用了先進的GRPO(Group Relative Policy Optimization)和DAPO(Direct Alignment Policy Optimization)算法,結合基於規則和基於模型的混合獎勵函數,顯著提升了模型在

15.6k 3 天前
阿里突破性發布QwenLong-L1-32B:首個強化學習訓練的長文本推理模型,性能媲美Claude-3.7

AI產品

查看更多
Aidy

Aidy

Aidy performs deep, persistent, and tailored research on policy, politics, and markets.

研究工具
5.5k
Free AI Privacy Policy & ToS Generator

Free AI Privacy Policy & ToS Generator

使用AI智能生成網站、博客或APP的隱私政策和服務條款

法律工具
11k

MCP

查看更多
agent-policy-builder-mcp

Agent Policy Builder Mcp

GlassTape Policy Builder是一個開源MCP服務器,可將自然語言安全需求轉換為經過驗證的Cerbos YAML策略,為AI代理和應用提供零信任護欄。

python
5.3k
2.5分
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖