阿里雲 Qwen2.5-1M 開源發佈:100萬上下文長度模型登場
繼 DeepSeek R1之後,阿里雲通義千問團隊剛剛宣佈推出其最新的開源模型 Qwen2.5-1M,再次引發業界關注。此次發佈的 Qwen2.5-1M 系列包含兩個開源模型:Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M。這是通義千問首次推出能夠原生支持百萬Token上下文長度的模型,並在推理速度上實現了顯著提升。Qwen2.5-1M 的核心亮點在於其原生支持百萬 Token 的超長上下文處理能力。這使得模型能夠輕鬆應對書籍、長篇報告、法律文件等超長文檔,無需進行繁瑣的分割處理。同時,該模型還支持更長時間、更深入的對話