阿里千问系列最新模型Qwen3.6Plus Preview已上线OpenRouter平台,目前限时免费,并具备100万超长上下文处理能力。该模型在底层架构上进行了深度优化,采用更先进的混合架构,显著提升了扩展性并降低了成本,性能比前代更强。
Anthropic发布Claude AI模型,支持100万Token上下文窗口,相当于可处理750万英文单词或7倍《哈利·波特》系列内容。这一突破为开发者提供了强大的“超长工作记忆”,能一次性处理庞大代码库,显著提升编程效率,可能改变AI编程领域的竞争格局。
国产AI模型DeepSeek V4预览版已启动闭门内测,代号“海狮轻量版”。新模型相比V3实现跨代升级,原生支持多模态处理,并将上下文窗口大幅提升至100万token,可一次性处理超长文本。
DeepSeek于2月11日灰度更新网页端和APP端,14日正式官宣为新长文本模型结构测试。此次更新支持最高100万token超长上下文,知识库更新至2025年5月。但API服务仍为V3.2版本,仅支持128K上下文。业内视此次更新为下一代V4模型发布前的技术预热和压力测试,引发对V4的广泛期待。更新后,DeepSeek的交互风格也发生明显变化。
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Google
$0.7
$2.8
1k
Baidu
-
32
Alibaba
$0.75
256
$1
$4
Bytedance
$0.8
$8
$0.3
$2
Tencent
$0.5
224
$8.75
$70
Baichuan
$16
192
Minimax
128
$1.05
$4.2
Moonshot
$32
262
nightmedia
这是一个基于Qwen3-Next-80B模型转换的MLX格式大语言模型,具有100万标记的超长上下文处理能力。该模型采用独特的qx65量化公式,注重情感共鸣而非单纯的技术优化,能够感知问题背后的情感并生成更具人性化的回复。
LongSafari
HyenaDNA是一个长距离基因组基础模型,在高达100万个标记的上下文长度上以单核苷酸分辨率进行预训练。该模型使用Hyena算子替代传统注意力机制,实现了次二次计算复杂度,能够处理超长DNA序列。