2026年2月5日,Anthropic发布新一代旗舰模型Claude Opus4.6,距上代仅隔两个月,迭代速度极快。本次更新聚焦提升“自主性”与“任务持久力”,核心突破包括首次在Opus级别引入100万token上下文窗口,并强化模型“自主意识”,使其从对话工具向智能体方向进化。
Anthropic 推出新一代旗舰AI模型Claude Opus4.6,更新节奏迅速。新版本聚焦“自主性”与“生产力”,旨在为开发者和企业办公提供深度智能化支持。技术亮点包括首次引入100万token超大上下文窗口,显著提升模型处理长文本能力。
谷歌发布Gemini3,首次提供100万tokens上下文窗口,原生支持文本、图像、视频与代码多模态推理。Gemini3 Pro在GPQA测试获91.9%准确率,LMArena以1501分超越GPT-5.1与Claude4.5登顶。采用Deep Think推理模式,通过“思维签名”产品化推理链,在逻辑、事实与科学推理方面表现突出。
谷歌Gemini系列AI模型迎来新进展,预览版"gemini-3-pro-preview-11-2025"在Vertex AI平台被发现,预计本月正式推出。该模型支持100万token超大上下文窗口,标识明确指向11月发布。Vertex AI作为谷歌云端AI开发核心工具,已在网络日志中暴露相关信息。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
Anthropic
$105
$525
200
$0.7
$7
$35
Alibaba
$4
$16
$2
$20
-
$6
$24
256
Bytedance
$0.8
$0.15
$1.5
Baidu
32
$10.5
$8
Tencent
$1
$0.75
$0.35
400
$0.63
$3.15
131
Mungert
aquif-3.5系列中的顶尖模型,具备先进推理能力和100万标记的大上下文窗口,在多个基准测试中表现卓越,AAII综合得分达到60分。
unsloth
aquif-3.5系列是2025年11月3日发布的巅峰之作,包含Plus和Max两个版本,提供先进的推理能力和前所未有的100万标记上下文窗口,在各自类别中实现了最先进的性能。
moonshotai
Kimi Linear是一种高效混合线性注意力架构,在短上下文、长上下文和强化学习场景中均优于传统全注意力方法。它通过Kimi Delta Attention (KDA)机制优化注意力计算,显著提升性能和硬件效率,特别擅长处理长达100万令牌的长上下文任务。
nightmedia
基于Qwen3-Next的800亿参数指令微调模型,采用Deckard qx64n混合精度量化技术,支持100万上下文长度,在抽象推理、内存效率和长上下文处理方面表现优异
DavidAU
这是一个基于Qwen3-Coder-30B-A3B-Instruct的混合专家模型,拥有540亿参数和100万上下文长度。模型通过三步合并和Brainstorm 40X优化,具备强大的编程能力和通用场景处理能力,特别集成了思考模块,能够在回答前进行深度推理。
这是一个基于Qwen3-Next-80B模型转换的MLX格式大语言模型,具有100万标记的超长上下文处理能力。该模型采用独特的qx65量化公式,注重情感共鸣而非单纯的技术优化,能够感知问题背后的情感并生成更具人性化的回复。
基于Llama 3.1的8B参数模型,支持100万token上下文长度,专为创意写作和角色扮演优化,具有高度稳定性和低困惑度特性。
YOYO-AI
Qwen2.5-YOYO第五代模型,整合了多个先进模型的特点,优化了模型合并公式,支持100万token上下文。
gradientai
由Gradient开发的Llama-3 8B长上下文扩展版本,支持超过100万token的上下文长度,通过优化RoPE theta参数实现高效长文本处理能力。
LongSafari
HyenaDNA是一个长距离基因组基础模型,预训练上下文长度可达100万个标记,具有单核苷酸分辨率。
HyenaDNA是一个长距离基因组基础模型,在高达100万个标记的上下文长度上以单核苷酸分辨率进行预训练。该模型使用Hyena算子替代传统注意力机制,实现了次二次计算复杂度,能够处理超长DNA序列。
HyenaDNA是一个长距离基因组基础模型,在单核苷酸分辨率下预训练了长达100万个标记的上下文长度。