Best 长文本推理 AI Tools & Models - Premium 长文本推理 News

AI News

千问Qwen3.5-Plus除夕开源登顶全球最强开源大模型

2026年除夕，阿里巴巴开源新一代大模型千问Qwen3.5-Plus，性能媲美Gemini3Pro，成为全球最强开源大模型。该模型采用底层架构革新，参数3970亿但激活仅170亿，以更小规模超越万亿参数的Qwen3-Max，部署显存占用降低60%，长上下文推理吞吐量提升19倍。API成本低至每百万Token 0.8元，仅为Gemini3Pro的1/18。此外，它实现了从纯文本到原生多模态的跃迁。

17k 10 hours ago

DeepSeek V3.2 双模型发布：线性复杂度长文本 + 无惩罚深度思考，开源阵营再冲第一梯队

DeepSeek发布V3.2标准版与深度思考版。评测显示，V3.2在128k上下文场景下与GPT-5互有胜负；深度思考版在多项基准测试中与Gemini3Pro持平，并在IMO2025盲测中达到金牌分数线。核心升级是转正稀疏注意力技术，通过优化token路由，显著降低了长文本的计算复杂度、显存占用，并提升了推理速度，首次在开源模型中实现了百万token的单卡推理能力。

11.6k 6 days ago

StepFun AI 发布全新音频大语言模型 Step-Audio-R1，音频推理能力显著提升

StepFun AI团队推出音频大模型Step-Audio-R1，通过优化计算资源利用，解决了音频AI模型在长推理链中准确性下降的问题。研究团队指出，问题源于训练时过度依赖文本数据，导致模型推理类似阅读文字而非实际聆听声音。

12.2k 3 days ago

杨立昆炮轰LLM：Meta AI战略走错了方向

Meta首席AI科学家杨立昆离职后首次公开表示，大公司重金投入大型语言模型是战略错误，无法实现真正智能。他指出LLM仅能统计补全文本，缺乏物理世界理解、长期推理和规划能力，注定无法达到人类智能水平。他认为下一代突破应依靠“世界模型”。

11.6k 3 days ago

AI Products

AI21-Jamba-Large-1.6

AI21 Jamba Large 1.6 是一款强大的混合 SSM-Transformer 架构基础模型，擅长长文本处理和高效推理。

模型训练与部署

9.9k

DeepScaleR-1.5B-Preview

一个基于强化学习优化的大型语言模型，专注于数学问题解决能力的提升。

学习教育

11.9k

Phi-3.5-MoE-instruct

轻量级、多语言的AI模型，支持长文本生成和推理。

AI模型

9.3k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

qwen3-omni-flash-realtime

Alibaba

$3.9

Input tokens/M

$15.2

Output tokens/M

Context Length

Kimi-K2

Moonshot

Input tokens/M

$16

Output tokens/M

256

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

千问Qwen3.5-Plus除夕开源 登顶全球最强开源大模型

DeepSeek V3.2 双模型发布：线性复杂度长文本 + 无惩罚深度思考，开源阵营再冲第一梯队

​StepFun AI 发布全新音频大语言模型 Step-Audio-R1，音频推理能力显著提升

杨立昆炮轰LLM：Meta AI战略走错了方向

AI Products

AI21-Jamba-Large-1.6

DeepScaleR-1.5B-Preview

Phi-3.5-MoE-instruct

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

Qianfan-Lightning

qwen3-max

Doubao-Seed-Translation

Qwen3-Next-80B-A3B-Instruct

qwen3-omni-flash-realtime

Kimi-K2

Qwen3 VL 4B Instruct

Qwen3 VL 30B A3B Instruct 1M GGUF

Qwen3 VL 32B Thinking 1M GGUF

Qwen3 VL 8B Thinking 1M GGUF

Qwen3 VL 32B Instruct 1M GGUF

Qwen3 VL 8B Instruct 1M GGUF

Qwen3 VL 4B Thinking 1M GGUF

Qwen3 VL 4B Instruct 1M GGUF

Qwen3 VL 2B Thinking 1M GGUF

Qwen3 VL 30B A3B Thinking GGUF

Qwen3 VL 30B A3B Instruct GGUF

Qwen3 VL 8B Thinking GGUF

Qwen3 VL 32B Thinking GGUF

Qwen3 VL 32B Instruct GGUF

Qwen3 VL 8B Instruct GGUF

Qwen3 VL 32B Thinking GGUF

Qwen3 VL 32B Instruct GGUF

Qwen3 VL 30B A3B Instruct GGUF

Qwen3 VL 30B A3B Thinking GGUF

Qwen3 VL 8B Instruct GGUF

千问Qwen3.5-Plus除夕开源登顶全球最强开源大模型

StepFun AI 发布全新音频大语言模型 Step-Audio-R1，音频推理能力显著提升