Best 长上下文 AI Tools & Models - Premium 长上下文 News

AI News

英伟达推出 Nemotron 3：混合架构提升 AI 代理处理效率

英伟达发布Nemotron 3系列，融合Mamba与Transformer架构，高效处理长上下文并降低资源消耗。该系列专为自主执行复杂任务的AI代理系统设计，包含Nano、Super、Ultra三款型号。目前Nano已上市，Super和Ultra预计2026年上半年推出。

10.6k yesterday

小米发布新一代 MoE 大模型 MiMo-V2-Flash，助力 AGI 发展

小米新任大模型负责人罗福莉在2025小米生态大会上，正式发布全新MoE大模型MiMo-V2-Flash。该模型采用Hybrid SWA架构，设计简洁优雅，在长上下文推理方面表现突出，标志着小米向人工通用智能（AGI）目标迈出重要一步。

12.1k 7 hours ago

AI 也会 “脑损伤”？研究揭示低质量数据对大语言模型的影响

研究发现，大语言模型持续接触低质量数据（如社交媒体内容）后，会出现类似人类“脑损伤”的现象，导致推理能力下降23%，长上下文记忆能力下降30%。这种损伤不可逆，即使后续用高质量数据训练也无法完全恢复。

10.4k 17 hours ago

月之暗面推Kimi Linear模型：处理长上下文速度提高了2.9倍

月之暗面团队推出Kimi Linear模型，在AIGC领域实现技术突破。该模型采用混合线性注意力架构，处理长上下文速度提升2.9倍，解码速度提高6倍，性能超越传统Softmax注意力机制，特别在上下文处理和强化学习等场景表现优异。

14.5k 5 hours ago

AI Products

长上下文调优（LCT）

一种提升场景级视频生成能力的技术。

视频生成

21.4k

VideoRAG

VideoRAG 是一个用于处理极长上下文视频的检索增强型生成框架。

视频编辑

9.9k

ModernBERT-large

高性能的双向编码器Transformer模型

AI搜索

9.4k

Qwen2.5-Coder-1.5B-Instruct-GPTQ-Int8

Qwen2.5-Coder系列的1.5B参数代码生成模型

代码助手

5.7k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

Doubao-Seed-1.6

Bytedance

$0.8

Input tokens/M

Output tokens/M

256

Context Length

Doubao-Seed-1.6-flash

Bytedance

$0.15

Input tokens/M

$1.5

Output tokens/M

256

Context Length

Qianfan-VL-70B

Baidu

Input tokens/M

Output tokens/M

Context Length

Grok Code Fast 1

Xai

$1.4

Input tokens/M

$10.5

Output tokens/M

256

Context Length

Hunyuan-T1-latest

Tencent

Input tokens/M

Output tokens/M

Context Length

Doubao-Seed-1.6-vision

Bytedance

$0.8

Input tokens/M

Output tokens/M

256

Context Length

Qwen3-30B-A3B-Instruct-2507

Alibaba

$0.75

Input tokens/M

Output tokens/M

256

Context Length

GPT-5 nano

Openai

$0.35

Input tokens/M

$2.8

Output tokens/M

400

Context Length

qwen3-coder-flash

Alibaba

Input tokens/M

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

英伟达推出 Nemotron 3：混合架构提升 AI 代理处理效率

小米发布新一代 MoE 大模型 MiMo-V2-Flash，助力 AGI 发展

AI 也会 “脑损伤”？研究揭示低质量数据对大语言模型的影响

月之暗面推Kimi Linear模型：处理长上下文速度提高了2.9倍

AI Products

长上下文调优（LCT）

VideoRAG

ModernBERT-large

Qwen2.5-Coder-1.5B-Instruct-GPTQ-Int8

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash-Lite

qwen3-coder-plus

qwen3-max

qwen3-vl-235b-a22b-thinking

Qwen3-Next-80B-A3B-Instruct

Doubao-Seed-1.6

Doubao-Seed-1.6-flash

Qianfan-VL-70B

Grok Code Fast 1

Hunyuan-T1-latest

Doubao-Seed-1.6-vision

Qwen3-30B-A3B-Instruct-2507

GPT-5 nano

qwen3-coder-flash

GigaChat3 10B A1.8B Bf16

MiroThinker V1.0 30B GGUF

Qwen3 42B A3B YOYO V5 TOTAL RECALL NEO Imatrix GGUF

Tarka Embedding 350M V1

Olmo 3 1125 32B

Qwen3 VL 4B Instruct

Qwen3 VL 30B A3B Instruct 1M GGUF

Qwen3 VL 32B Thinking 1M GGUF

Qwen3 VL 8B Thinking 1M GGUF

Qwen3 VL 32B Instruct 1M GGUF

Qwen3 VL 4B Thinking 1M GGUF

Qwen3 VL 2B Instruct 1M GGUF

Qwen3 VL 2B Thinking 1M GGUF

Qwen3 VL 30B A3B Thinking GGUF

Qwen3 VL 30B A3B Instruct GGUF

Qwen3 VL 8B Thinking GGUF

Qwen3 VL 32B Thinking GGUF

Qwen3 VL 32B Instruct GGUF

Qwen3 VL 8B Instruct GGUF

Qwen3 VL 32B Thinking GGUF