Best 上下文长度 AI Tools & Models - Premium 上下文长度 News

AI News

DeepSeek 迎来版本更新:上下文长度跃升至1M，万亿参数旗舰模型在路上

DeepSeek网页端和移动应用于2月11日更新，上下文长度提升至100万Token，处理能力较此前128K版本提升近8倍，可一次性处理大规模文档，进入全球顶尖梯队。

16k 5 hours ago

谷歌 Gemini 3 Pro Preview模型上线 AI Studio 开发者可灵活调整参数

谷歌发布Gemini3大型语言模型，其Pro Preview版已在AI Studio平台开放体验。该平台面向开发者、研究人员和学生，支持基于Gemini模型开发应用，并提供上下文长度、温度等参数灵活调整功能，便于优化模型配置。

12.9k 4 days ago

硅基流动上线 DeepSeek-V3.2-Exp，显著降低价格并支持更大上下文

硅基流动发布实验性模型DeepSeek-V3.2-Exp，支持160K上下文长度，价格直降超50%。该模型基于V3.1-Terminus深度优化，引入DeepSeek稀疏注意力机制，显著提升长文本训练和推理效率。

13.6k 3 days ago

Moondream3.0发布，多项基准测试超越了 GPT-5 等顶尖模型

Moondream3.0预览版采用高效混合专家架构，仅激活2亿参数，总参数量达9亿，在视觉推理方面表现卓越。相比前代，该模型在多项基准测试中超越GPT-5、Gemini和Claude4等顶尖模型，实现技术飞跃。支持32K上下文长度，适用于复杂场景处理。

11.9k 5 days ago

AI Products

Kimi Latest

月之暗面推出的最新AI模型，支持自动同步更新和大上下文长度，适用于AI聊天和智能助手构建。

AI模型

11.9k

Llama-3-Giraffe-70B-Instruct

一款具有128k有效上下文长度的70B参数的大型语言模型。

AI模型

8.7k

Llama-3 70B Gradient 524K Adapter

Llama-3 70B模型的LoRA适配器，扩展上下文长度至超过524K。

AI模型

10.6k

EasyContext

EasyContext演示了如何利用现有技术组合，来训练700K和1M上下文的语言模型。

上下文长度

9.4k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

Doubao-Seed-1.6

Bytedance

$0.8

Input tokens/M

Output tokens/M

256

Context Length

Doubao-Seed-1.6-flash

Bytedance

$0.15

Input tokens/M

$1.5

Output tokens/M

256

Context Length

Qianfan-VL-70B

Baidu

Input tokens/M

Output tokens/M

Context Length

Grok Code Fast 1

Xai

$1.4

Input tokens/M

$10.5

Output tokens/M

256

Context Length

Doubao-Seed-1.6-vision

Bytedance

$0.8

Input tokens/M

Output tokens/M

256

Context Length

Hunyuan-T1-latest

Tencent

Input tokens/M

Output tokens/M

Context Length

Qwen3-30B-A3B-Instruct-2507

Alibaba

$0.75

Input tokens/M

Output tokens/M

256

Context Length

GPT-5 nano

Openai

$0.35

Input tokens/M

$2.8

Output tokens/M

400

Context Length

qwen3-coder-flash

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

Skim Mcp

Skim MCP Server是一个基于Skim项目的生产级Model Context Protocol服务器，专门用于代码智能压缩，帮助Claude Code等AI助手突破上下文长度限制，分析大型代码项目。

javascript

8.2k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

DeepSeek 迎来版本更新:上下文长度跃升至1M，万亿参数旗舰模型在路上

​谷歌 Gemini 3 Pro Preview模型上线 AI Studio 开发者可灵活调整参数

硅基流动上线 DeepSeek-V3.2-Exp，显著降低价格并支持更大上下文

Moondream3.0发布，多项基准测试超越了 GPT-5 等顶尖模型

AI Products

Kimi Latest

Llama-3-Giraffe-70B-Instruct

Llama-3 70B Gradient 524K Adapter

EasyContext

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash-Lite

qwen3-coder-plus

qwen3-vl-235b-a22b-thinking

qwen3-max

Qwen3-Next-80B-A3B-Instruct

Doubao-Seed-1.6

Doubao-Seed-1.6-flash

Qianfan-VL-70B

Grok Code Fast 1

Doubao-Seed-1.6-vision

Hunyuan-T1-latest

Qwen3-30B-A3B-Instruct-2507

GPT-5 nano

qwen3-coder-flash

GigaChat3 10B A1.8B GGUF

Qwen3 VL 8B Instruct 1M GGUF

Qwen3 VL 4B Instruct 1M GGUF

Qwen3 VL 30B A3B Instruct GGUF

Qwen3 VL 8B Thinking GGUF

Qwen3 VL 32B Instruct GGUF

GLM 4.6 AWQ 4bit

MiniMax M2 AWQ

Cogito 671b V2.1 FP8

Qwen3 Next 80B A3B Thinking 1M Qx64n Mlx

Qwen3 Next 80B A3B Instruct 1M Qx64n Mlx

Qwen3 VL 32B Instruct AWQ 4bit

Qwen3 Next 80B A3B Thinking GGUF

Qwen3 VL 2B Instruct

Qwen3 VL 32B Thinking

NanoAgent 135M

Spanish To English Translation Standard

Qwen3 VL 30B A3B Thinking AWQ

Apertus 8B Instruct 2509 GGUF

Qwen3 Yoyo V3 54B A3B Thinking TOTAL RECALL

MCP

Skim Mcp

谷歌 Gemini 3 Pro Preview模型上线 AI Studio 开发者可灵活调整参数