Best 上下文窗口 AI Tools & Models - Premium 上下文窗口 News

AI News

GPT-5.1“隐身”登场？OpenAI悄然上线Polaris Alpha，256K上下文+冷门知识引爆社区猜测

OpenAI在OpenRouter平台匿名上线代号"Polaris Alpha"的大模型，疑似传闻中的GPT-5.1。该模型具备256K上下文窗口，知识截止至2024年10月，性能表现引发开发者密集测试。在Gemini3、Claude4.5等竞品压力下，此举被视为OpenAI年底市场竞争的重要布局。

13.5k 3 minutes ago

Google Gemini 3 Pro预览版现身Vertex AI：支持百万级上下文窗口

谷歌Gemini系列AI模型迎来新进展，预览版"gemini-3-pro-preview-11-2025"在Vertex AI平台被发现，预计本月正式推出。该模型支持100万token超大上下文窗口，标识明确指向11月发布。Vertex AI作为谷歌云端AI开发核心工具，已在网络日志中暴露相关信息。

19.3k 1 hours ago

谷歌携手印度信实Jio 推出Gemini Pro AI免费套餐助力数百万用户拥抱先进AI

谷歌与印度信实工业旗下Jio合作，在印度推出免费AI套餐。符合条件的Jio用户可获18个月Google AI Pro服务，价值约3万元人民币。套餐包含Gemini2.5Pro模型访问权限，支持深度研究功能和百万级令牌上下文窗口，旨在推动AI技术在印度普及应用。

8.7k 1 days ago

谷歌携手印度信实Jio 推出Gemini Pro AI免费套餐助力数百万用户拥抱先进AI

OpenAI重磅发布GPT-5 Pro API，智能化未来一触即发

OpenAI发布GPT-5 Pro API，具备40万Token上下文窗口，支持图像输入，可处理复杂长文本。定价为每百万Token15美元，推动AI应用普及。这是该公司迄今最强大的模型。

10.2k yesterday

AI Products

LongRoPE

将LLM上下文窗口扩展至200万令牌的技术

上下文扩展

10k

LLM Context Extender

扩展LLM上下文窗口

AI模型

5.6k

LLM Maybe LongLM

扩展大语言模型的上下文窗口

AI模型

5.2k

Baichuan2-192K

全球最长上下文窗口大模型

AI模型

12.7k

Models

Gemini 2.5 Pro Preview (Mar' 25)

google

Input tokens/M

$72

Output tokens/M

Context Length

Gemini 2.5 Pro Preview (May' 25)

google

Input tokens/M

$72

Output tokens/M

Context Length

Gemini 2.5 Flash Preview (Reasoning)

google

$2.16

Input tokens/M

$18

Output tokens/M

Context Length

Qwen3 32B (Reasoning)

alibaba

$0.72

Input tokens/M

$2.16

Output tokens/M

128k

Context Length

Claude 4 Opus

anthropic

$108

Input tokens/M

$540

Output tokens/M

200k

Context Length

Claude 4 Sonnet

anthropic

$21.6

Input tokens/M

$108

Output tokens/M

200k

Context Length

ERNIE-4.5-Turbo-128K

baidu

Input tokens/M

$16

Output tokens/M

128k

Context Length

Llama 4 Maverick

Mistral Medium 3

mistral

Input tokens/M

Output tokens/M

128k

Context Length

Gemini 2.5 Flash Preview

google

$2.16

Input tokens/M

$18

Output tokens/M

Context Length

Gemini 2.0 Flash (Feb '25)

google

$0.72

Input tokens/M

$2.88

Output tokens/M

Context Length

ERNIE-X1-Turbo-32K

baidu

Input tokens/M

Output tokens/M

32k

Context Length

Gemini 2.0 Flash (experimental)

google

$0.72

Input tokens/M

$2.88

Output tokens/M

Context Length

Qwen3 32B

alibaba

$0.72

Input tokens/M

$2.16

Output tokens/M

128k

Context Length

Llama 4 Scout

Mistral Small 3.2

mistral

$0.5

Input tokens/M

$1.01

Output tokens/M

128k

Context Length

GPT-4.1 nano

openai

$0.72

Input tokens/M

$2.88

Output tokens/M

Context Length

Mistral Large 2 (Nov '24)

mistral

$14.4

Input tokens/M

$43.2

Output tokens/M

128k

Context Length

Grok Beta

xai

Input tokens/M

Output tokens/M

128k

Context Length

Pixtral Large

mistral

$14.4

Input tokens/M

$43.2

Output tokens/M

128k

Context Length

MCP

Deep Code Reasoning Mcp

一个结合Claude Code和Google Gemini AI的MCP服务器，通过多模型协作实现深度代码分析，Claude擅长本地上下文操作和CLI工作流，Gemini则利用其超大上下文窗口进行分布式系统调试和长轨迹分析。

typescript

6.7k

2.5points

Qwen Mcp Tool

Qwen MCP工具是一个基于模型上下文协议的服务器，可将Qwen CLI与AI助手集成，提供大上下文窗口分析、文件处理、沙箱执行和多模型支持等功能

typescript

4.7k

2.5points

Mcp Inception

一个基于TypeScript的MCP服务器，实现LLM查询系统，支持任务委派和上下文窗口卸载。

typescript

9.8k

2.5points

Simple Memory Extension

一个用于扩展AI代理上下文窗口/记忆的MCP服务器，支持存储、检索和管理记忆，包含语义搜索功能。

typescript

7.3k

2.5points

Task Manager Mcp

一个与AI代码编辑器集成的MCP服务器，通过Gemini 2.5的百万token上下文窗口和任务管理功能，优化Cursor的代理能力。

typescript

29.1k

2.5points

Gemini Context Mcp Server

基于Gemini的上下文管理与缓存MCP服务器，支持2M token大上下文窗口，提供会话管理和API缓存功能。

typescript

8.5k

2.5points

Mcp Mongodb Novel Server

一个高性能的MCP服务器，为LLM与MongoDB之间提供高效的知识接口，支持小上下文窗口优化和多种领域数据模型。

rust

7.3k

2.5points

Screeny

Screeny MCP Server是一个专为macOS设计的隐私优先截图服务，允许AI代理安全捕获预先批准的应用程序窗口截图，为开发和调试任务提供视觉上下文。

python

7.7k

2.5points

Mcp Analyst

MCP Analyst是一个MCP服务器，支持Claude分析本地的CSV或Parquet文件，适用于处理超出上下文窗口限制的大型数据集或需要优化成本的场景。

python

8.2k

2.5points

Mcp Summarization Functions

一个为AI工作流设计的智能文本摘要MCP服务器，提供命令输出、文件内容和目录结构的智能摘要功能，优化AI代理的上下文窗口管理。

typescript

7.8k

2.5points

Dap_mcp

dap-mcp是一个基于模型上下文协议（MCP）的调试适配器协议（DAP）实现，旨在优化和扩展大型语言模型的上下文窗口，以增强调试工作流程。

python

5.4k

2.5points

Debug Adapter Protocol (DAP)

dap-mcp是一个基于MCP协议的DAP会话管理工具，旨在优化和扩展大型语言模型的上下文窗口，提升调试工作流。

python

8.2k

2.5points

Alphavantage_mcp

Alpha Vantage MCP是一个提供股票和金融数据访问的模型上下文协议服务器，整合了Alpha Vantage所有API端点功能，并通过优化端点组织减少上下文窗口使用。

typescript

7.6k

2.5points

Simple Memory Extension MCP Server

一个用于扩展AI代理上下文窗口/记忆的MCP服务器，支持存储、检索和管理记忆内容，包含语义搜索功能。

typescript

9.5k

2.5points

Mcp Summarization Functions

一个为AI代理提供智能文本摘要功能的MCP服务器，优化上下文窗口管理并提升AI工作效率

typescript

10k

2.5points

66julienmartin_MCP Server Deepseek_R1

一个基于Node.js的Deepseek R1语言模型MCP服务器实现，支持8192令牌上下文窗口，提供稳定的Claude Desktop集成和模型参数配置。

typescript

8.9k

2.5points

Cosa Sai

该项目实现了一个基于Gemini API的MCP服务器，提供对多种技术文档的访问能力。通过2M tokens的大上下文窗口，无需传统RAG系统的分块或检索步骤，直接处理完整文档。支持查询文档、检查代码规范、解决问题提示等功能，适用于Roo/Cline环境。

typescript

7.5k

2.5points

Claude Crew

Claude Crew是一个创建自主编码代理的工具，专注于通过高效上下文窗口使用最大化成本效益，优先通过单元测试验证操作，并提供项目优化的MCP和上下文信息。

typescript

6.6k

2.5points

Temp Notes Mcp Server

Temp Notes MCP Server是一个为AI代理设计的临时信息存储服务，支持跨对话和上下文存储、检索临时笔记，帮助解决复杂任务中的上下文窗口限制问题。

typescript

8.2k

2.0points

Ogoldberg_gemini Context Mcp Server

一个基于Gemini的MCP服务器实现，提供强大的上下文管理和缓存功能，支持高达200万token的上下文窗口，适用于多种AI客户端集成。

typescript

6.7k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

GPT-5.1“隐身”登场？OpenAI悄然上线Polaris Alpha，256K上下文+冷门知识引爆社区猜测

Google Gemini 3 Pro预览版现身Vertex AI：支持百万级上下文窗口

谷歌携手印度信实Jio 推出Gemini Pro AI免费套餐 助力数百万用户拥抱先进AI

OpenAI重磅发布GPT-5 Pro API，智能化未来一触即发

AI Products

LongRoPE

LLM Context Extender

LLM Maybe LongLM

Baichuan2-192K

Models

Gemini 2.5 Pro Preview (Mar' 25)

Gemini 2.5 Pro Preview (May' 25)

Gemini 2.5 Flash Preview (Reasoning)

Qwen3 32B (Reasoning)

Claude 4 Opus

Claude 4 Sonnet

ERNIE-4.5-Turbo-128K

Llama 4 Maverick

Mistral Medium 3

Gemini 2.5 Flash Preview

Gemini 2.0 Flash (Feb '25)

ERNIE-X1-Turbo-32K

Gemini 2.0 Flash (experimental)

Qwen3 32B

Llama 4 Scout

Mistral Small 3.2

GPT-4.1 nano

Mistral Large 2 (Nov '24)

Grok Beta

Pixtral Large

Aquif 3.5 Max 42B A3B GGUF

Aquif 3.5 Max 42B A3B GGUF

Kimi K2 Thinking

GLM 4.6

GLM 4.6 FP8

Gemma 3 270m It GGUF

Gemma 3 270m It Bnb 4bit

Gemma 3 270m It Unsloth Bnb 4bit

Gemma 3 270m

Gemma 3 270m It

Qwen3 4b Code Reasoning F32 GGUF

SnowflakeCore G1 Tiny2

Devstral Small 2505 GGUF

Qwen3 4B Llamafile

Fathom R1 14B

Qwen3 30B A6B 16 Extreme 128k Context

Mellum 4b Sft Python

Granite 4.0 Tiny Base Preview

Mellum 4b Base

Gemma 3 27b It Fp8 Dynamic

MCP

Deep Code Reasoning Mcp

Qwen Mcp Tool

Mcp Inception

Simple Memory Extension

Task Manager Mcp

Gemini Context Mcp Server

Mcp Mongodb Novel Server

Screeny

Mcp Analyst

Mcp Summarization Functions

Dap_mcp

Debug Adapter Protocol (DAP)

Alphavantage_mcp

Simple Memory Extension MCP Server

Mcp Summarization Functions

66julienmartin_MCP Server Deepseek_R1

Cosa Sai

Claude Crew

Temp Notes Mcp Server

Ogoldberg_gemini Context Mcp Server

谷歌携手印度信实Jio 推出Gemini Pro AI免费套餐助力数百万用户拥抱先进AI