最好的上下文窗口 AI工具模型_精選上下文窗口資訊

AI資訊

GPT-5.1“隱身”登場？OpenAI悄然上線Polaris Alpha，256K上下文+冷門知識引爆社區猜測

OpenAI在OpenRouter平臺匿名上線代號"Polaris Alpha"的大模型，疑似傳聞中的GPT-5.1。該模型具備256K上下文窗口，知識截止至2024年10月，性能表現引發開發者密集測試。在Gemini3、Claude4.5等競品壓力下，此舉被視爲OpenAI年底市場競爭的重要佈局。

12.5k 2 小時前

Google Gemini 3 Pro預覽版現身Vertex AI：支持百萬級上下文窗口

谷歌Gemini系列AI模型迎來新進展，預覽版"gemini-3-pro-preview-11-2025"在Vertex AI平臺被發現，預計本月正式推出。該模型支持100萬token超大上下文窗口，標識明確指向11月發佈。Vertex AI作爲谷歌雲端AI開發核心工具，已在網絡日誌中暴露相關信息。

19.2k 2 小時前

谷歌攜手印度信實Jio 推出Gemini Pro AI免費套餐助力數百萬用戶擁抱先進AI

谷歌與印度信實工業旗下Jio合作，在印度推出免費AI套餐。符合條件的Jio用戶可獲18個月Google AI Pro服務，價值約3萬元人民幣。套餐包含Gemini2.5Pro模型訪問權限，支持深度研究功能和百萬級令牌上下文窗口，旨在推動AI技術在印度普及應用。

8.7k 1 天前

谷歌攜手印度信實Jio 推出Gemini Pro AI免費套餐助力數百萬用戶擁抱先進AI

OpenAI重磅發佈GPT-5 Pro API，智能化未來一觸即發

OpenAI發佈GPT-5 Pro API，具備40萬Token上下文窗口，支持圖像輸入，可處理複雜長文本。定價爲每百萬Token15美元，推動AI應用普及。這是該公司迄今最強大的模型。

10.2k 昨天

AI產品

LongRoPE

將LLM上下文窗口擴展至200萬令牌的技術

上下文擴展

9.7k

LLM Context Extender

擴展LLM上下文窗口

AI模型

5.4k

LLM Maybe LongLM

擴展大語言模型的上下文窗口

AI模型

4.9k

Baichuan2-192K

全球最長上下文窗口大模型

AI模型

11.9k

模型

Gemini 2.5 Pro Preview (Mar' 25)

google

輸入tokens/百萬

$72

輸出tokens/百萬

上下文長度

Gemini 2.5 Pro Preview (May' 25)

google

輸入tokens/百萬

$72

輸出tokens/百萬

上下文長度

Gemini 2.5 Flash Preview (Reasoning)

google

$2.16

輸入tokens/百萬

$18

輸出tokens/百萬

上下文長度

Qwen3 32B (Reasoning)

alibaba

$0.72

輸入tokens/百萬

$2.16

輸出tokens/百萬

128k

上下文長度

ERNIE-4.5-Turbo-128K

baidu

輸入tokens/百萬

$16

輸出tokens/百萬

128k

上下文長度

Llama 4 Maverick

Gemini 2.5 Flash Preview

google

$2.16

輸入tokens/百萬

$18

輸出tokens/百萬

上下文長度

Gemini 2.0 Flash (Feb '25)

google

$0.72

輸入tokens/百萬

$2.88

輸出tokens/百萬

上下文長度

ERNIE-X1-Turbo-32K

baidu

輸入tokens/百萬

輸出tokens/百萬

32k

上下文長度

Gemini 2.0 Flash (experimental)

google

$0.72

輸入tokens/百萬

$2.88

輸出tokens/百萬

上下文長度

Qwen3 32B

alibaba

$0.72

輸入tokens/百萬

$2.16

輸出tokens/百萬

128k

上下文長度

Llama 4 Scout

GPT-4.1 nano

openai

$0.72

輸入tokens/百萬

$2.88

輸出tokens/百萬

上下文長度

Baichuan4-Turbo

baichuan

輸入tokens/百萬

輸出tokens/百萬

192k

上下文長度

Mistral Large 2 (Nov '24)

mistral

$14.4

輸入tokens/百萬

$43.2

輸出tokens/百萬

128k

上下文長度

Grok Beta

xai

輸入tokens/百萬

輸出tokens/百萬

128k

上下文長度

Pixtral Large

mistral

$14.4

輸入tokens/百萬

$43.2

輸出tokens/百萬

128k

上下文長度

Mistral Large 2 (Jul '24)

mistral

$14.4

輸入tokens/百萬

$43.2

輸出tokens/百萬

128k

上下文長度

Qwen2.5 Coder Instruct 32B

alibaba

$0.65

輸入tokens/百萬

$0.65

輸出tokens/百萬

131.1k

上下文長度

GPT-4o mini

openai

$1.08

輸入tokens/百萬

$4.32

輸出tokens/百萬

128k

上下文長度

MCP

Mcp Analyst

MCP Analyst是一個MCP服務器，支持Claude分析本地的CSV或Parquet文件，適用於處理超出上下文窗口限制的大型數據集或需要優化成本的場景。

python

7.5k

2.5分

Alphavantage_mcp

Alpha Vantage MCP是一個提供股票和金融數據訪問的模型上下文協議服務器，整合了Alpha Vantage所有API端點功能，並通過優化端點組織減少上下文窗口使用。

typescript

6.3k

2.5分

Simple Memory Extension MCP Server

一個用於擴展AI代理上下文窗口/記憶的MCP服務器，支持存儲、檢索和管理記憶內容，包含語義搜索功能。

typescript

5.9k

2.5分

Deep Code Reasoning Mcp

一個結合Claude Code和Google Gemini AI的MCP服務器，通過多模型協作實現深度代碼分析，Claude擅長本地上下文操作和CLI工作流，Gemini則利用其超大上下文窗口進行分佈式系統調試和長軌跡分析。

typescript

6.3k

2.5分

Task Manager Mcp

一個與AI代碼編輯器集成的MCP服務器，通過Gemini 2.5的百萬token上下文窗口和任務管理功能，優化Cursor的代理能力。

typescript

8.6k

2.5分

Screeny

Screeny MCP Server是一個專為macOS設計的隱私優先截圖服務，允許AI代理安全捕獲預先批准的應用程序窗口截圖，為開發和調試任務提供視覺上下文。

python

6.5k

2.5分

Dap_mcp

dap-mcp是一個基於模型上下文協議（MCP）的調試適配器協議（DAP）實現，旨在優化和擴展大型語言模型的上下文窗口，以增強調試工作流程。

python

4.9k

2.5分

Gemini Context Mcp Server

基於Gemini的上下文管理與緩存MCP服務器，支持2M token大上下文窗口，提供會話管理和API緩存功能。

typescript

6.6k

2.5分

Mcp Summarization Functions

一個為AI工作流設計的智能文本摘要MCP服務器，提供命令輸出、文件內容和目錄結構的智能摘要功能，優化AI代理的上下文窗口管理。

typescript

7.3k

2.5分

66julienmartin_MCP Server Deepseek_R1

一個基於Node.js的Deepseek R1語言模型MCP服務器實現，支持8192令牌上下文窗口，提供穩定的Claude Desktop集成和模型參數配置。

typescript

5.9k

2.5分

Mcp Mongodb Novel Server

一個高性能的MCP服務器，為LLM與MongoDB之間提供高效的知識接口，支持小上下文窗口優化和多種領域數據模型。

rust

5.5k

2.5分

Simple Memory Extension

一個用於擴展AI代理上下文窗口/記憶的MCP服務器，支持存儲、檢索和管理記憶，包含語義搜索功能。

typescript

5.9k

2.5分

Mcp Summarization Functions

一個為AI代理提供智能文本摘要功能的MCP服務器，優化上下文窗口管理並提升AI工作效率

typescript

6.7k

2.5分

Debug Adapter Protocol (DAP)

dap-mcp是一個基於MCP協議的DAP會話管理工具，旨在優化和擴展大型語言模型的上下文窗口，提升調試工作流。

python

6.8k

2.5分

Cosa Sai

該項目實現了一個基於Gemini API的MCP服務器，提供對多種技術文檔的訪問能力。通過2M tokens的大上下文窗口，無需傳統RAG系統的分塊或檢索步驟，直接處理完整文檔。支持查詢文檔、檢查代碼規範、解決問題提示等功能，適用於Roo/Cline環境。

typescript

7.9k

2.5分

Claude Crew

Claude Crew是一個創建自主編碼代理的工具，專注於通過高效上下文窗口使用最大化成本效益，優先通過單元測試驗證操作，並提供項目優化的MCP和上下文信息。

typescript

6.1k

2.5分

Qwen Mcp Tool

Qwen MCP工具是一個基於模型上下文協議的服務器，可將Qwen CLI與AI助手集成，提供大上下文窗口分析、文件處理、沙箱執行和多模型支持等功能

typescript

4.7k

2.5分

Mcp Inception

一個基於TypeScript的MCP服務器，實現LLM查詢系統，支持任務委派和上下文窗口卸載。

typescript

7.6k

2.5分

Ogoldberg_gemini Context Mcp Server

一個基於Gemini的MCP服務器實現，提供強大的上下文管理和緩存功能，支持高達200萬token的上下文窗口，適用於多種AI客戶端集成。

typescript

5.4k

2.0分

Temp Notes Mcp Server

Temp Notes MCP Server是一個為AI代理設計的臨時信息存儲服務，支持跨對話和上下文存儲、檢索臨時筆記，幫助解決複雜任務中的上下文窗口限制問題。

智啟未來，您的人工智能解決方案智庫

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商務合作網站地圖

AI資訊

GPT-5.1“隱身”登場？OpenAI悄然上線Polaris Alpha，256K上下文+冷門知識引爆社區猜測

Google Gemini 3 Pro預覽版現身Vertex AI：支持百萬級上下文窗口

谷歌攜手印度信實Jio 推出Gemini Pro AI免費套餐 助力數百萬用戶擁抱先進AI

OpenAI重磅發佈GPT-5 Pro API，智能化未來一觸即發

AI產品

LongRoPE

LLM Context Extender

LLM Maybe LongLM

Baichuan2-192K

模型

Gemini 2.5 Pro Preview (Mar' 25)

Gemini 2.5 Pro Preview (May' 25)

Gemini 2.5 Flash Preview (Reasoning)

Qwen3 32B (Reasoning)

ERNIE-4.5-Turbo-128K

Llama 4 Maverick

Gemini 2.5 Flash Preview

Gemini 2.0 Flash (Feb '25)

ERNIE-X1-Turbo-32K

Gemini 2.0 Flash (experimental)

Qwen3 32B

Llama 4 Scout

GPT-4.1 nano

Baichuan4-Turbo

Mistral Large 2 (Nov '24)

Grok Beta

Pixtral Large

Mistral Large 2 (Jul '24)

Qwen2.5 Coder Instruct 32B

GPT-4o mini

Aquif 3.5 Max 42B A3B GGUF

Aquif 3.5 Max 42B A3B GGUF

Kimi K2 Thinking

GLM 4.6

GLM 4.6 FP8

Gemma 3 270m It GGUF

Gemma 3 270m It Bnb 4bit

Gemma 3 270m It Unsloth Bnb 4bit

Gemma 3 270m

Gemma 3 270m It

Qwen3 4b Code Reasoning F32 GGUF

SnowflakeCore G1 Tiny2

Devstral Small 2507 Bnb 4bit

Devstral Small 2505 GGUF

Qwen3 4B Llamafile

Fathom R1 14B

Qwen3 30B A6B 16 Extreme 128k Context

AuriStream1B_40Pred_librilight_500k

Mellum 4b Sft Python

Granite 4.0 Tiny Base Preview

MCP

Mcp Analyst

Alphavantage_mcp

Simple Memory Extension MCP Server

Deep Code Reasoning Mcp

Task Manager Mcp

Screeny

Dap_mcp

Gemini Context Mcp Server

Mcp Summarization Functions

66julienmartin_MCP Server Deepseek_R1

Mcp Mongodb Novel Server

Simple Memory Extension

Mcp Summarization Functions

Debug Adapter Protocol (DAP)

Cosa Sai

Claude Crew

Qwen Mcp Tool

Mcp Inception

Ogoldberg_gemini Context Mcp Server

Temp Notes Mcp Server

谷歌攜手印度信實Jio 推出Gemini Pro AI免費套餐助力數百萬用戶擁抱先進AI