Best 上下文窗口 AI Tools & Models - Premium 上下文窗口 News

AI News

Meta发布WhatsApp AI隐身模式，搭载最新Muse Spark模型实现隐私交互

Meta公司于2026年5月13日在WhatsApp及独立Meta AI应用中推出“隐身模式”，允许用户在隔离环境下与AI对话，解决隐私数据留存问题。开启后，对话记录不存储，关闭窗口或应用时自动终止会话并清除上下文信息。

告别终端分屏焦虑，Claude Code 推出 Agent View 统管后台 AI 任务

Anthropic 的 Claude Code 推出“Agent View”功能，作为研究预览版交互界面，允许开发者通过单一视图集中管理多个并行 AI 编程会话，解决此前依赖终端标签页导致的窗口管理与上下文切换难题，显著提升大规模并发任务的调度效率。

15.1k 4 hours ago

告别终端分屏焦虑，Claude Code 推出 Agent View 统管后台 AI 任务

DeepSeek V4将于4月下旬发布:万亿参数规模并深度适配国产芯片

DeepSeek创始人梁文锋近日透露，新一代旗舰大模型DeepSeek V4拟定于2026年4月下旬发布，标志着国产大模型在万亿级参数赛道迎来关键突破。近期网页端已上线“快速模式”与“专家模式”，通过差异化交互完成发布前实战预演。技术层面，V4预计将实现万亿级参数规模及百万级上下文窗口。

27k 21 hours ago

微软 Bing 团队开源 “Harrier” 多语言嵌入模型

微软Bing团队开源词嵌入模型Harrier，支持超100种语言，在MTEB v2基准测试中表现优异。模型基于20亿示例及GPT-5合成数据训练，采用32,000词元上下文窗口，具备27亿参数，显著提升多语言任务准确性与灵活性。

12.7k yesterday

AI Products

LongRoPE

将LLM上下文窗口扩展至200万令牌的技术

上下文扩展

9.8k

LLM Context Extender

扩展LLM上下文窗口

AI模型

7.7k

LLM Maybe LongLM

扩展大语言模型的上下文窗口

AI模型

7.2k

Baichuan2-192K

全球最长上下文窗口大模型

AI模型

15.2k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

Doubao-Seed-1.6

Bytedance

$0.8

Input tokens/M

Output tokens/M

256

Context Length

Doubao-Seed-1.6-flash

Bytedance

$0.15

Input tokens/M

$1.5

Output tokens/M

256

Context Length

Qianfan-VL-70B

Baidu

Input tokens/M

Output tokens/M

Context Length

Grok Code Fast 1

Xai

$1.4

Input tokens/M

$10.5

Output tokens/M

256

Context Length

Hunyuan-T1-latest

Tencent

Input tokens/M

Output tokens/M

Context Length

Doubao-Seed-1.6-vision

Bytedance

$0.8

Input tokens/M

Output tokens/M

256

Context Length

Qwen3-30B-A3B-Instruct-2507

Alibaba

$0.75

Input tokens/M

Output tokens/M

256

Context Length

GPT-5 nano

Openai

$0.35

Input tokens/M

$2.8

Output tokens/M

400

Context Length

qwen3-coder-flash

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

Deep Code Reasoning Mcp

一个结合Claude Code和Google Gemini AI的MCP服务器，通过多模型协作实现深度代码分析，Claude擅长本地上下文操作和CLI工作流，Gemini则利用其超大上下文窗口进行分布式系统调试和长轨迹分析。

typescript

10.7k

2.5points

Qwen Mcp Tool

Qwen MCP工具是一个基于模型上下文协议的服务器，可将Qwen CLI与AI助手集成，提供大上下文窗口分析、文件处理、沙箱执行和多模型支持等功能

typescript

13.6k

2.5points

Deobfuscate Mcp Server

一个专为大型语言模型优化的MCP服务器，用于反混淆、解包和导航经过压缩与打包的JavaScript代码，帮助LLM理解复杂代码结构并节省上下文窗口。

typescript

7.1k

2.5points

Aidex

AiDex是一个MCP服务器，为AI编程助手提供对整个代码库的即时访问，通过持久化预构建索引实现快速精准的代码搜索，支持11种编程语言，包含28种工具，可大幅减少AI上下文窗口的浪费。

typescript

7.9k

2.5points

Mcp Inception

一个基于TypeScript的MCP服务器，实现LLM查询系统，支持任务委派和上下文窗口卸载。

typescript

10.6k

2.5points

Mcp Lens

MCP代理工具，通过单一查询接口智能调用多个上游MCP服务，节省上下文窗口资源

5.2k

2.5points

Task Manager Mcp

一个与AI代码编辑器集成的MCP服务器，通过Gemini 2.5的百万token上下文窗口和任务管理功能，优化Cursor的代理能力。

typescript

30.3k

2.5points

Simple Memory Extension

一个用于扩展AI代理上下文窗口/记忆的MCP服务器，支持存储、检索和管理记忆，包含语义搜索功能。

typescript

9.2k

2.5points

Mcp Mongodb Novel Server

一个高性能的MCP服务器，为LLM与MongoDB之间提供高效的知识接口，支持小上下文窗口优化和多种领域数据模型。

rust

10k

2.5points

Gemini Context Mcp Server

基于Gemini的上下文管理与缓存MCP服务器，支持2M token大上下文窗口，提供会话管理和API缓存功能。

typescript

10.6k

2.5points

Mcp Analyst

MCP Analyst是一个MCP服务器，支持Claude分析本地的CSV或Parquet文件，适用于处理超出上下文窗口限制的大型数据集或需要优化成本的场景。

python

9.8k

2.5points

Mcp Summarization Functions

一个为AI工作流设计的智能文本摘要MCP服务器，提供命令输出、文件内容和目录结构的智能摘要功能，优化AI代理的上下文窗口管理。

typescript

9.4k

2.5points

Screeny

Screeny MCP Server是一个专为macOS设计的隐私优先截图服务，允许AI代理安全捕获预先批准的应用程序窗口截图，为开发和调试任务提供视觉上下文。

python

10.3k

2.5points

Dap_mcp

dap-mcp是一个基于模型上下文协议（MCP）的调试适配器协议（DAP）实现，旨在优化和扩展大型语言模型的上下文窗口，以增强调试工作流程。

python

8.8k

2.5points

Alphavantage_mcp

Alpha Vantage MCP是一个提供股票和金融数据访问的模型上下文协议服务器，整合了Alpha Vantage所有API端点功能，并通过优化端点组织减少上下文窗口使用。

typescript

10.2k

2.5points

Debug Adapter Protocol (DAP)

dap-mcp是一个基于MCP协议的DAP会话管理工具，旨在优化和扩展大型语言模型的上下文窗口，提升调试工作流。

python

11.4k

2.5points

Mcp Summarization Functions

一个为AI代理提供智能文本摘要功能的MCP服务器，优化上下文窗口管理并提升AI工作效率

typescript

12.3k

2.5points

Simple Memory Extension MCP Server

一个用于扩展AI代理上下文窗口/记忆的MCP服务器，支持存储、检索和管理记忆内容，包含语义搜索功能。

typescript

11.6k

2.5points

66julienmartin_MCP Server Deepseek_R1

一个基于Node.js的Deepseek R1语言模型MCP服务器实现，支持8192令牌上下文窗口，提供稳定的Claude Desktop集成和模型参数配置。

typescript

10.5k

2.5points

Token Optimizer Mcp

Token Optimizer MCP是一个智能令牌优化MCP服务器，通过智能缓存、压缩和工具替换，可将上下文窗口使用量减少60-90%，支持Claude Code和Claude Desktop等AI工具。

typescript

11.9k

2.5points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

Meta发布WhatsApp AI隐身模式，搭载最新Muse Spark模型实现隐私交互

告别终端分屏焦虑，Claude Code 推出 Agent View 统管后台 AI 任务

DeepSeek V4将于4月下旬发布:万亿参数规模并深度适配国产芯片

​微软 Bing 团队开源 “Harrier” 多语言嵌入模型

AI Products

LongRoPE

LLM Context Extender

LLM Maybe LongLM

Baichuan2-192K

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash-Lite

qwen3-coder-plus

qwen3-vl-235b-a22b-thinking

qwen3-max

Qwen3-Next-80B-A3B-Instruct

Doubao-Seed-1.6

Doubao-Seed-1.6-flash

Qianfan-VL-70B

Grok Code Fast 1

Hunyuan-T1-latest

Doubao-Seed-1.6-vision

Qwen3-30B-A3B-Instruct-2507

GPT-5 nano

qwen3-coder-flash

Gemma 3 12b It Qat Mlx Mxfp4

Aquif 3.5 Max 42B A3B GGUF

Aquif 3.5 Max 42B A3B GGUF

Kimi K2 Thinking

Gemma 3 27b It Qat Mlx Mxfp4

Kimi K2 Instruct 0905 MLX 4bit

Unsloth Magistral Small 2509 Mlx Mxfp4

GLM 4.6

GLM 4.6 FP8

Gemma 3 270m It GGUF

Gemma 3 270m It Bnb 4bit

Gemma 3 270m It Unsloth Bnb 4bit

Gemma 3 270m

Gemma 3 270m It

Qwen3 4b Code Reasoning F32 GGUF

SnowflakeCore G1 Tiny2

Devstral Small 2505 GGUF

Qwen3 4B Llamafile

Fathom R1 14B

Qwen3 30B A6B 16 Extreme 128k Context

MCP

Deep Code Reasoning Mcp

Qwen Mcp Tool

Deobfuscate Mcp Server

Aidex

Mcp Inception

Mcp Lens

Task Manager Mcp

Simple Memory Extension

Mcp Mongodb Novel Server

Gemini Context Mcp Server

Mcp Analyst

Mcp Summarization Functions

Screeny

Dap_mcp

Alphavantage_mcp

Debug Adapter Protocol (DAP)

Mcp Summarization Functions

Simple Memory Extension MCP Server

66julienmartin_MCP Server Deepseek_R1

Token Optimizer Mcp

微软 Bing 团队开源 “Harrier” 多语言嵌入模型