Best 长上下文处理 AI Tools & Models - Premium 长上下文处理 News

AI News

月之暗面推Kimi Linear模型：处理长上下文速度提高了2.9倍

月之暗面团队推出Kimi Linear模型，在AIGC领域实现技术突破。该模型采用混合线性注意力架构，处理长上下文速度提升2.9倍，解码速度提高6倍，性能超越传统Softmax注意力机制，特别在上下文处理和强化学习等场景表现优异。

13k 46 minutes ago

Moonshot AI发布 Kimi Linear:线性注意力架构快6倍，开源 KDA 内核同步上线

国产团队Moonshot AI发布Kimi Linear架构技术报告，提出可替代完全注意力机制的混合线性架构。该架构在速度、内存效率和长上下文处理三方面实现突破，显著降低KV缓存使用，兼具高效与性能优势，被誉为智能体时代注意力机制新起点。

9.7k 1 hours ago

Moonshot AI发布 Kimi Linear:线性注意力架构快6倍，开源 KDA 内核同步上线

蚂蚁百灵大模型团队开源Ring-flash-linear-2.0-128K，混合注意力+MoE架构重塑长文本编程效率

蚂蚁集团开源百灵大模型Ring-flash-linear-2.0-128K，专攻超长文本编程。采用混合线性注意力与稀疏MoE架构，仅激活6.1B参数即可媲美40B密集模型，在代码生成和智能代理领域达到最优表现，高效解决长上下文处理痛点。

10.4k 13 hours ago

DeepSeek发布V3.2-exp模型，开创性稀疏注意力机制将API 成本降低一半

DeepSeek发布实验模型V3.2-exp，采用创新的“稀疏注意力”机制显著降低长上下文推理成本。该模型已在Hugging Face和GitHub同步上线，核心是通过“闪电索引器”和注意力机制优化处理效率。这一突破性技术有望推动AI在长文本处理领域的发展。

10.7k 1 hours ago

AI Products

VideoRAG

VideoRAG 是一个用于处理极长上下文视频的检索增强型生成框架。

视频编辑

10.4k

MiniMax-Text-01

MiniMax-Text-01是一个强大的语言模型，具有4560亿总参数，能够处理长达400万token的上下文。

AI模型

10.2k

MiniMax-01

强大的语言模型，拥有4560亿总参数，可处理长达400万token的上下文。

AI模型

9.7k

EXAONE-3.5-2.4B-Instruct-AWQ

LG AI Research开发的双语文本生成模型

AI模型

9.3k

Models

HunYuan-TurboS

tencent

$0.8

Input tokens/M

Output tokens/M

32k

Context Length

Baichuan4-Turbo

baichuan

Input tokens/M

Output tokens/M

192k

Context Length

Jamba 1.6 Large

ai21-labs

Input tokens/M

Output tokens/M

256k

Context Length

Jamba Instruct

ai21-labs

Input tokens/M

Output tokens/M

256k

Context Length

Jamba 1.5 Mini

ai21-labs

$1.44

Input tokens/M

$2.88

Output tokens/M

256k

Context Length

Jamba 1.7 Mini

ai21-labs

Input tokens/M

Output tokens/M

258k

Context Length

Jamba 1.6 Mini

ai21-labs

Input tokens/M

Output tokens/M

256k

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

月之暗面推Kimi Linear模型：处理长上下文速度提高了2.9倍

Moonshot AI发布 Kimi Linear:线性注意力架构快6倍，开源 KDA 内核同步上线

蚂蚁百灵大模型团队开源Ring-flash-linear-2.0-128K，混合注意力+MoE架构重塑长文本编程效率

DeepSeek发布V3.2-exp模型，开创性稀疏注意力机制将API 成本降低一半

AI Products

VideoRAG

MiniMax-Text-01

MiniMax-01

EXAONE-3.5-2.4B-Instruct-AWQ

Models

HunYuan-TurboS

Baichuan4-Turbo

Jamba 1.6 Large

Jamba Instruct

Jamba 1.5 Mini

Jamba 1.7 Mini

Jamba 1.6 Mini

Qwen3 VL 32B Thinking 1M GGUF

Qwen3 VL 8B Thinking GGUF

Qwen3 VL 4B Instruct GGUF

Kimi Linear 48B A3B Base

Kimi Linear 48B A3B Instruct

Qwen3 Next 80B A3B Instruct 1M Qx64n Mlx

OpenModel 1T A50B Instruct

Qwen3 VL 30B A3B Instruct AWQ

Qwen3vl 8B Thinking 4bit Mlx

Qwen3 VL 4B Instruct

AHN Mamba2 For Qwen 2.5 Instruct 7B

AHN Mamba2 For Qwen 2.5 Instruct 3B

Apertus 70B Instruct 2509 Unsloth Bnb 4bit

Apertus 8B Instruct 2509 GGUF

Qwen3 VL 30B A3B Instruct

Rapido Ner Entity Small

Ring Mini 2.0

Seed OSS 36B Instruct GGUF

Schematron 8B

Seed OSS 36B Instruct AWQ

AI News

月之暗面推Kimi Linear模型：处理长上下文速度提高了2.9倍

Moonshot AI发布 Kimi Linear:线性注意力架构快6倍，开源 KDA 内核同步上线

蚂蚁百灵大模型团队开源Ring-flash-linear-2.0-128K，混合注意力+MoE架构重塑长文本编程效率

DeepSeek发布V3.2-exp模型，开创性稀疏注意力机制 将API 成本降低一半

AI Products

VideoRAG

MiniMax-Text-01

MiniMax-01

EXAONE-3.5-2.4B-Instruct-AWQ

Models

HunYuan-TurboS

Baichuan4-Turbo

Jamba 1.6 Large

Jamba Instruct

Jamba 1.5 Mini

Jamba 1.7 Mini

Jamba 1.6 Mini

Qwen3 VL 32B Thinking 1M GGUF

Qwen3 VL 8B Thinking GGUF

Qwen3 VL 4B Instruct GGUF

Kimi Linear 48B A3B Base

Kimi Linear 48B A3B Instruct

Qwen3 Next 80B A3B Instruct 1M Qx64n Mlx

OpenModel 1T A50B Instruct

Qwen3 VL 30B A3B Instruct AWQ

Qwen3vl 8B Thinking 4bit Mlx

Qwen3 VL 4B Instruct

AHN Mamba2 For Qwen 2.5 Instruct 7B

AHN Mamba2 For Qwen 2.5 Instruct 3B

Apertus 70B Instruct 2509 Unsloth Bnb 4bit

Apertus 8B Instruct 2509 GGUF

Qwen3 VL 30B A3B Instruct

Rapido Ner Entity Small

Ring Mini 2.0

Seed OSS 36B Instruct GGUF

Schematron 8B

Seed OSS 36B Instruct AWQ

DeepSeek发布V3.2-exp模型，开创性稀疏注意力机制将API 成本降低一半