Best 长文本大模型 AI Tools & Models - Premium 长文本大模型 News

AI News

内存焦虑终结者：谷歌发布 TurboQuant 让大模型瘦身六倍

谷歌推出TurboQuant技术，通过压缩KV缓存，有效解决大语言模型推理中的内存瓶颈问题，可在不降低精度的前提下大幅减少内存占用，提升处理长文本和复杂任务的效率。

20.2k 22 hours ago

工信部征求《人工智能模型上下文协议》等121项行业标准意见

工信部就121项行业标准计划公开征求意见，重点规范人工智能模型上下文协议的应用安全，旨在通过标准化解决大模型在多模态交互、长文本处理及跨平台调用中的协议兼容与数据安全问题，标志着我国AI底层协议标准化与安全监管体系建设迈出关键一步。

15.7k 2 days ago

马斯克点赞Kimi“注意力残差”研究，长文本大模型架构迎新突破

Kimi公司发布论文《Attention Residuals: Rethinking depth-wise aggregation》，提出注意力残差新方法，优化深度聚合机制。特斯拉CEO马斯克在社交媒体点赞，称其为“亮眼工作”。Kimi官方幽默回应，引发全球AI社区热议。

16.6k yesterday

告别“大内存”时代！Sakana AI推出超轻量插件，让大模型秒速内化海量文档

Sakana AI推出T2L和D2L技术，利用“超网络”架构，使大模型无需重新训练即可在秒级内处理超长文档或学习新任务，有望解决大模型处理长文本时的“内存焦虑”问题。

11.3k 3 hours ago

AI Products

Gemini 2.0 Flash-Lite

Gemini 2.0 Flash-Lite 是高效的语言模型，专为长文本处理和多种应用场景优化。

AI模型

9.7k

MoBA

MoBA 是一种用于长文本上下文的混合块注意力机制，旨在提升大语言模型的效率。

模型训练与部署

10.4k

OLMo-2-1124-13B-Instruct

一款经过优化的大型语言模型，擅长文本生成和对话。

聊天机器人

8.8k

Qwen2.5-Turbo

高效处理长文本的先进语言模型

高性能

11.4k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

内存焦虑终结者：谷歌发布 TurboQuant 让大模型瘦身六倍

工信部征求《人工智能模型上下文协议》等121项行业标准意见

马斯克点赞Kimi“注意力残差”研究，长文本大模型架构迎新突破

​告别“大内存”时代！Sakana AI推出超轻量插件，让大模型秒速内化海量文档

AI Products

Gemini 2.0 Flash-Lite

MoBA

OLMo-2-1124-13B-Instruct

Qwen2.5-Turbo

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-max

Qianfan-Lightning

qwen3-vl-235b-a22b-thinking

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Qwen3 VLTO TNG 12B 256k NEO Imatrix GGUF

Qwen3 VL 30B A3B Thinking GGUF

Qwen3 Next 80B A3B Thinking 1M Qx64n Mlx

Qwen3 VL 2B Instruct FP8

Qwen3 VL 32B Instruct FP8

Qwen3 VL 32B Thinking FP8

Llama Nemotron Embed 1b V2

Qwen3 VL 8B Thinking AWQ 4bit

Qwen3 VL 30B A3B Thinking FP8

Qwen3 VL 30B A3B Instruct FP8

Qwen3 VL 235B A22B Thinking FP8

Qwen3 VL 235B A22B Instruct FP8

Qwen3 VL 235B A22B Instruct

Gemma SEA LION V4 27B IT

THU KEG_LongWriter Zero 32B GGUF

Mistral Small 3.2 24B Instruct 2506 GGUF

Kanana 1.5 2.1b Instruct 2505

Qwen2.5 VL 72B Instruct GGUF

Qwen2.5 7B Instruct

Qwen3 4B INT8

告别“大内存”时代！Sakana AI推出超轻量插件，让大模型秒速内化海量文档