Best 小语言模型 AI Tools & Models - Premium 小语言模型 News

AI News

10B 级“小核弹”:阶跃星辰开源 Step3-VL-10B，性能跨级挑战200B 大模型

阶跃星辰开源多模态视觉语言模型Step3-VL-10B，仅10B参数却在多项基准测试中表现卓越，解决了小模型智能水平不足的痛点。该模型在视觉感知、逻辑推理和数学竞赛等维度达到同规模最优，甚至超越规模大10至20倍的开源及闭源旗舰模型。

Liquid AI 发布 LFM2.5：一款面向边缘设备的小型 AI 模型家族

Liquid AI推出新一代小型基础模型LFM2.5，专为边缘设备和本地部署设计。该系列包括基础版和指令版，并扩展了日语、视觉语言及音频语言变种。模型基于LFM2混合架构，针对CPU和NPU优化，实现快速高效推理。开源权重已发布在Hugging Face平台。

17.2k 8 hours ago

英伟达推出新 AI 框架，8亿参数模型助力工具智能管理

英伟达与香港大学联合发布Orchestrator模型，拥有8亿参数，能协调多种工具和大型语言模型解决复杂问题。该模型在工具使用基准测试中，以更低成本实现更高准确性，并能根据用户偏好智能选择工具。其训练采用名为ToolOrchestra的新强化学习框架，旨在提升小型模型的协调能力。

19k 15 hours ago

我国首个无障碍 AI 伴读系统星光 AI 伴读 “小星”，助力盲童阅读

我国首个盲童无障碍AI伴读系统“小星”正式上线，由中国盲文出版社与科技公司联合研发。该系统搭载大语言模型，支持盲童通过手机或电脑免费使用，可随时提问书籍内容、词义和情节，满足视障读者特殊阅读需求。

10.3k 3 hours ago

AI Products

Radal

Radal是一个无代码平台，可使用您自己的数据微调小型语言模型。连接数据集，通过可视化配置训练，并在几分钟内部署模型。

模型训练与部署

Xiaomi MiMo

小米首个推理大模型MiMo开源，专为推理任务设计，性能卓越。

AI模型

16.1k

ReaderLM v2

ReaderLM v2是一个用于HTML转Markdown和JSON的前沿小型语言模型。

开发与工具

10.3k

rStar-Math

展示小型语言模型通过自我演化深度思考掌握数学推理能力的研究成果。

模型训练与部署

10.2k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

10B 级“小核弹”:阶跃星辰开源 Step3-VL-10B，性能跨级挑战200B 大模型

Liquid AI 发布 LFM2.5：一款面向边缘设备的小型 AI 模型家族

英伟达推出新 AI 框架，8亿参数模型助力工具智能管理

我国首个无障碍 AI 伴读系统星光 AI 伴读 “小星”，助力盲童阅读

AI Products

Radal

Xiaomi MiMo

ReaderLM v2

rStar-Math

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-coder-plus

qwen3-vl-plus

Qianfan-Lightning

qwen3-vl-235b-a22b-thinking

qwen3-max

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Doubao-Seed-Translation

Pikachu

Hugston Microsoft Fara 7B

Zenyx_114M Tiny Edu Instruct

Qsana Coder Base

Charlotte AMITY

Prima 24B Q4_K_M GGUF

Qwen3 42B A3B YOYO V5 TOTAL RECALL NEO Imatrix GGUF

Melta27

Lam 3

Lam 3

Fara 7B

Granite 4.0 H 1b 8bit

LAM 2

LAM 1

Nemotron Flash 3B Instruct

UserLM 8b Q8_0 GGUF

Granite 4.0 H Small FP8

Trlm 135m GGUF

QuestA Nemotron 1.5B

MiMo Audio 7B Instruct