Best 轻量化大模型 AI Tools & Models - Premium 轻量化大模型 News

AI News

谷歌 Gemma 4 全面开源：小型模型展现超强 AI 能力

谷歌发布Gemma4系列开源模型，实现AI能力轻量化突破。其中一款仅激活3.8亿参数，性能却超越参数规模20倍的大型模型，使强大AI可轻松部署于手机和轻薄笔记本。该系列包含2.3B和4.5B等不同参数规模的模型，推动人工智能服务更便捷普及。

12.1k 1 days ago

谷歌发布最亲民视频模型：Veo 3.1 Lite 开启“分分钱”生成时代

谷歌推出轻量化视频生成模型Veo3.1Lite，通过架构优化大幅降低算力成本，旨在推动高质量视频生成普及。该模型对标市场轻量化产品，以高性价比和低至每秒0.05美元的720P视频生成成本，满足不同开发者需求。

12.8k 16 hours ago

苹果引入知识提炼技术:将谷歌Gemini模型蒸馏至iPhone端侧运行

苹果利用知识蒸馏技术，将谷歌Gemini云端大模型转化为适用于iPhone的轻量化端侧组件。根据2026年3月消息，苹果与谷歌达成协议，允许其工程师深度访问并研究Gemini全量模型。此举增强了苹果在AI领域的自主性，使其能直接借鉴Gemini的高质量输出与推理过程。

14.3k 1 days ago

高效轻量化：IBM 发布 Granite 4.0 1B Speech 多模态语音大模型

IBM推出Granite4.01B Speech语音模型，专为边缘计算和企业部署设计。该模型参数量减半，但性能显著提升，支持多语种自动语音识别和双向翻译，新增日语识别和关键词偏置功能，并大幅提高英文转录准确率。

15.9k 3 days ago

高效轻量化：IBM 发布 Granite 4.0 1B Speech 多模态语音大模型

AI Products

SmolVLM2

SmolVLM2 是一个专注于视频内容分析和生成的轻量化语言模型。

视频编辑

13.7k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

谷歌 Gemma 4 全面开源：小型模型展现超强 AI 能力

谷歌发布最亲民视频模型：Veo 3.1 Lite 开启“分分钱”生成时代

苹果引入知识提炼技术:将谷歌Gemini模型蒸馏至iPhone端侧运行

高效轻量化：IBM 发布 Granite 4.0 1B Speech 多模态语音大模型

AI Products

SmolVLM2

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

qwen3-max

Qianfan-Lightning

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Doubao-Seed-Translation

MiniMax M2 4bit DWQ

Wanabi_mini_12b_GGUF

Huihui Ai.Qwen3 14B Abliterated GGUF

Alibaba Pai.DistilQwen2.5 DS3 0324 32B GGUF

Gliner_small V1

Mistral 3B Instruct V0.2 Init

Albert Xlarge V1

AI News

​谷歌 Gemma 4 全面开源：小型模型展现超强 AI 能力

谷歌发布最亲民视频模型：Veo 3.1 Lite 开启“分分钱”生成时代

苹果引入知识提炼技术:将谷歌Gemini模型蒸馏至iPhone端侧运行

​高效轻量化：IBM 发布 Granite 4.0 1B Speech 多模态语音大模型

AI Products

SmolVLM2

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

qwen3-max

Qianfan-Lightning

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Doubao-Seed-Translation

MiniMax M2 4bit DWQ

Wanabi_mini_12b_GGUF

Huihui Ai.Qwen3 14B Abliterated GGUF

Alibaba Pai.DistilQwen2.5 DS3 0324 32B GGUF

Gliner_small V1

Mistral 3B Instruct V0.2 Init

Albert Xlarge V1

谷歌 Gemma 4 全面开源：小型模型展现超强 AI 能力

高效轻量化：IBM 发布 Granite 4.0 1B Speech 多模态语音大模型