Best MoE架构 AI Tools & Models - Premium MoE架构 News

AI News

30B规格新标杆!智谱AI开源GLM-4.7-Flash，多项测试力压阿里OpenAI

智谱AI开源最新“混合思考”模型GLM-4.4-Flash，采用30B-A3B MoE架构，总参数量300亿，实际激活约30亿参数。该模型在保持轻量化部署优势的同时，凭借卓越推理与编码能力，登顶同类规格模型性能榜首，成为30B级别中的“全能王者”。

15.9k 9 hours ago

30B规格新标杆!智谱AI开源GLM-4.7-Flash，多项测试力压阿里OpenAI

中国电信开源国产千亿MoE大模型TeleChat3！全栈自研，15T tokens训练，支持“思考模式”对标国际顶尖

中国电信人工智能研究院开源星辰语义大模型TeleChat3系列，包括千亿参数MoE模型和稠密架构模型。该系列完全基于国产万卡算力池训练，数据规模达15万亿tokens，实现全栈国产化，标志着我国超大规模AI模型自主可控取得关键突破。

11.8k 1 hours ago

1美元跑200个浏览器任务！开源浏览器操控神器BU-30B-A3B-Preview横空出世

近日，开源项目BrowserUse发布自研大语言模型BU-30B-A3B-Preview，被誉为网页代理领域新标杆。该模型采用混合专家（MoE）架构，总参数达300亿，但推理时仅激活部分参数，兼顾强大性能与轻量化运行，显著降低了AI浏览器操作的成本与门槛。

11.7k 5 hours ago

小米发布新一代 MoE 大模型 MiMo-V2-Flash，助力 AGI 发展

小米新任大模型负责人罗福莉在2025小米生态大会上，正式发布全新MoE大模型MiMo-V2-Flash。该模型采用Hybrid SWA架构，设计简洁优雅，在长上下文推理方面表现突出，标志着小米向人工通用智能（AGI）目标迈出重要一步。

14k 12 hours ago

AI Products

XVERSE-MoE-A36B

多语言大型语言模型，支持多领域文本生成。

AI模型

10.4k

Models

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

Kimi-K2

Moonshot

Input tokens/M

$16

Output tokens/M

256

Context Length

Doubao-1.5-pro-32k

Bytedance

$0.8

Input tokens/M

Output tokens/M

128

Context Length

Grok Code Fast 1

Xai

$1.4

Input tokens/M

$10.5

Output tokens/M

256

Context Length

Hunyuan-T1-latest

Tencent

Input tokens/M

Output tokens/M

Context Length

DeepSeek-V3.1

Deepseek

Input tokens/M

$12

Output tokens/M

128

Context Length

gpt-oss-20b

Openai

$0.4

Input tokens/M

Output tokens/M

128

Context Length

Qwen3-30B-A3B-Instruct-2507

Alibaba

$0.75

Input tokens/M

Output tokens/M

256

Context Length

GPT-5

Openai

$8.75

Input tokens/M

$70

Output tokens/M

400

Context Length

Qwen3-235B-A22B-Instruct-2507

Alibaba

Input tokens/M

Output tokens/M

Context Length

GPT OSS 120B

Openai

$0.63

Input tokens/M

$3.15

Output tokens/M

131

Context Length

qwen3-coder-flash

Alibaba

Input tokens/M

Output tokens/M

Context Length

Hunyuan-Large-Vision

Tencent

Input tokens/M

Output tokens/M

Context Length

GLM-4.5-Flash

Chatglm

Input tokens/M

Output tokens/M

128

Context Length

GLM-4.5-X

Chatglm

Input tokens/M

$16

Output tokens/M

128

Context Length

GLM-4.5-AirX

Chatglm

Input tokens/M

Output tokens/M

128

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

30B规格新标杆!智谱AI开源GLM-4.7-Flash，多项测试力压阿里OpenAI

中国电信开源国产千亿MoE大模型TeleChat3！全栈自研，15T tokens训练，支持“思考模式”对标国际顶尖

1美元跑200个浏览器任务！开源浏览器操控神器BU-30B-A3B-Preview横空出世

小米发布新一代 MoE 大模型 MiMo-V2-Flash，助力 AGI 发展

AI Products

XVERSE-MoE-A36B

Models

Grok 4 Fast

qwen3-coder-plus

qwen3-vl-235b-a22b-thinking

Doubao-Seed-Translation

Qwen3-Next-80B-A3B-Instruct

Kimi-K2

Doubao-1.5-pro-32k

Grok Code Fast 1

Hunyuan-T1-latest

DeepSeek-V3.1

gpt-oss-20b

Qwen3-30B-A3B-Instruct-2507

GPT-5

Qwen3-235B-A22B-Instruct-2507

GPT OSS 120B

qwen3-coder-flash

Hunyuan-Large-Vision

GLM-4.5-Flash

GLM-4.5-X

GLM-4.5-AirX

GigaChat3 10B A1.8B GGUF

Wan2.2 I2V A14B Diffusers

GigaChat3 10B A1.8B Bf16

GigaChat3 10B A1.8B Base

Cerebras_MiniMax M2 REAP 139B A10B GGUF

Fyodor StarCoder2 7B Instruct Agentic

Moondream3 Preview Hf

Qwen3 VL 235B A22B Instruct GGUF

Qwen3 VL 30B A3B Instruct GGUF

Qwen3 VL 30B A3B Thinking GGUF

Qwen3 Next 80B A3B Thinking GGUF

Ling 1T GGUF

Ming Flash Omni Preview

LFM2 8B A1B 8bit MLX

Gpt Oss 120b Eagle3 V2

SFWan2.2 T2V A14B Diffusers

Granite 4.0 H Tiny 5bit MLX

Qwen3 Next 80B A3B Instruct AWQ 8bit

Megrez2 3x7B A3B GGUF

Qwen3 Next 80B A3B Thinking AWQ 4bit