Best MoE模型 AI Tools & Models - Premium MoE模型 News

AI News

国产 GPU 也能跑万亿大模型：海光 DCU 适配 Kimi K3，896 专家并行不卡顿

海光DCU完成万亿参数大模型Kimi K3全栈适配与验证，标志着国产算力首次稳稳支撑此类超大模型。通过底层算子到推理引擎的深度优化，模型无需任何代码改动，迁移成本近乎零，开发者拿到算力即可部署。同时针对KDA注意力与896专家MoE架构实现从容兼容，打破海外旗舰芯片垄断，提供开箱即用的国产方案。

12.9k 1 hours ago

国产 GPU 也能跑万亿大模型：海光 DCU 适配 Kimi K3，896 专家并行不卡顿

Kimi K3 开源，2.8 万亿参数登顶全球最大开源模型，马斯克也来点了个赞

7月28日，月之暗面发布Kimi K3模型权重及技术报告，同步开源MoonEP、FlashKDA和AgentEnv三项关键基础设施技术。Kimi K3为目前最强模型，采用MoE架构，总参数达2.8万亿。这三项技术为大规模训练的效率、稳定性及智能体任务执行，提供了核心底层支撑。

10.9k 5 hours ago

Poolside 重磅开源！Laguna S 2.1 免费上线 OpenCode，1M 超长上下文 +118B MoE 模型引领代理编码新纪元

Poolside发布完全开源的Laguna S2.1大模型，118B总参数的MoE架构，每token激活8B，支持高达1M tokens上下文，适配长周期软件工程。在OpenCode平台免费开放，并引入thinking与no-thinking推理模式，引起开发者热议。

37.4k 4 hours ago

Poolside 重磅开源！Laguna S 2.1 免费上线 OpenCode，1M 超长上下文 +118B MoE 模型引领代理编码新纪元

喊出"再来两周"的用户赢了：腾讯混元Hy3 限免延长到 8 月 5 日，295B MoE模型白嫖期续命

腾讯混元大模型Hy3开源后原定两周限免，临近结束用户高呼“再来两周”，腾讯公关总监张军表示大量反馈促使延期，针对WorkBuddy和CodeBuddy的限免延长至8月5日，免费期变为近一个月。

35.2k 4 hours ago

喊出"再来两周"的用户赢了：腾讯混元Hy3 限免延长到 8 月 5 日，295B MoE模型白嫖期续命

AI Products

Qwen2.5-Max

Qwen2.5-Max是一个大规模的Mixture-of-Expert (MoE)模型，致力于提升模型智能。

AI模型

51.2k

Doubao-1.5-pro

Doubao-1.5-pro 是一个高性能的稀疏 MoE 大语言模型，专注于推理性能与模型能力的极致平衡。

AI模型

24.1k

RWKV-6 Mixture of Experts

RWKV家族中最大的模型，采用MoE技术提升效率。

AI模型

9.9k

Skywork-MoE-Base-FP8

146亿参数的高性能MoE模型

大规模模型

10.4k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

Mcp Stocks Info Server

MOEX股票与新闻MCP服务器是一个基于Model Context Protocol的接口服务，提供莫斯科交易所股票行情、金融新闻查询及分析功能，支持与大型语言模型集成。

13.3k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

国产 GPU 也能跑万亿大模型：海光 DCU 适配 Kimi K3，896 专家并行不卡顿

Kimi K3 开源，2.8 万亿参数登顶全球最大开源模型，马斯克也来点了个赞

Poolside 重磅开源！Laguna S 2.1 免费上线 OpenCode，1M 超长上下文 +118B MoE 模型引领代理编码新纪元

喊出"再来两周"的用户赢了：腾讯混元Hy3 限免延长到 8 月 5 日，295B MoE模型白嫖期续命

AI Products

Qwen2.5-Max

Doubao-1.5-pro

RWKV-6 Mixture of Experts

Skywork-MoE-Base-FP8

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

wan2.5-i2i-preview

Qianfan-Lightning

qwen3-max

qwen3-vl-235b-a22b-thinking

qwen-image-edit

GigaChat3 10B A1.8B GGUF

INTELLECT 3 FP8

Wan2.2 I2V A14B Diffusers

GigaChat3 10B A1.8B Bf16

GigaChat3 10B A1.8B Base

Cerebras_MiniMax M2 REAP 139B A10B GGUF

Moondream3 Preview Hf

Qwen3 VL 235B A22B Instruct GGUF

Qwen3 VL 30B A3B Instruct GGUF

Qwen3 VL 30B A3B Thinking GGUF

MiniMax M2 GGUF

MiniMax M2

Qwen3 Next 80B A3B Thinking GGUF

Ling 1T GGUF

Ming Flash Omni Preview

Deepseek Moe 16b Q4 K M Cpu Offload Gguf

Gpt Oss 120b Eagle3 V2

Gpt Oss 20b Moe Cpu Offload Gguf

GLM 4.6 AWQ

SFWan2.2 T2V A14B Diffusers

MCP

Mcp Stocks Info Server