最好的混合AI模型 AI工具模型_精选混合AI模型资讯

AI资讯

全球首款全开源全模态物理AI大模型Cosmos3 发布，英伟达联手行业巨头成立宇宙联盟

英伟达发布全球首款全开源物理AI大模型Cosmos3，基于混合Transformer架构，融合视觉推理、世界生成与动作预测，将物理AI训练评估周期从数月缩短至数天，解决具身智能数据有限和仿真零散问题。

端侧大模型迎突破！Liquid AI 开源混合专家模型 LFM2.5

人工智能初创公司Liquid AI发布并开源了端侧大模型LFM2.5-8B-A1B，专为消费级硬件设计，优化工具调用和指令遵循能力。该模型采用稀疏混合专家架构，总参数量8.3B，但每个Token仅激活1.5B参数，在降低计算成本的同时提升推理性能，可流畅运行于手机和笔记本电脑上。

20.7k 1 小时前

清华联合腾讯混元斩获MLSys2026MoE推理挑战赛冠军，NPU推理提速4.1倍

清华大学存储实验室与腾讯混元AI Infra团队在MLSys2026 MoE模型推理优化挑战赛中获全球冠军。针对万亿参数混合专家（MoE）架构在异构NPU上的推理瓶颈，联合团队设计了全链路优化方案，包括E-Shard策略、PSUM三维张量批量读出及GEMV路径，显著提升性能。

11k 1 小时前

清华联合腾讯混元斩获MLSys2026MoE推理挑战赛冠军，NPU推理提速4.1倍

腾讯发布并开源全新 AI 大模型混元 Hy3 preview

腾讯发布并开源了全新AI大模型“混元Hy3 preview”，这是混元系列中最智能的模型，升级涵盖复杂推理、指令遵循、上下文学习、代码处理和智能体等领域。该模型采用快思考与慢思考结合的混合专家架构，拥有2950亿参数，旨在提升整体性能和智能化水平。

17.6k 昨天

AI产品

AI21-Jamba-Large-1.6

AI21 Jamba Large 1.6 是一款强大的混合 SSM-Transformer 架构基础模型，擅长长文本处理和高效推理。

模型训练与部署

10.7k

CuriosityXR

混合现实学习平台，通过AI和3D模型体验学习魔法。

学习教育

10.7k

模型

GPT-4.1 mini

Openai

$2.8

输入tokens/百万

$11.2

输出tokens/百万

上下文长度

Gemini 2.0 Flash-Lite

Google

$0.49

输入tokens/百万

$2.1

输出tokens/百万

上下文长度

Grok 4 Fast

Xai

$1.4

输入tokens/百万

$3.5

输出tokens/百万

上下文长度

o3-mini

Openai

$7.7

输入tokens/百万

$30.8

输出tokens/百万

200

上下文长度

GPT-5 Codex

Openai

输入tokens/百万

输出tokens/百万

上下文长度

Claude 3 Opus

Anthropic

$105

输入tokens/百万

$525

输出tokens/百万

200

上下文长度

Gemini 2.0 Flash

Google

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

Claude Haiku 4.5

Anthropic

输入tokens/百万

$35

输出tokens/百万

200

上下文长度

Gemini 2.5 Flash

Google

$2.1

输入tokens/百万

$17.5

输出tokens/百万

上下文长度

Claude Sonnet 4.5

Anthropic

$21

输入tokens/百万

$105

输出tokens/百万

200

上下文长度

Claude 3 Sonnet

Anthropic

$21

输入tokens/百万

$105

输出tokens/百万

200

上下文长度

Gemini 2.5 Flash-Lite

Google

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

qwen-image-plus

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

qwen3-coder-plus

Alibaba

输入tokens/百万

$16

输出tokens/百万

上下文长度

qwen3-vl-plus

Alibaba

输入tokens/百万

$10

输出tokens/百万

256

上下文长度

qwen3-vl-235b-a22b-thinking

Alibaba

输入tokens/百万

$20

输出tokens/百万

上下文长度

Qianfan-Lightning

Baidu

输入tokens/百万

输出tokens/百万

128

上下文长度

qwen3-max

Alibaba

输入tokens/百万

$24

输出tokens/百万

256

上下文长度

wan2.5-i2i-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

qwen-image-edit

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

MCP

Microsoft Edit Mcp

Edit-MCP是一个与微软Edit工具集成的模型上下文协议服务器，为AI系统提供高级文件编辑功能，采用混合架构结合直接文件操作和Edit集成。

rust

9.3k

2.5分

Edit Mcp

Edit-MCP是一个与Microsoft Edit工具集成的模型上下文协议服务器，为AI系统提供高级文件编辑功能，采用混合架构结合文件系统操作和Edit集成。

智启未来，您的人工智能解决方案智库

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商务合作网站地图

AI资讯

全球首款全开源全模态物理AI大模型Cosmos3 发布，英伟达联手行业巨头成立宇宙联盟

端侧大模型迎突破！Liquid AI 开源混合专家模型 LFM2.5

清华联合腾讯混元斩获MLSys2026MoE推理挑战赛冠军，NPU推理提速4.1倍

​腾讯发布并开源全新 AI 大模型混元 Hy3 preview

AI产品

AI21-Jamba-Large-1.6

CuriosityXR

模型

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

Qianfan-Lightning

qwen3-max

wan2.5-i2i-preview

qwen-image-edit

Qwen2.5 1.5B Instruct Transcript Analytics

GigaChat3 10B A1.8B GGUF

Kimi K2 Thinking

Gpt Oss 120b Eagle3 V2

LFM2 2.6B GGUF

LFM2 2.6B GGUF

NVIDIA Nemotron Nano 9B V2

LFM2 700M GGUF

LFM2 350M GGUF

LFM2 1.2B GGUF

LFM2 1.2B GGUF

LFM2 350M

LFM2 1.2B

LFM2 700M

LFM2 350M

Loggenix Moe 0.12B A0.08B E5 Lr5e4 B16 3060 V2 Finetuned

Deepseek Vl 1.3b Chat

Llama 4 Maverick 17B 128E Instruct FP8

Llama 4 Scout 17B 16E Instruct

Llama 4 Scout 17B 16E Instruct INT4

MCP

Microsoft Edit Mcp

Edit Mcp

腾讯发布并开源全新 AI 大模型混元 Hy3 preview