Best 全模态模型 AI Tools & Models - Premium 全模态模型 News

AI News

火山引擎Seedance 2. 0 系列API正式上线，开放全球SOTA级视频生成能力

火山引擎推出Seedance 2.0系列API服务，作为全球领先的视频生成模型，面向企业和个人开放。该模型支持文字、图片、音频和视频混合输入，具备多模态内容参考与编辑能力，旨在通过高性能视频生成重塑行业工作流，探索新应用场景。

打破接口壁垒：MiniMax 开源面向 AI Agent 的命令行工具 MMX-CLI

MiniMax推出MMX-CLI命令行工具，专为AI Agent设计，简化全模态模型调用流程。该工具解决了接口适配繁琐、代码冗余等问题，使Agent能像原生应用一样轻松调度多种AI能力。用户可在主流开发环境中一键调用编程、视频生成等功能，无需额外编写MCP Server或适配复杂接口。

17.9k 26 minutes ago

打破接口壁垒：MiniMax 开源面向 AI Agent 的命令行工具 MMX-CLI

阿里匿名模型 HappyHorse 横扫全球榜单，视频生成进入“高分时代”

阿里巴巴秘密研发的多模态大模型HappyHorse在国际评测中登顶，以1332分刷新全球视频生成Elo纪录，带动其港股早盘上涨近3%。

19.7k 4 minutes ago

美团启动2026年LongCat大模型北斗实习计划，加码AGI人才布局

美团推出2026年“LongCat大模型北斗实习计划”，面向全球高校硕博生招募大模型领域实习生。该计划依托美团LongCat团队，聚焦AGI研发，覆盖基座模型算法、Infra架构、Agent应用及视觉生成等方向。团队强调技术落地真实场景，其开源模型矩阵已实现全模态覆盖，包括560B参数的混合专家模型LongCat-Flash-Chat等。

14.5k 14 minutes ago

AI Products

Atlas Cloud

全球首个全模态推理平台，统一API接入300+模型，OpenAI兼容

开发平台

9.7k

Step-R1-V-Mini

全新多模态推理模型，支持图文输入、文字输出，具备高精度图像感知与复杂推理能力。

AI模型

9.2k

R1-Omni

R1-Omni 是一个结合强化学习的全模态情绪识别模型，专注于提升多模态情绪识别的可解释性。

情感陪伴

14.3k

MNN 大模型 Android App

一款支持多模态功能的全功能大语言模型安卓应用。

AI模型

26.7k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

Rag Anything Mcp

RAG Anything MCP Server是一个提供全面检索增强生成(RAG)能力的模型上下文协议服务器，支持多模态文档处理与查询，具备端到端文档解析、批量处理、高级查询及持久化存储等功能。

python

9.5k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

火山引擎Seedance 2. 0 系列API正式上线，开放全球SOTA级视频生成能力

打破接口壁垒：MiniMax 开源面向 AI Agent 的命令行工具 MMX-CLI

阿里匿名模型 HappyHorse 横扫全球榜单，视频生成进入“高分时代”

美团启动2026年LongCat大模型北斗实习计划，加码AGI人才布局

AI Products

Atlas Cloud

Step-R1-V-Mini

R1-Omni

MNN 大模型 Android App

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

Qianfan-Lightning

wan2.5-i2i-preview

qwen3-max

qwen-image-edit

Uni MoE 2.0 Omni

Qwen3 VL 8B Thinking GGUF

Qwen3 VL 4B Instruct GGUF

Qwen3 VL 30B A3B Instruct GGUF

Qwen3 VL 2B Instruct

Qwen3 VL 8B Thinking AWQ 8bit

Ming Flash Omni Preview

Bee 8B RL

Omnivinci

OmniNeural 4B

Emova Qwen 2 5 3b

SkyReels V2 I2V 14B 720P

Emova Qwen 2 5 3b Hf

Emova Qwen 2 5 7b Hf

Vit_so400m_patch14_siglip_gap_448.pali_mix

AnyRewardModel

OmniAudio 2.6B

TITAN

Mini Omni2

Emu3 VisionTokenizer

MCP

Rag Anything Mcp