Best 原生多模态 AI Tools & Models - Premium 原生多模态 News

AI News

谷歌发布原生 macOS 版 Gemini 应用，支持全局快捷唤起与多模态创作

谷歌推出Mac版原生Gemini应用，支持macOS15及以上系统，用户可通过快捷键随时调用AI助手，实现系统级集成，增强桌面AI助手竞争力。

打破接口壁垒：MiniMax 开源面向 AI Agent 的命令行工具 MMX-CLI

MiniMax推出MMX-CLI命令行工具，专为AI Agent设计，简化全模态模型调用流程。该工具解决了接口适配繁琐、代码冗余等问题，使Agent能像原生应用一样轻松调度多种AI能力。用户可在主流开发环境中一键调用编程、视频生成等功能，无需额外编写MCP Server或适配复杂接口。

17.9k 16 hours ago

打破接口壁垒：MiniMax 开源面向 AI Agent 的命令行工具 MMX-CLI

美团发布原生多模态 LongCat-Next：视觉语音实现底层统一

美团发布原生多模态大模型LongCat-Next，突破传统“语言基座+插件”架构，通过DiNA技术将图像、语音与文本统一转化为同源离散Token，实现AI原生“看”与“听”物理世界，完成多模态建模深度统一。

20k 16 hours ago

谷歌正式发布 Gemma4开源大模型:涵盖四种规格，31B 版本位列全球开源榜单第三

谷歌发布开源大模型Gemma4，通过“单位参数智能”提升，为开源模型辅助智能体工作流设定新标准。该系列包含2.3B、4.5B高效版及26B、31B高性能版，基于Gemini3技术栈，全系支持多模态输入，部分版本原生支持语音输入，实现端侧实时语音理解。

16.4k 54 minutes ago

谷歌正式发布 Gemma4开源大模型:涵盖四种规格，31B 版本位列全球开源榜单第三

AI Products

Seedance 2 API

字节跳动Seedance 2.0 API，支持多模态输入生成视频，有原生音频等功能。

视频生成

6.9k

Wan 2.5

Wan 2.5支持原生多模态AV生成，可10秒生成1080p视频，音画同步。

视频生成

8.7k

OmAgent.com

一个用于智能设备等的多模态原生代理框架。

智能体

10.1k

Aria-Base-64K

多模态原生Mixture-of-Experts模型

AI模型

10.1k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

谷歌发布原生 macOS 版 Gemini 应用，支持全局快捷唤起与多模态创作

打破接口壁垒：MiniMax 开源面向 AI Agent 的命令行工具 MMX-CLI

美团发布原生多模态 LongCat-Next：视觉语音实现底层统一

谷歌正式发布 Gemma4开源大模型:涵盖四种规格，31B 版本位列全球开源榜单第三

AI Products

Seedance 2 API

Wan 2.5

OmAgent.com

Aria-Base-64K

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-max

wan2.5-i2i-preview

Qianfan-Lightning

qwen3-vl-235b-a22b-thinking

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

HunyuanOCR

Emu3.5

Emu3.5 Image

LFM2 VL 3B

LLaVA OneVision 1.5 8B Instruct

OmniNeural 4B

MiMo VL 7B RL 2508

Intern S1 FP8

FuseLIP B CC12M MM

InternVL3 78B Instruct GGUF

InternVL3 2B Instruct GGUF

Llama 4 Maverick 17B 128E Instruct FP8

Llama 4 Scout 17B 16E Instruct

Llama Guard 4 12B

Llama 4 Scout 17B 16E Instruct INT4

Llama 4 Scout 17B 16E Instruct FP8

InternVL3 1B Pretrained

InternVL3 2B Instruct

InternVL3 1B Instruct

Debiased Llama 4 Scout 17B 16E Instruct