Best 多模态同步 AI Tools & Models - Premium 多模态同步 News

AI News

千问APP接入万相Wan2.5，视频能力全新升级

阿里千问APP接入万相2.5模型，视频创作能力升级，动作精度和肢体协调性提升，成为首个支持音视频同步输出的移动端AI助手。该模型具备音画同步能力，支持多模态输入输出，在LMArena评测中图生视频能力全球第三。

ChatGPT把语音搬进主界面：边说边看图，转录实时生成，还能一键“后悔”回到旧版

OpenAI将实时语音与视觉功能整合进ChatGPT主界面，用户按住麦克风图标即可边说话边查看地图、图表等视觉内容，文字转录同步显示。更新亮点包括多模态同屏交互（语音提问时实时展示相关图像并自动滚动文字），以及连续对话无中断（语音回复同时更新画面，延迟低于300毫秒），无需跳转页面。

10.5k 1 days ago

全球首个具身智能开放平台上线！3D数字人第一次“开箱即用”：魔珐星云把大模型塞进百元芯片

魔珐科技发布全球首个3D数字人开放平台“魔珐星云”，让AI从文字对话升级为实时生成带表情、手势和身体动作的3D数字人。其核心3D多模态引擎可输入文本后毫秒级输出同步语音与动作，并适配手机、车载等多种终端，实现AI从“说话”到“表演”的进化。

11.2k 12 minutes ago

全球首个具身智能开放平台上线！3D数字人第一次“开箱即用”：魔珐星云把大模型塞进百元芯片

Wan2.5-Preview 发布，实现多模态输入与电影级视频同步生成

Wan2.5-Preview正式发布，这款AI模型通过革命性架构重塑视觉生成。其核心突破在于多模态处理、视频生成和图像编辑，采用统一框架实现文本、图像、视频和音频的灵活输入输出。通过联合训练，模型强化模态对齐，提升生成能力。

13.1k 2 days ago

AI Products

Wan 2.5

Wan 2.5支持原生多模态AV生成，可10秒生成1080p视频，音画同步。

视频生成

6.2k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

千问APP接入万相Wan2.5，视频能力全新升级

ChatGPT把语音搬进主界面：边说边看图，转录实时生成，还能一键“后悔”回到旧版

全球首个具身智能开放平台上线！3D数字人第一次“开箱即用”：魔珐星云把大模型塞进百元芯片

Wan2.5-Preview 发布，实现多模态输入与电影级视频同步生成

AI Products

Wan 2.5

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-max

qwen3-vl-235b-a22b-thinking

wan2.5-i2i-preview

Qianfan-Lightning

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

ARC Qwen Video 7B

Wan2.1 HuMo GGUF

Wan2_1 HuMo_17B GGUF

Qwen2.5 Omni 3B