Best 全模态实时交互 AI Tools & Models - Premium 全模态实时交互 News

AI News

谷歌全球上线Search Live:搭载Gemini3.1Flash Live实现摄像头实时AI搜索

谷歌在全球推出“Search Live”功能，用户可通过手机摄像头和语音与AI实时交互，实现多模态搜索。该功能由Gemini 3.1 Flash Live模型驱动，提升了对话的自然度和响应速度。

13.8k 1 hours ago

谷歌全球上线Search Live:搭载Gemini3.1Flash Live实现摄像头实时AI搜索

爱诗科技发布全球首个通用实时世界模型 PixVerse R1，最高1080P 画质

PixVerse R1作为全球首个通用实时世界模型，通过Omni原生多模态模型等三大核心技术协同，实现了虚拟世界的实时交互体验。该模型在游戏、影视、直播等领域拓展了“人人可共创”的新可能，旨在“让虚拟世界活起来”。

14.9k 1 days ago

爱诗科技发布全球首个通用实时世界模型 PixVerse R1，最高1080P 画质

阿里通义推出Qwen3-Omni-Flash-2025-12-01

阿里通义Qwen团队发布新版Qwen3-Omni-Flash-2025-12-01，作为新一代全模态大模型，能高效处理文本、图像、音频和视频输入，实现实时流式响应，生成文本与自然语音输出。升级重点提升了音视频交互体验，增强了对音视频指令的理解和执行能力，优化了口语化场景中的表现。

14.6k 17 hours ago

阿里发布全模态大模型Qwen3-Omni-Flash：实时流式输出，支持 119 种语言交互

阿里巴巴发布新一代全模态大模型Qwen3-Omni-Flash-2025-12-01，支持文本、图像、音频和视频的无缝输入，并能实时流式同步生成高质量文本与自然语音，语音自然度接近真人。该模型采用实时流式架构，支持119种文本语言交互。

15.5k 2 days ago

阿里发布全模态大模型Qwen3-Omni-Flash：实时流式输出，支持 119 种语言交互

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

谷歌全球上线Search Live:搭载Gemini3.1Flash Live实现摄像头实时AI搜索

爱诗科技发布全球首个通用实时世界模型 PixVerse R1，最高1080P 画质

​阿里通义推出Qwen3-Omni-Flash-2025-12-01

阿里发布全模态大模型Qwen3-Omni-Flash：实时流式输出，支持 119 种语言交互

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

qwen3-max

Qianfan-Lightning

wan2.5-i2i-preview

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

阿里通义推出Qwen3-Omni-Flash-2025-12-01