Best AI多模态交互 AI Tools & Models - Premium AI多模态交互 News

AI News

研究人员推出LPM1.0模型:实现单图转实时交互式数字人视频

LPM1.0模型发布，能通过单张参考图实时生成人物说话、聆听及唱歌视频。其核心突破在于多模态处理，可同步整合文本、音频与图像，生成唇形精准同步、表情细腻且情绪过渡自然的动态画面。该模型支持接入ChatGPT等主流语音AI，将传统语音对话升级为具备视觉反馈的实时交互。

13.7k 18 minutes ago

即梦AI发布协作型叙事工具“小章鱼”Octo，首推VibeCreate创作模式

即梦AI推出首个协作型叙事创作工具“小章鱼”Octo，引入VibeCreate（氛围创作）模式，旨在改变AI内容生成方式，从单向指令转向同屏共创的合伙人模式。目前该工具仅开放Web端内测，支持对话与多模态交互，标志着AI创作交互范式的重要演进。

59.2k 1 hours ago

谷歌Vids集成 Veo3.1模型，支持文字提示词指挥 AI 虚拟形象互动

谷歌升级企业视频应用Vids，集成Veo3.1模型，实现AI虚拟形象动态交互。用户通过文字指令即可控制形象与场景互动，并保持角色一致性。更新强化了多模态整合，提升视频创作效率。

12.6k 20 hours ago

谷歌全球上线Search Live:搭载Gemini3.1Flash Live实现摄像头实时AI搜索

谷歌在全球推出“Search Live”功能，用户可通过手机摄像头和语音与AI实时交互，实现多模态搜索。该功能由Gemini 3.1 Flash Live模型驱动，提升了对话的自然度和响应速度。

13.8k 15 hours ago

谷歌全球上线Search Live:搭载Gemini3.1Flash Live实现摄像头实时AI搜索

AI Products

ChatWise

一款支持多种语言模型的高性能AI聊天工具，提供本地隐私保护和多模态交互功能。

聊天机器人

18.7k

GPTS4O.SO

多模态AI平台，整合文本、图像和音频交互

AI模型

10.4k

MyCharacter.ai

MyCharacter.AI是一个基于AI协议构建的dApp，利用CharacterGPT V2多模态AI系统生成逼真、智能、交互式的AI角色，这些角色可在Polygon区块链上收藏。

AI角色生成

10.2k

怪兽交互全息舱

专业的AI数字人平台，定制数字人专属IP，创造无限商业价值

数字人

17k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

MCP

MaxKB

MaxKB是一款开源的AI助手，专为企业设计，支持RAG流程、工作流引擎和多模态交互，适用于智能客服、知识库等场景。

python

28.3k

No rating available

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

研究人员推出LPM1.0模型:实现单图转实时交互式数字人视频

即梦AI发布协作型叙事工具“小章鱼”Octo，首推VibeCreate创作模式

谷歌Vids集成 Veo3.1模型，支持文字提示词指挥 AI 虚拟形象互动

谷歌全球上线Search Live:搭载Gemini3.1Flash Live实现摄像头实时AI搜索

AI Products

ChatWise

GPTS4O.SO

MyCharacter.ai

怪兽交互全息舱

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

qwen3-max

wan2.5-i2i-preview

Qianfan-Lightning

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Qwen3 VL 2B Instruct GGUF

Llama 4 Scout 17B 16E Instruct INT4

Llama 4 Scout 17B 16E Instruct FP8

Llama 4 Scout 17B 16E Instruct Bnb 8bit

Llama 4 Scout 17B 16E Instruct

Llama 4 Maverick 17B 128E Instruct FP8

EchoLLaMA 1B

Magma 8B

Cephalo Idefics 2 Vision 10b Alpha

MCP

MaxKB