Best 多模态交互 AI Tools & Models - Premium 多模态交互 News

AI News

开发者注意！阿里云百炼平台API限流政策将迎来重要调整

阿里云宣布自2026年4月28日起，对大模型服务平台“百炼”的多模态交互开发套件实施限流，新建连接数统一调整为10 QPS。此举旨在优化资源调度，确保服务稳定性。

13.9k 6 minutes ago

阿里云优化百炼多模态开发套件 API 调用限流

阿里云调整百炼多模态交互开发套件默认API限流，2026年4月28日起生效。新限流设为每秒10次（QPS），以优化资源调度和服务稳定性。同时支持每分钟600通、每小时36000通新建会话，满足多数开发调试及日常业务需求。

12.7k 10 hours ago

阿里ATH事业群开放式世界模型“Happy Oyster”启动内测申请

阿里巴巴推出开放式世界模型Happy Oyster，支持多模态输入与音视频联合生成，专注于实时世界创建与交互，开启早期体验申请。

18.1k 54 minutes ago

研究人员推出LPM1.0模型:实现单图转实时交互式数字人视频

LPM1.0模型发布，能通过单张参考图实时生成人物说话、聆听及唱歌视频。其核心突破在于多模态处理，可同步整合文本、音频与图像，生成唇形精准同步、表情细腻且情绪过渡自然的动态画面。该模型支持接入ChatGPT等主流语音AI，将传统语音对话升级为具备视觉反馈的实时交互。

16k 2 hours ago

AI Products

TEN Agent

主流对话式 Voice Agent开源框架，让 AI 能听能说

个人助理

19.3k

ChatWise

一款支持多种语言模型的高性能AI聊天工具，提供本地隐私保护和多模态交互功能。

聊天机器人

17.7k

UI-TARS-7B-SFT

下一代原生GUI代理模型，能够无缝与图形用户界面交互。

自动化工作流

13.4k

Trae

Trae 是一款适应性 AI IDE，通过与开发者协作提升工作效率。

代码助手

194.4k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

MCP

DataBridge

Morphik MCP是一个多模态数据库交互协议服务器，支持文档管理、检索和文件系统操作

typescript

10.1k

2.5points

MCP Model Context Protocol Projects

基于MCP框架的多模态助手客户端，提供Python代码执行、实时天气查询等功能，包含Streamlit交互界面和SSE服务工具。

python

9.5k

2.0points

Toolchat

ToolChat是一个通过MCP服务器与大型语言模型(LLM)交互的工具，支持配置多工具服务器并调用特定功能，还能处理多模态输入如图片和文档。

python

7.3k

2.0points

MaxKB

MaxKB是一款开源的AI助手，专为企业设计，支持RAG流程、工作流引擎和多模态交互，适用于智能客服、知识库等场景。

python

28.3k

No rating available

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

开发者注意！阿里云百炼平台API限流政策将迎来重要调整

​阿里云优化百炼多模态开发套件 API 调用限流

阿里ATH事业群开放式世界模型“Happy Oyster”启动内测申请

研究人员推出LPM1.0模型:实现单图转实时交互式数字人视频

AI Products

TEN Agent

ChatWise

UI-TARS-7B-SFT

Trae

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

Qianfan-Lightning

wan2.5-i2i-preview

qwen3-max

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Qwen3 VL 4B Thinking Gguf

Qwen3 VL 4B Instruct 4bit GPTQ

JanusCoder 8B GGUF

Qwen3 VL 2B Thinking GGUF

Qwen3 VL 8B Thinking GGUF

Qwen3 VL 30B A3B Instruct GGUF

Qwen3 VL 4B Instruct GGUF

Fara 7B

Qwen_Qwen3 VL 2B Instruct GGUF

Qwen3 VL 2B Instruct GGUF

Huihui Qwen3 VL 30B A3B Instruct Abliterated GGUF

Qwen3 VL 2B Instruct

VideoChat R1_5 7B

VideoScore2 SFT No CoT

InternVL3_5 30B A3B HF

InternVL3_5 14B HF

InternVL3_5 4B HF

InternVL3_5 1B HF

Omnivinci

Ultravox V0_6 Gemma 3 27b

MCP

DataBridge

MCP Model Context Protocol Projects

Toolchat

MaxKB

阿里云优化百炼多模态开发套件 API 调用限流