Best 多模态技术 AI Tools & Models - Premium 多模态技术 News

AI News

豆神教育与微软 Azure 携手打造 AI 短剧平台

在Microsoft AI Tour年度盛会上，豆神教育推出全新“豆神AI短剧平台”，基于多模态AI架构，融合文本理解、图像生成、视频生成及智能配音技术，涵盖剧本创作、分镜拆解到角色设定等功能，标志着AI在内容创作领域的重大突破。

9.4k just now

腾讯发布混元 3D 世界模型 2.0：无缝对接游戏工作流

腾讯开源混元3D世界模型2.0，支持文本、图片、视频等多模态输入，可自动生成、重建和模拟3D世界。模型支持Mesh、3DGS、点云等多种格式导出，能与游戏开发流程无缝对接，助力快速生成游戏地图与关卡原型，推动AI“造世界”技术发展。

17.4k 2 hours ago

AI日报：火山引擎Seedance2.0 API全面开放；阿里巴巴首款具身机器人曝光；Skywork AI发布实时视频生成系统Matrix-Game 3.0

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、火山引擎Seedance2.0系列API正式上线，开放全球SOTA级视频生成能力火山引擎Seedance2.0系列API服务的上线，为视频生成领域带来了全球SOTA级的能力，支持多种模态输入并提升了复杂场景下的可用率，同时建立了完善的合规体系，推动AI视频创作在多个领域的商业落地。该功能目前仅限于专业版用户，并且无法保存生成内容。

29.5k 1 hours ago

AI日报：火山引擎Seedance2.0 API全面开放；阿里巴巴首款具身机器人曝光；Skywork AI发布实时视频生成系统Matrix-Game 3.0

火山引擎Seedance 2.0全面开放API服务

火山引擎发布Seedance 2.0系列API服务，提供先进的视频生成技术，支持文本、图片、音频和视频四种输入方式，具备多模态内容创建与编辑能力，适用于复杂互动和动态场景。该服务旨在帮助企业及个人用户优化工作流程，探索创新应用，同时确保AI视频创作的合规性与安全性。

18.6k 1 hours ago

AI Products

Wan 2.6

使用Wan 2.6 AI将文本和图像转化为专业15秒视频，适配多平台。

视频生成

10.2k

MiniMax Agent

MiniMax Agent是一款智能AI伴侣，利用先进的多模态技术提供支持。

个人助理

13.3k

CreatiLayout

基于孪生多模态扩散变换器的创意布局到图像生成技术

AI设计工具

11.7k

Gemini Multimodal Live + WebRTC

一个集成了Gemini多模态直播和WebRTC技术的单文件应用

开发与工具

10.7k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

​豆神教育与微软 Azure 携手打造 AI 短剧平台

腾讯发布混元 3D 世界模型 2.0：无缝对接游戏工作流

AI日报：火山引擎Seedance2.0 API全面开放；阿里巴巴首款具身机器人曝光；Skywork AI发布实时视频生成系统Matrix-Game 3.0

​火山引擎Seedance 2.0全面开放API服务

AI Products

Wan 2.6

MiniMax Agent

CreatiLayout

Gemini Multimodal Live + WebRTC

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

Qianfan-Lightning

qwen3-max

wan2.5-i2i-preview

qwen-image-edit

Wan2.2 I2V A14B Diffusers

ERNIE 4.5 VL 28B A3B Thinking AWQ 8bit

Qwen3 VL 12B Thinking Brainstorm20x NEO MAX GGUF

Vae Lyra

NVIDIA Nemotron Nano 12B V2 VL NVFP4 QAD

Qwen_Qwen3 VL 30B A3B Instruct GGUF

Qwen3 Omni 30B A3B Thinking INT8FP16

Henri_rousseau_v1_dp_qwen

InternVL3_5 38B HF

InternVL3_5 4B HF

InternVL3_5 2B HF

Gemma 3 270m It GGUF

Gemma 3 270m

Gemma 3 270m It Qat GGUF

Gemma 3 270m It Qat

Gemma 3 270m It Bnb 4bit

Gemma 3 270m It GGUF

Gemma 3 270m It

Gemma 3 270m

Huihui InternVL3 2B Abliterated GGUF

豆神教育与微软 Azure 携手打造 AI 短剧平台

火山引擎Seedance 2.0全面开放API服务