Best 视频理解 AI Tools & Models - Premium 视频理解 News

AI News

豆包上线 Seedance 1.5 Pro，可直接生成有声视频

字节跳动推出“Seedance1.5Pro”音视频创作模型，现已上线豆包平台。该模型实现“文字-画面-声音”一体化生成，能深度理解文本意图，同步创作匹配的画面、音效与人物台词，有效避免音画脱节，并提升人物“开口说话”的自然度，让普通用户也能轻松制作有声视频。

18.7k 12 hours ago

Meta 官宣2026上半年发布 Mango 系列下一代模型

Meta计划于2026年上半年发起AI全面反攻，由首席AI官Alexandr Wang领导，将推出多款下一代智能模型。核心包括统一图像与视频生成理解的多模态模型Mango，以及下一代大型语言模型Av。

9.8k 10 hours ago

豆包大模型日均使用量破 50 万亿，火山引擎发布两大新品引领AI原生架构升级

12月18日，火山引擎在FORCE原动力大会上宣布，豆包大模型日均Tokens使用量已突破50万亿，位居中国第一、全球第三。同时，公司正式发布了豆包大模型1.8与视频生成模型Seedance1.5pro。豆包1.8在多模态Agent场景中深度优化，视觉理解能力显著提升，支持超长视频分析，并在工具调用和复杂指令遵循方面达到全球领先水平。

11.4k 21 hours ago

智谱多模态开源周圆满落幕：四项视频生成核心技术全面开放

智谱团队开源四项视频生成核心技术，包括GLM-4.6V视觉理解、AutoGLM设备控制、GLM-ASR语音识别和GLM-TTS语音合成模型，展示其在多模态领域的最新进展，为视频生成技术发展奠定基础。

12.5k 7 hours ago

AI Products

万兴天幕

一款强大的音视频多媒体素材生成与理解能力的 AI 工具。

视频生成

6.5k

Memories.ai

利用先进的AI算法解锁大规模视频洞见的Memories.ai。

视频编辑

8.2k

TwelveLabs

TwelveLabs是被领先研究人员认可为视频理解中性能最出色的人工智能，超越了云计算巨头和开源模型的基准。

视频编辑

CameraBench

用于理解任意视频中的相机运动的工具。

研究工具

9.4k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

wan2.5-t2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-t2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-i2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

Cloudglue Mcp Server

CloudGlue MCP服务是一个连接AI助手与视频数据的桥梁，通过结构化处理视频内容，使其能被大型语言模型理解和使用。

typescript

9.7k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

豆包上线 Seedance 1.5 Pro，可直接生成有声视频

Meta 官宣2026上半年发布 Mango 系列下一代模型

​豆包大模型日均使用量破 50 万亿，火山引擎发布两大新品引领AI原生架构升级

​智谱多模态开源周圆满落幕：四项视频生成核心技术全面开放

AI Products

万兴天幕

Memories.ai

TwelveLabs

CameraBench

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Doubao-Seed-Translation

Qwen3-Next-80B-A3B-Instruct

wan2.5-t2i-preview

wan2.5-t2v-preview

wan2.5-i2v-preview

VideoMAE_kinetics_wlasl_100__signer_20ep_coR

Timesformer_wlasl100_200epoch_Signers

VideoMAE_base_wlasl100_200epoch_Signers

VideoMAE_base_wlasl100_20epoch_Signers

VideoMAE_kinetics_wlasl2000_20epoch_signer

VideoMAE_kinetics__wlasl_2000_20epoch

VideoMAE_base__wlasl_100_20epoch

Qwen3 VL 4B Instruct

Qwen3 VL 30B A3B Instruct 1M GGUF

Qwen3 VL 32B Thinking 1M GGUF

Qwen3 VL 8B Thinking 1M GGUF

Qwen3 VL 32B Instruct 1M GGUF

Qwen3 VL 8B Instruct 1M GGUF

Qwen3 VL 4B Thinking 1M GGUF

Qwen3 VL 4B Instruct 1M GGUF

Qwen3 VL 2B Thinking 1M GGUF

Qwen3 VL 30B A3B Thinking GGUF

Qwen3 VL 235B A22B Instruct GGUF

Qwen3 VL 30B A3B Instruct GGUF

Qwen3 VL 32B Thinking GGUF

MCP

Cloudglue Mcp Server

豆包大模型日均使用量破 50 万亿，火山引擎发布两大新品引领AI原生架构升级

智谱多模态开源周圆满落幕：四项视频生成核心技术全面开放