Best 长视频分析 AI Tools & Models - Premium 长视频分析 News

AI News

苹果发布适配版SlowFast-LLaVA模型：长视频理解性能超越大规模模型

苹果发布SlowFast-LLaVA模型，在长视频分析任务中表现优异，超越更大参数模型。其双流架构通过慢流捕捉静态细节，快流处理动态信息，有效解决传统逐帧处理的信息冗余和上下文窗口溢出问题，为长视频内容分析提供高效解决方案。

Memories AI携全球首个人工智能视觉记忆模型亮相，获800万美元种子轮融资

Memories AI发布全球首个大型视觉记忆模型LVMM，获800万美元种子轮融资。该技术突破使AI能像人类一样长期存储和检索视觉信息，处理能力达百万小时级视频，比现有技术提升100倍。应用场景涵盖安防监控、社交媒体分析、自动驾驶等领域。由前Meta专家创立，核心技术模拟人类记忆机制，通过三层架构实现高效视频处理。融资将用于团队扩张和技术商业化，投资者看好其在机器人、企业软件等万亿美元市场的潜力。

10.9k 21 hours ago

Memories AI携全球首个人工智能视觉记忆模型亮相，获800万美元种子轮融资

AI视频记忆革命来了！Memories.ai获800万美元融资，挑战千万小时视频分析极限

Memories.ai获800万美元融资，突破长视频AI理解技术瓶颈。这家由Meta前员工创立的公司开发出能处理1000万小时视频的AI平台，通过去噪、压缩、索引和聚合四层架构，为安防和营销企业提供视频分析解决方案。其技术优势在于突破现有AI模型1-2小时的视频理解限制，实现跨时长上下文分析。投资者看好其在设备端计算和隐私保护方面的潜力。目前面临mem0等初创公司和TwelveLabs等行业巨头的竞争，但凭借横向扩展能力占据技术优势。该技术未来可应用于智能眼镜、人形机器人训练等领域。

9.4k 11 hours ago

AI视频记忆革命来了！Memories.ai获800万美元融资，挑战千万小时视频分析极限

谷歌再破界限：Gemini 2.5 Pro实现6小时视频理解，AI视觉能力迈入新纪元

谷歌Gemini2.5Pro视频理解能力再升级，这款旗舰AI模型不仅支持长达6小时的视频分析，还拥有高达200万Token的超大上下文窗口，同时首次实现通过API直接解析YouTube链接。官方数据显示，该模型在VideoMME基准测试中达到84.7%的准确率，与行业顶尖水平的85.2%仅有一线之差，彰显了其强劲实力。这项突破性技术现已通过Google AI Studio向开发者开放体验。Gemini2.5Pro凭借其庞大的上下文窗口，实现了一次性处理约6小时视频内容的能力（以每秒1帧采样，每帧66个Token计算）。开发者现在可通过简单的API调用

23k 17 hours ago

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

wan2.5-t2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-i2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-omni-flash-realtime

Alibaba

$3.9

Input tokens/M

$15.2

Output tokens/M

Context Length

qwen3-omni-30b-a3b-captioner

Alibaba

$15.8

Input tokens/M

$12.7

Output tokens/M

Context Length

Doubao-Seedance-1.0-pro

Bytedance

Input tokens/M

Output tokens/M

Context Length

Doubao-Seed-1.6-vision

Bytedance

$0.8

Input tokens/M

Output tokens/M

256

Context Length

百度蒸汽机2.0音视一体

Baidu

Input tokens/M

Output tokens/M

Context Length

腾讯混元生视频-视频特效

Tencent

Input tokens/M

Output tokens/M

Context Length

腾讯混元生视频

Tencent

Input tokens/M

Output tokens/M

Context Length

Claude Opus 4.1

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Hunyuan-Large-Vision

Tencent

Input tokens/M

Output tokens/M

Context Length

Grok-4 Heavy

Xai

Input tokens/M

Output tokens/M

Context Length

Wan2.1-T2V-1.3B

Alibaba

Input tokens/M

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

苹果发布适配版SlowFast-LLaVA模型：长视频理解性能超越大规模模型

Memories AI携全球首个人工智能视觉记忆模型亮相，获800万美元种子轮融资

AI视频记忆革命来了！Memories.ai获800万美元融资，挑战千万小时视频分析极限

谷歌再破界限：Gemini 2.5 Pro实现6小时视频理解，AI视觉能力迈入新纪元

Models

GPT-4.1 mini

o3-mini

Claude 3 Opus

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-livetranslate-flaltimeash-re-2025-09-22

wan2.5-t2v-preview

wan2.5-i2v-preview

qwen3-omni-flash-realtime

qwen3-omni-30b-a3b-captioner

Doubao-Seedance-1.0-pro

Doubao-Seed-1.6-vision

百度蒸汽机2.0音视一体

腾讯混元生视频-视频特效

腾讯混元生视频

Claude Opus 4.1

Hunyuan-Large-Vision

Grok-4 Heavy

Wan2.1-T2V-1.3B

Qwen3 VL 4B Instruct GGUF

Qwen3 VL 30B A3B Instruct AWQ