Best 多模态处理能力 AI Tools & Models - Premium 多模态处理能力 News

AI News

商汤科技发布日日新 SenseNova 6.7 Flash-Lite，多模态能力实现跨越式升级

商汤科技发布新一代轻量化多模态智能体模型“日日新 SenseNova6.7Flash-Lite”，标志着AI竞争从“大参数”转向“轻量化与高效率”。该模型专为真实世界工作流设计，通过原生多模态架构突破传统智能体处理复杂长链路任务的瓶颈，核心优势在于卓越的视觉理解与逻辑决策能力，无需依赖“视觉转文本”中间层，实现更高效的任务处理。

14.2k 50 minutes ago

谷歌确认Gemini赋能新版Siri:苹果情境感知功能定档2026年发布

谷歌与苹果达成云服务合作，将基于Gemini模型开发下一代Apple Foundation机型，计划于2026年推出全新Siri。该合作旨在结合Gemini的多模态处理能力与苹果私有云架构，提升Siri在复杂指令和跨应用识别方面的表现。

11.9k 22 hours ago

Adobe发布Acrobat Student Spaces:面向学生的免费全流程AI学习工具

Adobe推出免费AI学习工具“Student Spaces”，面向学生群体，支持免登录使用。该工具集成多模态解析能力，可处理PDF、Office文档、网页链接及手写笔记等多种格式，提供一站式阅读与资料处理平台。

10.7k 4 hours ago

Adobe发布Acrobat Student Spaces:面向学生的免费全流程AI学习工具

报道称DeepSeek V4 与腾讯姚顺雨混元模型 4 月同步发布

DeepSeek V4与姚顺雨新混元模型将于2026年4月发布。DeepSeek V4由梁文锋主导，是多模态大模型，在代码能力和长期记忆方面有显著提升，专注于视觉内容处理和AI搜索能力，并探索“条件记忆”机制。

20.9k 10 hours ago

AI Products

InternVL3

InternVL3开源：7种尺寸覆盖文、图、视频处理，多模态能力扩展至工业图像分析

AI模型

14.4k

Grok 3

xAI推出的最新旗舰AI模型Grok 3，具备强大的推理和多模态处理能力。

AI模型

29.2k

Valley 2.0

多模态大型语言模型，提升文本、图像和视频数据处理能力。

AI模型

10.4k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

MCP

Rag Anything Mcp

RAG Anything MCP Server是一个提供全面检索增强生成(RAG)能力的模型上下文协议服务器，支持多模态文档处理与查询，具备端到端文档解析、批量处理、高级查询及持久化存储等功能。

python

10k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

商汤科技发布日日新 SenseNova 6.7 Flash-Lite，多模态能力实现跨越式升级

谷歌确认Gemini赋能新版Siri:苹果情境感知功能定档2026年发布

Adobe发布Acrobat Student Spaces:面向学生的免费全流程AI学习工具

报道称DeepSeek V4 与腾讯姚顺雨混元模型 4 月同步发布

AI Products

InternVL3

Grok 3

Valley 2.0

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

qwen3-max

Qianfan-Lightning

wan2.5-i2i-preview

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Qwen3 VL 4B Instruct 4bit GPTQ

Sarashina2.2 Vision 3b

Qwen3 VL 8B Thinking GGUF

Qwen3 VL 4B Instruct GGUF

Qwen3 VL 30B A3B Instruct GGUF

Qwen3 VL 4B Instruct GGUF

NVIDIA Nemotron Nano 12B V2 VL FP8

LFM2 VL 3B

Qwen3 VL 32B Thinking 4bit

Qwen3 VL 32B Instruct MLX 4bit

Qwen3 VL 30B A3B Instruct AWQ

Qwen3 VL 8B Thinking AWQ 8bit

NuExtract 2.0 8B GGUF

NuExtract 2.0 4B GGUF

Lapa 12b Pt

MiniCPM4.1 8B 8bit

Omnivinci

Kimi VL A3B Thinking 2506 GGUF

Gemma 3 270m

Gemma 3 270m It Qat GGUF

MCP

Rag Anything Mcp