Best 图片分析 AI Tools & Models - Premium 图片分析 News

AI News

DeepSeek 灰测 “识图模式”，实现多模态图片理解功能

DeepSeek正在灰度测试“识图模式”，该模式具备多模态识别能力，能进行深度图像分析与描述，而不仅是OCR文字识别。用户上传图片后可获得快速响应，有网友形容速度如闪电般迅速。

DeepSeek 大模型 V4 即将上线，AI 应用迎来新机遇！

DeepSeek 下周将推出 V4 大模型，新增支持图片、视频和文本生成功能。这是自 2025 年 1 月 R1 模型后的首次重大升级，进一步布局国内低成本开源市场。财信证券分析师认为，AI 应用商业化进程有望加速，尤其在春节期间，互联网厂商正借助高频消费场景推动技术落地。

14.2k yesterday

谷歌搜索测试“+”按钮:允许用户上传图片文档，利用 Gemini AI 进行深度分析

谷歌搜索新增“+”按钮，支持上传图片或文档，由Gemini AI模型进行深度分析。该功能目前处于实验阶段，仅部分用户可用。上传后，Gemini可解析内容，用户可即时提问，实现上下文相关查询，如上传说明书后询问零件购买地。

13.7k 14 hours ago

谷歌搜索测试“+”按钮:允许用户上传图片文档，利用 Gemini AI 进行深度分析

NotebookLM升级支持图像导入板书秒变可检索知识库

谷歌推出NotebookLM图像识别功能，支持上传板书、教材或表格图片，自动完成文字识别与语义分析，用户可直接用自然语言检索图片内容。该功能全平台免费，即将增加本地处理选项保护隐私。系统采用多模态技术，能区分手写与印刷体、解析表格结构，并与现有笔记智能关联。

30.4k 1 days ago

AI Products

DeepPDF

DeepPDF是一个AI研究助手，用于深度学习PDF文档，提供聊天、摘要、翻译比较以及关键术语、图片和公式分析功能。

知识管理

9.1k

QVQ-Max

一款先进的视觉推理模型，能分析图片和视频内容。

AI模型

17.5k

Models

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

wan2.5-t2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-t2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-omni-flash-realtime

Alibaba

$3.9

Input tokens/M

$15.2

Output tokens/M

Context Length

qwen3-omni-30b-a3b-captioner

Alibaba

$15.8

Input tokens/M

$12.7

Output tokens/M

Context Length

Kimi-K2

Moonshot

Input tokens/M

$16

Output tokens/M

256

Context Length

Doubao - Seedream - 4.0

Bytedance

Input tokens/M

Output tokens/M

Context Length

Doubao - Seedream - 3.0 - t2i

Bytedance

Input tokens/M

Output tokens/M

Context Length

Doubao-SeedEdit-3.0-i2i

Bytedance

Input tokens/M

Output tokens/M

Context Length

MCP

Google Calendar Mcp

这是一个Google日历的MCP服务器项目，提供与Google Calendar的集成功能，允许通过标准化接口读取、创建、更新和搜索日历事件。支持从图片添加事件、日历分析、出席情况检查、自动协调事件等功能。

typescript

13.9k

3.5points

Mcp Vision Relay

MCP Vision Relay 是一个 MCP 服务器，通过封装本地安装的 Gemini 和 Qwen 命令行工具，为 Claude、Codex 等仅支持文本的 MCP 客户端提供图像分析能力，使其能够处理本地路径、URL 或 base64 编码的图片。

typescript

11.8k

2.5points

Python Line Server

一个基于Python的LINE MCP服务器，通过标准化接口让语言模型能够读取和分析LINE对话消息。项目使用FastAPI框架，支持文本、贴图和图片消息处理，并提供了消息存储、API端点等核心功能。

python

11.4k

2.5points

Mcp Vl

基于GLM-4.5V模型的MCP服务器，提供智能图片分析功能，支持从文件路径或剪贴板获取图片，专门用于代码内容提取、架构分析、错误检测和文档生成。

typescript

2.5points

Mcp Server Glm Vision

一个集成GLM-4.5V视觉能力的MCP服务器，支持本地图片和URL分析，通过Claude Code提供图像分析功能

python

14.8k

2.5points

Docx Mcp Server

一个基于mammoth库的DOCX文档处理MCP服务器，提供文本提取、HTML转换、结构分析、图片提取和Markdown转换等功能，支持完整格式保留和文档分析。

typescript

15.4k

2.0points

Site Cloner

这是一个基于MCP协议的网站克隆服务器，帮助LLM模型获取、分析和下载网站资源，包括HTML内容、CSS、JavaScript、图片等资产，支持创建网站地图和分析页面结构。

python

8.8k

2.0points

Google Image Search Mcp

该项目是一个基于SerpAPI的Google图片搜索MCP服务器，提供图片搜索、下载和分析功能，帮助AI助手获取相关图像资源。

typescript

12.7k

2.0points

Champierre_image Mcp Server

一个基于GPT-4o-mini模型的图像分析MCP服务器，通过接收图片URL进行内容识别和描述

typescript

10.9k

2.0points

Google Ads Library Mcp

这是一个用于访问和分析Google广告透明中心数据的MCP服务器，可查询企业广告活动、分析广告内容（包括图片和视频）、比较不同公司的广告策略，并提供广告效果洞察。

python

10k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

DeepSeek 灰测 “识图模式”，实现多模态图片理解功能

DeepSeek 大模型 V4 即将上线，AI 应用迎来新机遇！

谷歌搜索测试“+”按钮:允许用户上传图片文档，利用 Gemini AI 进行深度分析

NotebookLM升级支持图像导入 板书秒变可检索知识库

AI Products

DeepPDF

QVQ-Max

Models

Gemini 2.0 Flash-Lite

o3-mini

Claude 3 Opus

Gemini 2.0 Flash

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

wan2.5-i2i-preview

qwen3-max

qwen-image-edit

Qwen3-Next-80B-A3B-Instruct

wan2.5-t2v-preview

wan2.5-t2i-preview

qwen3-omni-flash-realtime

qwen3-omni-30b-a3b-captioner

Kimi-K2

Doubao - Seedream - 4.0

Doubao - Seedream - 3.0 - t2i

Doubao-SeedEdit-3.0-i2i

MCP

Google Calendar Mcp

Mcp Vision Relay

Python Line Server

Mcp Vl

Mcp Server Glm Vision

Docx Mcp Server

Site Cloner

Google Image Search Mcp

Champierre_image Mcp Server

Google Ads Library Mcp

NotebookLM升级支持图像导入板书秒变可检索知识库