Best 图像识别 AI Tools & Models - Premium 图像识别 News

AI News

阿里通义千问 App 独家冠名四大卫视春晚，AI 智能体首登艺术舞台

阿里通义千问App继投入30亿元启动“春节请客计划”后，再获东方卫视、浙江卫视、江苏卫视及河南卫视四大马年春晚独家冠名权。与以往不同，通义千问将深度参与节目内容创作，作为“AI演员”融入表演，利用AI视频生成、图像识别和实时问答等尖端技术，为观众呈现科技感十足的春晚体验。

9.1k 2 days ago

阿里通义千问 App 独家冠名四大卫视春晚，AI 智能体首登艺术舞台

DeepSeek 发布 OCR 2：视觉 Token 消耗锐减 80%，文档解析力超越 Gemini 3 Pro

DeepSeek发布全新视觉编码器DeepSeek OCR2，在文档处理和图像识别领域取得突破。该模型模拟人类视觉的灵活扫描模式，颠覆传统视觉模型处理逻辑。通过引入全新架构，弃用传统CLIP组件，采用轻量级语言模型，实现了根据内容灵活聚焦的特性。

15.2k 3 hours ago

DeepSeek 发布 OCR 2：视觉 Token 消耗锐减 80%，文档解析力超越 Gemini 3 Pro

阿里巴巴1688推出跨境AI智能体“遨虾”:一键打通从选品到工厂的数字供应链

阿里巴巴旗下1688推出跨境电商AI工具“遨虾”，通过“AI+供应链”技术为全球跨境创业者提供智能数字供应链服务。该工具整合图像识别、链接解析和自然语言交互功能，用户通过对话、上传图片或输入链接，即可实现从市场调研到工厂对接的全流程自动化，覆盖选品决策和工厂寻源等环节。

14.6k yesterday

阿里巴巴1688推出跨境AI智能体“遨虾”:一键打通从选品到工厂的数字供应链

NotebookLM升级支持图像导入板书秒变可检索知识库

谷歌推出NotebookLM图像识别功能，支持上传板书、教材或表格图片，自动完成文字识别与语义分析，用户可直接用自然语言检索图片内容。该功能全平台免费，即将增加本地处理选项保护隐私。系统采用多模态技术，能区分手写与印刷体、解析表格结构，并与现有笔记智能关联。

22.6k 14 hours ago

NotebookLM升级支持图像导入板书秒变可检索知识库

AI Products

Manga Translator

Manga Translator

在线免费将漫画图像和扫描件翻译成英语等50种语言

SAM 3D

SAM 3D

SAM 3D：AI驱动，秒速将2D图像转化为专业级3D模型

isFake.ai

isFake.ai

强大的 AI 生成内容检测工具，适用于文本、图像、视频和音频。

xMode.ai

xMode.ai

xMode是一个AI图像训练平台，帮助用户训练和生成AI图像。

模型训练与部署

Models

qwen3-vl-plus

Alibaba

qwen3-vl-plus

$1

Input tokens/M

$10

Output tokens/M

256

Context Length

Doubao-1.5-vision-lite

Bytedance

Doubao-1.5-vision-lite

$1.5

Input tokens/M

$4.5

Output tokens/M

128

Context Length

Doubao-1.5-vision-pro-32k

Bytedance

Doubao-1.5-vision-pro-32k

$3

Input tokens/M

$9

Output tokens/M

32

Context Length

Doubao-1.5-vision-pro

Bytedance

Doubao-1.5-vision-pro

$3

Input tokens/M

$9

Output tokens/M

128

Context Length

MCP

mcp-florence2

Mcp Florence2

基于Florence-2的MCP图像处理服务

Fashion Recommendation System

Fashion Recommendation System

这是一个基于CLIP的时尚推荐系统，通过YOLO检测用户上传的服装图片，利用CLIP编码后推荐相似商品。项目已完成FastAPI服务器搭建、数据库连接和基础前端UI，下一步将优化CLIP的标签准确性和系统集成。

mcp-image-recognition

Mcp Image Recognition

一个提供图像识别功能的MCP服务器，支持Anthropic和OpenAI的视觉API，具备图像描述、多格式支持、可配置主备服务商及OCR文本提取功能。

deep_research

Deep_research

Deep Research是一个基于代理的工具，提供网页搜索和高级研究功能，支持PDF分析、图像描述和YouTube转录提取，可作为MCP服务器运行。

layout-detector-mcp

Layout Detector Mcp

一个基于计算机视觉的MCP服务器，通过分析网页截图自动识别图像资产位置并提取布局结构，支持径向、网格等多种布局模式检测，帮助AI助手精确重建网页布局。

grok-ai-mcp-server

Grok Ai Mcp Server

Grok AI MCP Server是一个基于Node.js的服务器，集成了xAI Grok API，为Solana区块链提供强大的AI驱动分析工具。它支持交易分析、地址分析、图像分析和通用查询，通过Model Context Protocol (MCP)提供标准化的接口。

imagerecog

Imagerecog

BenBox是一个基于SSE的MCP协议的AI代理系统，包含移动端Angular应用，支持图像识别和云端部署。

image-recognition-mcp

Image Recognition Mcp

一个基于Model Context Protocol的图像识别服务器，通过OpenAI兼容的视觉模型提供图像分析和描述功能，支持云端和本地模型集成。

langgraph-mcp-nutrition-analyzer

Langgraph Mcp Nutrition Analyzer

基于AI的食物营养分析助手，通过图像识别食物并计算卡路里和蛋白质含量，支持营养知识问答和对话记忆功能

Fashion Recommendation System

Fashion Recommendation System

基于CLIP的时尚推荐系统，通过图像识别和编码实现相似商品推荐。

AIBase

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

Business Cooperation Site Map