Best 视觉信息 AI Tools & Models - Premium 视觉信息 News

AI News

爆改漫画师？OpenAI 发布 ChatGPT Images 2.0，单次可生成8张连贯图像

OpenAI发布ChatGPT Images2.0，基于GPT Image2模型，核心亮点是增强AI的“思考能力”，使其更像具备逻辑的创作者。新版本引入推理规划功能，生成图像前会进行联网信息检索和逻辑分析，改变了以往“开盲盒”式的生图模式，提升了复杂视觉任务的处理能力。

18.9k 50 minutes ago

爆改漫画师？OpenAI 发布 ChatGPT Images 2.0，单次可生成8张连贯图像

苹果 iOS 27 新功能曝光：AI 助力饮食追踪与智能标签管理

苹果iOS27系统将大幅升级Apple Intelligence，重点增强“视觉智能”功能。新系统不仅适用于手机，还将拓展至智能眼镜和带摄像头的AirPods等穿戴设备，旨在提升设备对现实世界的感知能力。通过先进的视觉识别技术，帮助用户更高效地处理物理世界中的图文信息。

15.4k 3 hours ago

智谱发布 GLM-5V-Turbo：给 AI 智能体安上“火眼金睛”

智谱发布多模态编程模型GLM-5V-Turbo，具备视觉理解能力，可将设计稿、网页界面等视觉信息转化为代码，实现AI Agent从字符到视觉的感知延伸。

21.5k 11 hours ago

IBM发布Granite 4.0 3B Vision：企业级文档数据提取的新利器

IBM发布Granite 4.0 3B Vision视觉语言模型，拥有30亿参数，专为企业级复杂文档数据提取优化。该模型针对金融、法律、医疗等行业非结构化数据处理难题，在复杂表格、扫描件及多模态布局文档中表现突出，通过结合视觉理解与语言生成，精准识别并提取关键信息。

15.3k 1 days ago

IBM发布Granite 4.0 3B Vision：企业级文档数据提取的新利器

AI Products

Make Infographic AI

一款领先的AI信息图表生成器，只需一键即可将创意转化为专业视觉图表。

AI设计工具

7.2k

Snapmark

AI辅助的视觉UI开发工具，通过精确的DOM信息和自然语言描述帮助AI准确理解您的UI修改意图。

开发与工具

6.5k

BizGen

一款用于生成信息图表的视觉文本渲染工具。

AI设计工具

21.9k

Lloyd

视觉AI助手，提供视频信息识别与交流

视频编辑

9.7k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

wan2.5-t2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-t2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-i2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-omni-flash-realtime

Alibaba

$3.9

Input tokens/M

$15.2

Output tokens/M

Context Length

Doubao-Seed-1.6

Bytedance

$0.8

Input tokens/M

Output tokens/M

256

Context Length

MCP

Mcp Android Adb Server

一个通过adb操作安卓设备的MCP服务，支持应用管理、屏幕控制、输入手势和设备信息获取等功能，并可集成视觉模型进行屏幕内容分析。

17.6k

2.5points

Glasses Mcp

Glasses MCP是一个为AI助手提供网页视觉能力的工具，允许AI通过截图获取网页的视觉信息，支持多种设备和格式。

typescript

9.7k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

爆改漫画师？OpenAI 发布 ChatGPT Images 2.0，单次可生成8张连贯图像

苹果 iOS 27 新功能曝光：AI 助力饮食追踪与智能标签管理

智谱发布 GLM-5V-Turbo：给 AI 智能体安上“火眼金睛”

IBM发布Granite 4.0 3B Vision：企业级文档数据提取的新利器

AI Products

Make Infographic AI

Snapmark

BizGen

Lloyd

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Doubao-Seed-Translation

wan2.5-t2v-preview

wan2.5-t2i-preview

wan2.5-i2v-preview

qwen3-omni-flash-realtime

Doubao-Seed-1.6

SDXL Deepfake Detector

DeepSeek OCR 6bit

Japanese Receipt VL Lfm2 450M

Parrotlet V Lite 4b

Deepseek Vl 1.3b Chat

ViLaSR

DeepEyes 7B

Diagram2graph Adapters

Granite Vision 3.2 2b

Qwen Vl 2.5 3B Finetuned Cheque

Finedefics

Glm Edge V 5b Gguf

ChemVLM 8B

VisRAG Ret

DepthPro ONNX

RADIO B

Chartgemma

Kosmos 2 Patch14 24 Dup Ms

MATCHA ChartQA V1

MATCHA ViChart

MCP

Mcp Android Adb Server

Glasses Mcp