Best 视觉智能 AI Tools & Models - Premium 视觉智能 News

AI News

三星日历应用迎来 AI 大更新:自动生成视觉背景与智能化体验

三星日历应用通过One UI 8.5更新引入AI功能，可根据日程标题自动生成匹配的视觉背景，提升交互体验。

10.1k yesterday

三星联手谷歌！全球首款Gemini AI冰箱CES前夕曝光，食材识别+红酒管家全靠AI

三星推出全球首款集成谷歌Gemini大模型的智能冰箱，具备AI视觉识别功能，可自动识别食材、推荐食谱、生成购物清单和管理红酒收藏，重新定义厨房智能体验。

9.8k 6 hours ago

Meta AI 眼镜重磅升级:新增“对话聚焦”和 Spotify 视觉配乐功能

Meta智能眼镜软件更新推出“对话聚焦”功能，利用AI技术增强嘈杂环境中的对话清晰度，并新增与Spotify合作的“视觉配乐”功能。

6.1k 8 hours ago

商汤发布行业首个“多剧集生成智能体”Seko2.0，国产AI芯片首次打通多模态AIGC全链路

商汤科技发布Seko2.0，全球首个专注多集视频生成的AI智能体，实现从单片段到连续叙事的跨越。该系统能保持角色、场景、风格高度一致，在剧情连贯性、人物稳定性和视觉统一性上取得突破，为短剧、广告、教育等领域提供可规模化的AI内容生产方案，基于自研“日日新Seko”多模态大模型。

12.2k 19 hours ago

AI Products

Janus Pro

Janus Pro 是一款先进的 AI 图像生成与理解平台，提供高质量的视觉智能服务。

图片生成

12.7k

GLM-PC

GLM-PC是基于CogAgent视觉语言大模型构建的电脑智能体，旨在提升电脑使用体验。

个人助理

9.9k

Luma Photon

基于突破性架构的智能图像生成模型

图片生成

11.7k

ViTLP

文档智能的视觉引导生成文本布局预训练模型

文档

10.6k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

wan2.5-t2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-t2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

Xiaozhi Autoglm Mcp

基于Open-AutoGLM构建的安卓设备自动化MCP服务，通过ADB连接手机并调用视觉模型，可接入小智AI实现智能控制。

python

6.4k

2.5points

Unsplash Smart Mcp Server

Unsplash智能MCP服务器是为AI代理设计的专业图库集成方案，提供智能搜索、自动归因和项目感知的图片管理功能，简化开发者的视觉内容获取流程。

javascript

8.3k

2.5points

Screenmonitormcp

ScreenMonitorMCP是一个革命性的AI视觉服务器项目，为Claude等AI助手提供实时屏幕监控、视觉分析和智能交互能力，使AI能够'看见'并操作用户屏幕。

python

8.8k

2.5points

Groqcloud Mcp_server

一个完整的Groq MCP服务器项目，作为智能桥梁连接应用与Groq API，支持多种AI模型（文本、音频、视觉、批处理），具备智能路由、速率限制、缓存优化等高级功能。

typescript

7.6k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

三星日历应用迎来 AI 大更新:自动生成视觉背景与智能化体验

三星联手谷歌！全球首款Gemini AI冰箱CES前夕曝光，食材识别+红酒管家全靠AI

Meta AI 眼镜重磅升级:新增“对话聚焦”和 Spotify 视觉配乐功能

商汤发布行业首个“多剧集生成智能体”Seko2.0，国产AI芯片首次打通多模态AIGC全链路

AI Products

Janus Pro

GLM-PC

Luma Photon

ViTLP

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

Qianfan-Lightning

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Doubao-Seed-Translation

wan2.5-t2i-preview

wan2.5-t2v-preview

Qwen3 VL 4B Instruct

Qwen3 VL 30B A3B Instruct 1M GGUF

Qwen3 VL 32B Thinking 1M GGUF

Qwen3 VL 8B Thinking 1M GGUF

Qwen3 VL 32B Instruct 1M GGUF

Qwen3 VL 8B Instruct 1M GGUF

Qwen3 VL 4B Thinking 1M GGUF

Qwen3 VL 4B Instruct 1M GGUF

Qwen3 VL 2B Instruct 1M GGUF

Qwen3 VL 2B Thinking 1M GGUF

JanusCoder 14B GGUF

Qwen3 VL 30B A3B Thinking GGUF

JanusCoder 8B GGUF

Qwen3 VL 2B Thinking GGUF

Qwen3 VL 8B Thinking GGUF

Qwen3 VL 32B Thinking GGUF

Qwen3 VL 32B Instruct GGUF

Qwen3 VL 32B Thinking GGUF

Qwen3 VL 32B Instruct GGUF

Qwen3 VL 30B A3B Instruct GGUF

MCP

Xiaozhi Autoglm Mcp

Unsplash Smart Mcp Server

Screenmonitormcp

Groqcloud Mcp_server