Best AI视觉生成 AI Tools & Models - Premium AI视觉生成 News

AI News

研究人员推出LPM1.0模型:实现单图转实时交互式数字人视频

LPM1.0模型发布，能通过单张参考图实时生成人物说话、聆听及唱歌视频。其核心突破在于多模态处理，可同步整合文本、音频与图像，生成唇形精准同步、表情细腻且情绪过渡自然的动态画面。该模型支持接入ChatGPT等主流语音AI，将传统语音对话升级为具备视觉反馈的实时交互。

15.6k 3 hours ago

研究人员推出LPM1.0模型:实现单图转实时交互式数字人视频

程序员用AI三天生成违章举报网页版，App预计两个月内上线

成都程序员蒲海洋开发了一款AI视觉识别车辆违章自动举报程序，旨在提升交通监督效率。该项目构思于2025年，演示版一周完成，网页版借助AI工具三天生成。目前安卓与iOS客户端开发进度达80%，预计两三个月内上线应用商店。核心技术优势在于将传统举报流程自动化。

16.4k 12 hours ago

程序员用AI三天生成违章举报网页版，App预计两个月内上线

智谱推出 GLM-5V-Turbo：为 AI 编程安上“眼睛”，设计稿秒变代码

智谱AI发布GLM-5V-Turbo大模型，专为视觉编程设计。该模型突破纯文本局限，具备原生多模态能力，可直接理解设计稿和网页截图。开发者上传草图或界面截图后，模型能自动生成可运行的前端代码。其视觉感知能力实现了从“读文档”到“看界面”的转变，并支持200k超长上下文窗口。

13.1k yesterday

智谱推出 GLM-5V-Turbo：为 AI 编程安上“眼睛”，设计稿秒变代码

AI日报：Luma AI发布Uni-1图像模型；阿里达摩院发布玄铁C950；美团龙猫发布开源数学定理证明模型

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、LumaAI发布Uni-1图像模型，采用自回归架构同步生成文本与像素LumaAI发布了基于自回归架构的图像生成模型Uni-1，支持文本与图像同步生成，并提供多种视觉风格。随着调用量规模迈向140万亿的历史性关口，统一的术语规范将有助于降低行业沟通成本，为后续AI基础设施的统计量化与政策制定夯实基础。

26.9k 3 hours ago

AI日报：Luma AI发布Uni-1图像模型；阿里达摩院发布玄铁C950；美团龙猫发布开源数学定理证明模型

AI Products

Himedia

Himedia

Himedia是AI影片与图片生成器，可快速制作专业内容，转化视觉效果。

Fourmula AI

Fourmula AI

用AI即时生成专业产品图片、生活方式图像和视频，秒变品牌视觉资产

Make Infographic AI

Make Infographic AI

一款领先的AI信息图表生成器，只需一键即可将创意转化为专业视觉图表。

banana 2

banana 2

Banana 2是由Nano Banana 2驱动的AI图像生成器，可创建4K视觉效果。

Models

GPT-4.1 mini

Openai

GPT-4.1 mini

$2.8

Input tokens/M

$11.2

Output tokens/M

1k

Context Length

Gemini 2.0 Flash-Lite

Google

Gemini 2.0 Flash-Lite

$0.49

Input tokens/M

$2.1

Output tokens/M

1k

Context Length

Grok 4 Fast

Xai

Grok 4 Fast

$1.4

Input tokens/M

$3.5

Output tokens/M

2k

Context Length

o3-mini

Openai

o3-mini

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

GPT-5 Codex

-

Input tokens/M

-

Output tokens/M

-

Context Length

Claude 3 Opus

Anthropic

Claude 3 Opus

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

Gemini 2.0 Flash

$0.7

Input tokens/M

$2.8

Output tokens/M

1k

Context Length

Claude Haiku 4.5

Anthropic

Claude Haiku 4.5

$7

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

Gemini 2.5 Flash

$2.1

Input tokens/M

$17.5

Output tokens/M

1k

Context Length

Claude Sonnet 4.5

Anthropic

Claude Sonnet 4.5

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

Claude 3 Sonnet

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

Gemini 2.5 Flash-Lite

$0.7

Input tokens/M

$2.8

Output tokens/M

1k

Context Length

qwen-image-plus

Alibaba

qwen-image-plus

-

Input tokens/M

-

Output tokens/M

-

Context Length

qwen3-coder-plus

Alibaba

qwen3-coder-plus

$4

Input tokens/M

$16

Output tokens/M

1k

Context Length

qwen3-vl-plus

Alibaba

qwen3-vl-plus

$1

Input tokens/M

$10

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

wan2.5-i2i-preview

-

Input tokens/M

-

Output tokens/M

-

Context Length

qwen3-max

Alibaba

qwen3-max

$6

Input tokens/M

$24

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Qianfan-Lightning

-

Input tokens/M

-

Output tokens/M

128

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

qwen3-vl-235b-a22b-thinking

$2

Input tokens/M

$20

Output tokens/M

-

Context Length

qwen-image-edit

Alibaba

qwen-image-edit

-

Input tokens/M

-

Output tokens/M

-

Context Length

MCP

mcp-hfspace

Mcp Hfspace

mcp-hfspace是一个连接Hugging Face Spaces的MCP服务器，支持图像生成、语音处理、视觉模型等多种AI功能，简化了与Claude Desktop的集成。

korx-share-mcp-server

Korx Share Mcp Server

Korx Share MCP Server是一个多功能MCP协议服务器，通过与korx.org API集成，为AI生成的视觉内容（如图表、仪表盘和HTML页面）创建安全可分享的URL，同时保持内容交互性并进行风险过滤。

moondream-mcp-server

Moondream Mcp Server

Moondream MCP Server是一个基于Moondream视觉模型的图像分析服务，提供图像描述生成、物体检测和视觉问答功能，可轻松集成到Claude和Cline等AI助手中。

mcp-server-ai-vision

Mcp Server Ai Vision

一个提供AI视觉分析能力的MCP服务器，支持网页截图、视觉分析、文件操作和报告生成等功能。

Hugging Face Spaces

Hugging Face Spaces

MCP-hfspace是一个简化连接Hugging Face Spaces的服务器工具，支持图像生成、语音处理、视觉模型等多种AI功能，与Claude Desktop无缝集成。

samihalawa_mcp-server-ai-vision

Samihalawa_mcp Server Ai Vision

一个提供AI视觉分析能力的MCP服务器，支持网页截图、视觉分析、文件操作和报告生成等功能，适用于Claude等AI助手。

AIBase

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

Business Cooperation Site Map