Best AI图像模型 AI Tools & Models - Premium AI图像模型 News

AI News

涂鸦变游戏：Google 发布 Project Genie，一句话生成可交互虚拟世界

谷歌DeepMind开放Project Genie AI模型，用户可通过文本或图片生成可交互虚拟世界，实现游戏式探索。该工具融合Genie3、Nano Banana Pro图像生成和Gemini多模态模型，突破传统内容生成边界。

谷歌在美国推出 Google AI Plus 订阅服务：每月 7.99 美元起

谷歌将AI订阅服务Google AI Plus扩展至35个国家和地区，旨在以更具竞争力的价格推广其尖端生成式AI技术。该服务提供全方位的智能增强方案，包括Gemini 3 Pro模型和移动端优化的Nana Banana Pro图像生成工具。

10.6k 3 hours ago

谷歌 Gemini 3 Flash 升级：新增“Agentic Vision”让 AI 像专家一样深度看图

谷歌为Gemini 3 Flash模型推出“Agentic Vision”功能，突破传统AI视觉模型“单次猜测”局限。该功能使AI能主动探索图像细节，通过深度推理分析复杂内容，如远处路牌、电路图或微小文字，有效解决以往因一次性全局处理导致的细节丢失问题，实现更接近人类专家的图像理解能力。

13.7k 41 minutes ago

谷歌 Gemini 3 Flash 升级：新增“Agentic Vision”让 AI 像专家一样深度看图

AI日报：腾讯混元图像3.0正式开源；Clawdbot迫于压力更名Moltbot；月之暗面发布 Kimi Code

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、全球最强开源图生图!腾讯混元图像3.0正式开源，800亿参数助力AI创作腾讯混元团队正式开源了其最新混元图像3.0图生图模型，该模型凭借强大的混合专家架构和多项核心技术突破，在全球影像编辑榜单中位列第七，成为目前全球最强的开源图生图模型。8、小米AI眼镜深度集成支付宝：停车缴费与健康管理实现“无感交互”小米AI眼镜深度集成支付宝功能，推出停车缴费与健康管理服务，提升了用户体验并强化了设备的安全性。

22.6k 1 hours ago

AI日报：腾讯混元图像3.0正式开源；Clawdbot迫于压力更名Moltbot；月之暗面发布 Kimi Code

AI Products

Nana Banana Pro AI

用多AI模型生成图像、编辑照片、由图像创建视频，结果快速高质。

图片生成

4.1k

NewYouGo

NewYouGo是免费AI图像与视频生成平台，用先进模型秒速创建高质量视觉内容。

图片生成

WeryAI

免费AI视频与图像平台，集成多模型，可创作视频、图像、音乐等

AI设计工具

7.2k

Hunyuan 3d

Hunyuan 3D AI将文本和图像转化为含PBR纹理的高质量3D模型，无需建模经验。

3D建模

5.9k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

Mcp Hfspace

mcp-hfspace是一个连接Hugging Face Spaces的MCP服务器，支持图像生成、语音处理、视觉模型等多种AI功能，简化了与Claude Desktop的集成。

typescript

6.4k

3.5points

Mcp Server Notifier

MCP Server Notifier 是一个轻量级通知服务，与模型上下文协议（MCP）集成，可在AI代理完成任务时发送Webhook通知。支持多种Webhook提供商（如Discord、Slack、Teams等），提供图像支持、多项目管理、自定义消息等功能，易于与AI工具（如Cursor）集成。

typescript

5.7k

2.5points

Jhacksman_OpenSCAD MCP Server

OpenSCAD MCP服务器是一个通过文本或图像生成参数化3D模型的服务，支持多视角重建、AI图像生成、远程CUDA处理和工作流审批，最终输出OpenSCAD兼容的模型文件。

python

9.2k

2.5points

Fal Mcp Server

AI视频生成MCP服务器，支持文本和图像输入生成动态视频，提供多种参数控制和模型选择。

typescript

9.8k

2.5points

Jina Ai Mcp Multimodal Search

Jina AI MCP服务器是一个提供语义搜索、图像搜索和跨模态搜索功能的模型上下文协议服务，支持与Jina AI神经搜索能力无缝集成。

javascript

8.9k

2.5points

Opencv Mcp Server

OpenCV MCP Server是一个基于Python的计算机视觉服务，通过Model Context Protocol (MCP)提供OpenCV的图像和视频处理能力。它为AI助手和语言模型提供从基础图像处理到高级对象检测的全套计算机视觉工具，包括图像处理、边缘检测、人脸识别、视频分析和实时对象跟踪等功能。

python

12.6k

2.5points