最好的图像检索 AI工具模型_精选图像检索资讯

AI资讯

谷歌发布 Gemini Embedding2:原生多模态嵌入模型统一文本、图像与音视频语义空间

谷歌发布Gemini Embedding2多模态嵌入模型，可将文本、图像、视频、音频及PDF统一映射到同一语义空间，简化AI数据处理，提升多模态检索与理解能力。这标志着谷歌从单一文本嵌入迈向统一多模态语义建模。此前，谷歌曾推出支持百种语言的文本嵌入模型。

11k 昨天

谷歌发布 Gemini Embedding2:原生多模态嵌入模型统一文本、图像与音视频语义空间

谷歌Gemini Embedding 2重磅发布！首款全多模态嵌入模型来了

谷歌推出Gemini Embedding2，这是首款基于Gemini架构的多模态嵌入模型，已在Gemini API和Vertex AI开放预览。该模型将文本、图像、视频、音频和文档等数据类型映射到统一嵌入空间，实现跨模态检索与分类，支持超过100种语言。

15.3k 4 小时前

情人节重磅!火山引擎豆包2.0将发:视频生成直达“工业级”交付

字节跳动火山引擎将于2月14日发布技术升级，重点推出“豆包”系列2.0版本，包括音视频工具Seedance2.0和图像工具Seedream5.0Preview。Seedance2.0在交互与画面稳定性上达到行业领先，支持全模态输入，输出质量满足影视广告等专业需求。Seedream首次引入实时信息检索功能，确保创作内容与社会时事同步。

12.4k 3 天前

亚马逊发布 Nova 2 系列模型，AI 性能迎来新高度！

AWS在re:Invent2025大会上推出四款自研“Nova2”系列大模型，覆盖文本、图像、视频、语音多模态场景，并首次内置网页检索与代码执行能力，宣称在价格性能比上达到业界领先。其中，Nova2 Lite定位高性价比推理，在多项基准测试中表现优于Claude Haiku4.5和GPT-5Mini，成本仅为后者约50%；Nova2 Pro则面向复杂Agent任务。

14k 前天

AI产品

Free Nano Banana 2 AI Image Generator

Nano Banana 2集成谷歌4K AI图像生成技术，支持语义检索与高分辨率输出

图片生成

Qwen3-VL-Reranker-8B

多模态信息检索与重排序模型，支持文本、图像、视频等输入。

AI搜索

7.7k

jina-clip-v2

多语言多模态嵌入模型，用于文本和图像检索。

AI搜索

10.7k

voyage-multimodal-3

多模态嵌入模型，实现文本、图像和截图的无缝检索。

AI模型

11.6k

模型

GPT-4.1 mini

Openai

$2.8

输入tokens/百万

$11.2

输出tokens/百万

上下文长度

Gemini 2.0 Flash-Lite

Google

$0.49

输入tokens/百万

$2.1

输出tokens/百万

上下文长度

Grok 4 Fast

Xai

$1.4

输入tokens/百万

$3.5

输出tokens/百万

上下文长度

Claude 3 Opus

Anthropic

$105

输入tokens/百万

$525

输出tokens/百万

200

上下文长度

Gemini 2.0 Flash

Google

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

Claude Haiku 4.5

Anthropic

输入tokens/百万

$35

输出tokens/百万

200

上下文长度

Gemini 2.5 Flash

Google

$2.1

输入tokens/百万

$17.5

输出tokens/百万

上下文长度

Claude Sonnet 4.5

Anthropic

$21

输入tokens/百万

$105

输出tokens/百万

200

上下文长度

Claude 3 Sonnet

Anthropic

$21

输入tokens/百万

$105

输出tokens/百万

200

上下文长度

Gemini 2.5 Flash-Lite

Google

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

qwen-image-plus

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

qwen3-vl-plus

Alibaba

输入tokens/百万

$10

输出tokens/百万

256

上下文长度

wan2.5-i2i-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

qwen3-vl-235b-a22b-thinking

Alibaba

输入tokens/百万

$20

输出tokens/百万

上下文长度

qwen-image-edit

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

输入tokens/百万

$240

输出tokens/百万

上下文长度

Doubao-Seed-Translation

Bytedance

$1.2

输入tokens/百万

$3.6

输出tokens/百万

上下文长度

wan2.5-t2v-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

wan2.5-t2i-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

wan2.5-i2v-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

MCP

Awslabs Cost Analysis Mcp Server

AWS MCP Servers是一套基于Model Context Protocol的专用服务器，提供多种AWS相关功能，包括文档检索、知识库查询、CDK最佳实践、成本分析、图像生成等，旨在通过标准化协议增强AI应用与AWS服务的集成。

智启未来，您的人工智能解决方案智库

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商务合作网站地图

AI资讯

谷歌发布 Gemini Embedding2:原生多模态嵌入模型统一文本、图像与音视频语义空间

谷歌Gemini Embedding 2重磅发布！首款全多模态嵌入模型来了

情人节重磅!火山引擎豆包2.0将发:视频生成直达“工业级”交付

亚马逊发布 Nova 2 系列模型，AI 性能迎来新高度！

AI产品

Free Nano Banana 2 AI Image Generator

Qwen3-VL-Reranker-8B

jina-clip-v2

voyage-multimodal-3

模型

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-vl-plus

wan2.5-i2i-preview

qwen3-vl-235b-a22b-thinking

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Doubao-Seed-Translation

wan2.5-t2v-preview

wan2.5-t2i-preview

wan2.5-i2v-preview

Dinov3 Vitb16 Pretrain Lvd1689m

DermLIP_ViT B 16

GME VARCO VISION Embedding

FuseLIP B CC12M MM

PHOENIX Patent Retrieval

Colnomic Embed Multimodal 7b

Nomic Embed Multimodal 3b

Colnomic Embed Multimodal 3b

Colqwen2.5 3b Multilingual V1.0

Colqwen2.5 3b Multilingual V1.0 Merged

Colqwen2 V1.0 Hf

Colqwen2.5 V0.1

CLIP Painting Finetuned

CLIP ViT H 14 Laion2B S32B B79K

CLIP ViT B 32 Laion2B S34B B79K

Llm Jp Clip Vit Large Patch14

Colqwen2 2b V1.0

Colqwen2 7b V1.0

Instructcir_llava_phi35_clip224_lp

Siglip So400m Patch16 256 I18n

MCP

Awslabs Cost Analysis Mcp Server