Best 图像检索 AI Tools & Models - Premium 图像检索 News

AI News

亚马逊发布 Nova 2 系列模型，AI 性能迎来新高度！

AWS在re:Invent2025大会上推出四款自研“Nova2”系列大模型，覆盖文本、图像、视频、语音多模态场景，并首次内置网页检索与代码执行能力，宣称在价格性能比上达到业界领先。其中，Nova2 Lite定位高性价比推理，在多项基准测试中表现优于Claude Haiku4.5和GPT-5Mini，成本仅为后者约50%；Nova2 Pro则面向复杂Agent任务。

12.6k yesterday

NotebookLM升级支持图像导入板书秒变可检索知识库

谷歌推出NotebookLM图像识别功能，支持上传板书、教材或表格图片，自动完成文字识别与语义分析，用户可直接用自然语言检索图片内容。该功能全平台免费，即将增加本地处理选项保护隐私。系统采用多模态技术，能区分手写与印刷体、解析表格结构，并与现有笔记智能关联。

19.7k 4 hours ago

Chrome Canary 新增 Gemini AI 功能:Nano Banana 与深度搜索正式登场

谷歌为Chrome浏览器新增AI功能，在最新测试版中推出由Gemini驱动的“Nano Banana”图像生成工具和“深度搜索”主题研究功能。用户可直接在搜索框内创作图像或进行信息检索，无需切换页面即可快速启动任务。

12.7k 2 days ago

Chrome Canary 新增 Gemini AI 功能:Nano Banana 与深度搜索正式登场

腾讯重磅开源WeKnora！解锁复杂文档智能解析，知识管理进入AI新时代

腾讯开源多模态文档理解工具WeKnora，支持PDF、Word等格式的智能解析与检索。该工具基于大语言模型，具备文本、表格、图像等复杂文档的结构化处理能力，可生成统一语义视图。其核心优势包括：1）智能交互支持自然语言问答和多轮对话；2）模块化架构便于定制开发；3）适用于企业知识库、科研文献分析等场景。WeKnora的开源将推动文档处理智能化发展，项目已在GitHub发布。

13.5k 3 days ago

AI Products

Qwen3-VL-Reranker-8B

多模态信息检索与重排序模型，支持文本、图像、视频等输入。

AI搜索

6.9k

jina-clip-v2

多语言多模态嵌入模型，用于文本和图像检索。

AI搜索

10k

voyage-multimodal-3

多模态嵌入模型，实现文本、图像和截图的无缝检索。

AI模型

9.7k

Revisit Anything

视觉位置识别通过图像片段检索

AI图像检测识别

9.7k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

wan2.5-t2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-t2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-i2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

Awslabs Cost Analysis Mcp Server

AWS MCP Servers是一套基于Model Context Protocol的专用服务器，提供多种AWS相关功能，包括文档检索、知识库查询、CDK最佳实践、成本分析、图像生成等，旨在通过标准化协议增强AI应用与AWS服务的集成。

python

15.8k

5.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

亚马逊发布 Nova 2 系列模型，AI 性能迎来新高度！

NotebookLM升级支持图像导入 板书秒变可检索知识库

Chrome Canary 新增 Gemini AI 功能:Nano Banana 与深度搜索正式登场

腾讯重磅开源WeKnora！解锁复杂文档智能解析，知识管理进入AI新时代

AI Products

Qwen3-VL-Reranker-8B

jina-clip-v2

voyage-multimodal-3

Revisit Anything

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-vl-plus

wan2.5-i2i-preview

qwen3-vl-235b-a22b-thinking

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Doubao-Seed-Translation

wan2.5-t2i-preview

wan2.5-t2v-preview

wan2.5-i2v-preview

Dinov3 Vitb16 Pretrain Lvd1689m

DermLIP_ViT B 16

GME VARCO VISION Embedding

FuseLIP B CC12M MM

PHOENIX Patent Retrieval

Colnomic Embed Multimodal 7b

Nomic Embed Multimodal 3b

Colnomic Embed Multimodal 3b

Colqwen2.5 3b Multilingual V1.0

Colqwen2.5 3b Multilingual V1.0 Merged

Colqwen2 V1.0 Hf

Colqwen2.5 V0.1

CLIP Painting Finetuned

CLIP ViT H 14 Laion2B S32B B79K

CLIP ViT B 32 Laion2B S34B B79K

Llm Jp Clip Vit Large Patch14

Colqwen2 2b V1.0

Colqwen2 7b V1.0

Instructcir_llava_phi35_clip224_lp

Siglip So400m Patch16 256 I18n

MCP

Awslabs Cost Analysis Mcp Server

NotebookLM升级支持图像导入板书秒变可检索知识库