多模态RAG技术通过ColQwen2和Qwen2.5实现图像与文本统一向量表示,无需传统OCR和分块步骤,为文档处理和智能问答提供新路径。
tsystems
基于Qwen2.5-VL-3B-Instruct与ColBERT策略的多语言视觉检索模型,支持动态输入图像分辨率和多语言文档检索。
基于Qwen2.5-VL-3B-Instruct与ColBERT策略的多语言视觉检索模型,支持动态输入图像分辨率,生成ColBERT风格的多向量文本与图像表征。
Metric-AI
基于Qwen2.5-VL-7B-Instruct并采用ColBERT策略的多语言视觉检索模型,在Vidore基准测试中排名第一
基于Qwen2.5-VL-3B-Instruct并采用ColBERT策略的多语言视觉检索器,在Vidore基准测试中表现优异
vidore
基于Qwen2-VL-2B-Instruct与ColBERT策略的视觉检索模型,能生成文本与图像的多向量表征
基于Qwen2.5-VL-3B-Instruct的多语言视觉检索器,采用ColBERT策略,在Vidore基准测试中表现优异
ColQwen2.5是基于Qwen2.5-VL-3B-Instruct与ColBERT策略的视觉检索模型,专注于通过视觉特征高效索引文档。
基于Qwen2.5-VL-3B-Instruct与ColBERT策略的视觉检索模型,能够生成文本和图像的多向量表示,用于高效文档检索。
基于Qwen2-VL-7B-Instruct并采用ColBERT策略的视觉检索模型,专注于高效视觉特征索引文档
基于Qwen2-VL-2B-Instruct与ColBERT策略的视觉检索模型,能够生成多向量文本与图像表示
yydxlv
基于Qwen2-VL-7B-Instruct与ColBERT策略的视觉检索模型,支持多向量文本与图像表示
ColQwen2是基于Qwen2-VL-2B-Instruct与ColBERT策略的视觉检索模型,用于高效索引文档的视觉特征。
基于Qwen2-VL-2B-Instruct与ColBERT策略的视觉检索模型,能高效通过视觉特征索引文档