timm
这是一个基于DINOv3框架的视觉Transformer模型,通过知识蒸馏技术从DINOv3 ViT-7B模型在LVD-1689M数据集上训练得到。该模型专门用于图像特征编码,能够高效提取图像特征表示,适用于各种计算机视觉任务。
这是一个基于DINOv3架构的视觉Transformer模型,采用小型(Small)配置,在LVD-1689M数据集上通过知识蒸馏训练而成。该模型专门用于高效提取图像特征,支持图像分类、特征图提取和图像嵌入等多种计算机视觉任务。
这是一个基于DINOv3架构的Vision Transformer图像特征编码器,通过从7B参数的DINOv3 ViT模型在LVD-1689M数据集上进行知识蒸馏得到。该模型专门用于图像特征提取任务,具有强大的视觉表示能力。
pcuenq
基于视觉Transformer(ViT)的图像特征模型,采用自监督DINOv2方法在LVD-142M数据集上预训练。
一种带有寄存器的视觉Transformer(ViT)图像特征模型,采用自监督DINOv2方法在LVD-142M数据集上预训练。
带有寄存器的视觉变换器(ViT)图像特征模型,使用自监督的DINOv2方法在LVD-142M数据集上进行预训练。
一个带有寄存器的视觉Transformer(ViT)图像特征模型,采用自监督DINOv2方法在LVD-142M数据集上预训练。
一个带有寄存器的视觉变换器(ViT)图像特征模型,使用自监督的DINOv2方法在LVD-142M数据集上进行预训练。
基于视觉Transformer(ViT)的图像特征模型,采用自监督DINOv2方法在LVD-142M数据集上预训练
基于视觉Transformer(ViT)的自监督图像特征模型,采用DINOv2方法在LVD-142M数据集上预训练,适用于图像分类和特征提取任务。
基于视觉Transformer(ViT)的巨型图像特征提取模型,采用自监督DINOv2方法在LVD-142M数据集上预训练
基于Vision Transformer(ViT)的图像特征模型,采用自监督DINOv2方法在LVD-142M数据集上预训练