最高のMetaCLIP AIツールモデル_厳選MetaCLIP情報

AI製品

MetaCLIP

データ品質と透明性に重点を置いた、画像とテキストデータのための高度な機械学習モデルです。

画像認識

10.1k

モデル

Metaclip 2 Worldwide Huge Quickgelu

facebook

MetaCLIP 2 (worldwide) は、Transformerアーキテクチャに基づく多言語ゼロショット画像分類モデルで、世界中のビジュアル言語理解タスクをサポートし、トレーニングなしで画像を分類する能力を実現します。

Webssl Dino7b Full8b 518

facebook

80億のMetaCLIPデータで訓練された70億パラメータの視覚Transformerモデル、DINOv2自己監視学習フレームワークを採用、言語監視不要

Webssl Dino300m Full2b 224

facebook

20億MetaCLIPデータに基づく224解像度の視覚Transformerモデル、DINOv2自己教師あり学習手法でトレーニング

Webssl Dino3b Heavy2b 224

facebook

20億規模の厳選MetaCLIPデータで訓練された30億パラメータの視覚Transformerモデル、DINOv2自己教師あり学習フレームワークを採用

コンピュータビジョン

Transformers

facebook

Vit_gigantic_patch14_clip_224.metaclip_2pt5b

timm

MetaCLIP-2.5Bデータセットで訓練されたデュアルフレームワーク互換の視覚モデルで、OpenCLIPとtimmフレームワークをサポート

Vit_huge_patch14_clip_224.metaclip_2pt5b

timm

MetaCLIP-2.5Bデータセットで訓練されたデュアルユースの視覚言語モデル、ゼロショット画像分類タスクをサポート

Vit_large_patch14_clip_224.metaclip_2pt5b

timm

MetaCLIP-2.5Bデータセットでトレーニングされたデュアルフレームワーク互換の視覚モデルで、ゼロショット画像分類タスクをサポート

Vit_large_patch14_clip_224.metaclip_400m

timm

MetaCLIP-400Mデータセットで訓練された視覚トランスフォーマーモデル、ゼロショット画像分類タスクをサポート

Vit_base_patch16_clip_224.metaclip_2pt5b

timm

MetaCLIP-2.5Bデータセットで訓練されたデュアルフレームワーク互換の視覚モデルで、OpenCLIPとtimmフレームワークをサポート

Vit_base_patch16_clip_224.metaclip_400m

timm

MetaCLIP-400Mデータセットで訓練されたデュアルフレームワーク互換の視覚モデルで、OpenCLIPとtimmフレームワークをサポート

Vit_base_patch32_clip_224.metaclip_2pt5b

timm

MetaCLIP-2.5Bデータセットで訓練されたVision Transformerモデルで、open_clipとtimmフレームワークと互換性があります

Vit_base_patch32_clip_224.metaclip_400m

timm

MetaCLIP-400Mデータセットで訓練された視覚言語モデルで、ゼロショット画像分類タスクをサポート

Metaclip L14 400m

facebook

MetaCLIPはCommonCrawlデータでトレーニングされた視覚-言語モデルで、画像とテキストの共有埋め込み空間を構築します。

Metaclip L14 Fullcc2.5b

facebook

MetaCLIPはCommonCrawl(CC)25億データポイントでトレーニングされた大規模視覚-言語モデルで、CLIPのデータ選別方法を解明

Metaclip B16 400m

facebook

MetaCLIPはCommonCrawlデータで訓練された視覚-言語モデルで、画像-テキスト共有埋め込み空間を構築するために使用されます

マルチモーダル

Transformers

facebook

Metaclip B16 Fullcc2.5b

facebook

MetaCLIPはCommonCrawlデータに適用されるCLIPフレームワークの実装で、CLIP訓練データの選択方法を明らかにすることを目的としています。

Metaclip H14 Fullcc2.5b

facebook

MetaCLIPはCommonCrawlデータに基づく視覚-言語モデルで、データ選別方法の改善によりCLIPモデルの性能を向上

Metaclip B32 Fullcc2.5b

facebook

MetaCLIPはCommonCrawl(CC)の25億データポイントで訓練された視覚-言語モデルで、画像-テキスト共有埋め込み空間を構築します。

Metaclip B32 400m

facebook

MetaCLIP基本モデルはCommonCrawlデータでトレーニングされた視覚-言語モデルで、画像-テキスト共有埋め込み空間を構築します。

未来を力づける、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

ビジネス協力サイトマップ