最高のWebSSL AIツールモデル_厳選WebSSL情報 - AIBase

AIニュース

もっと見る

Meta、WebSSLモデルを発表：言語不要のビジョン学習における新たな探求

人工知能の分野において、Meta社は最近、WebSSLシリーズモデルを発表しました。このシリーズモデルは、パラメータ規模が3億から70億と異なり、純粋な画像データに基づいてトレーニングされ、言語なしの監督によるビジョン自己教師あり学習（SSL）の可能性を探求することを目的としています。この新たな研究は、将来のマルチモーダルタスクに新たな可能性をもたらし、ビジョン表現の学習方法の理解についても新たな視点を与えてくれます。これまで、OpenAIのCLIPモデルは、ビジュアル質問応答（VQA）や文書理解などのマルチモーダルタスクにおける優れた性能で知られていました。

Meta、WebSSLモデルを発表：言語不要のビジョン学習における新たな探求

モデル

もっと見る

Webssl Dino7b Full8b 518

facebook

80億のMetaCLIPデータで訓練された70億パラメータの視覚Transformerモデル、DINOv2自己監視学習フレームワークを採用、言語監視不要

コンピュータビジョン

Transformers

Webssl Dino3b Full2b 224

facebook

これはDINOv2自己教師あり学習により20億のウェブ画像でトレーニングされた30億パラメータの視覚Transformerモデルで、言語監督なしで強力な視覚表現を学習できます。

コンピュータビジョン

Transformers

Webssl Dino7b Full8b 224

facebook

70億パラメータの視覚Transformerモデル、自己教師あり学習により80億のウェブ画像で訓練され、言語監督不要

コンピュータビジョン

Transformers

Webssl Dino5b Full2b 224

facebook

50億パラメータの視覚Transformerモデル、20億のウェブ画像による自己監視学習で訓練され、言語監視なしで様々な視覚タスクで優れた性能を発揮します。

コンピュータビジョン

Transformers

Webssl Dino2b Heavy2b 224

facebook

20億パラメータの自己教師あり視覚Transformerモデル、厳選されたウェブ画像データでトレーニングされ、特に図表とテキスト理解能力を最適化

コンピュータビジョン

Transformers

Webssl Dino2b Full2b 224

facebook

20億パラメータの視覚Transformerモデル、純粋な視覚的教師なし学習により20億のウェブ画像でトレーニングされ、マルチモーダルタスクで優れたパフォーマンスを発揮

コンピュータビジョン

Transformers

Webssl Dino2b Light2b 224

facebook

DINOv2自己教師あり学習フレームワークでトレーニングされた20億パラメータの視覚Transformerモデル、軽フィルタリングされたウェブ規模の画像データを使用（言語監督不要）。

コンピュータビジョン

Transformers

Webssl Dino7b Full8b 378

facebook

80億の言語注釈なしウェブ画像で訓練された70億パラメータの視覚Transformerモデル。自己教師あり学習により優れた視覚表現能力を実現

コンピュータビジョン

Transformers

Webssl Dino1b Full2b 224

facebook

これはDINOv2自己教師あり学習により20億のウェブ画像でトレーニングされた10億パラメータのVision Transformerモデルで、言語監督なしで視覚表現を学習できます。

コンピュータビジョン

Transformers

Webssl Dino300m Full2b 224

facebook

20億MetaCLIPデータに基づく224解像度の視覚Transformerモデル、DINOv2自己教師あり学習手法でトレーニング

コンピュータビジョン

Transformers

Webssl Mae700m Full2b 224

facebook

これは7億パラメータの視覚Transformerモデルで、マスク付き自己符号化器による自己教師あり学習手法を用いて、20億のウェブ画像で言語監督なしに訓練されています。

コンピュータビジョン

Transformers

Webssl Dino3b Heavy2b 224

facebook

20億規模の厳選MetaCLIPデータで訓練された30億パラメータの視覚Transformerモデル、DINOv2自己教師あり学習フレームワークを採用

コンピュータビジョン

Transformers

Webssl Dino3b Light2b 224

facebook

30億パラメータの視覚Transformerモデル、DINOv2自己教師あり学習手法を用いて軽フィルタリングされたウェブ規模画像データで訓練、言語監督不要。

コンピュータビジョン

Transformers

Webssl Mae1b Full2b 224

facebook

10億パラメータの視覚Transformerモデルで、マスク付き自己符号化器による自己教師あり学習方法で20億のウェブ画像でトレーニングされ、言語監督なしで視覚表現を学習できます。

コンピュータビジョン

Transformers

Webssl Mae300m Full2b 224

facebook

これは3億パラメータ規模の視覚Transformerモデルで、マスク付き自己符号化器による自己教師あり学習により20億枚のウェブ画像で訓練され、言語監督を必要としません。

コンピュータビジョン

Transformers

AIBase

未来を力づける、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

ビジネス協力サイトマップ