CLaMP 3は、クロスモーダルかつクロスリンガルの音楽情報検索のための統合フレームワークです。
Anthropic
$21
入力トークン/百万
$105
出力トークン/百万
200
コンテキスト長
Openai
$7.7
$30.8
$525
$1050
128
Xai
$420
$1.75
$8.75
Iflytek
$2
-
8
Tencent
$1.05
$4.2
01-ai
4
Baichuan
SherryXTChen
InstructCLIPは対照学習を通じてデータを自動最適化するモデルで、命令誘導の画像編集効果を向上させることを目的としています。
Instruct-CLIP は、命令誘導の画像編集タスクを最適化するための対照学習ベースのモデルです。
nomic-ai
これは多言語混合専門家(MoE)テキスト埋め込みモデルの中間バージョンで、多段階の対照学習によって得られました
uta-smile
InstructCIRは命令認識型対照学習に基づく組み合わせ式画像検索モデルで、ViT-L-224とPhi-3.5-Miniアーキテクチャを採用し、画像テキストからテキスト生成タスクに特化しています。
microsoft
LLM2CLIPは、大規模言語モデル(LLM)を活用してCLIPの潜在能力を解放する革新的な手法で、対照学習フレームワークを通じてテキスト識別性を向上させ、元のCLIPテキストエンコーダーの制限を突破します。
LLM2CLIPは大規模言語モデル(LLM)を活用してCLIPの能力を拡張する革新的な手法で、対照学習フレームワークを通じてテキストの識別性を向上させ、クロスモーダルタスクの性能を大幅に向上させます。
LLM2CLIPは大規模言語モデル(LLM)を活用してCLIPモデルの能力を強化する手法で、対照学習によるLLMのファインチューニングを行い、CLIPの視覚エンコーダーの教師モデルとして機能させることで、クロスモーダルタスクの性能を大幅に向上させます。
conservationxlabs
MiewID-msv3は、64種の陸上および水生野生種を含む大規模高品質データセット上で個体再識別を行うための、対照学習で訓練された特徴抽出器です。
Marqo
Marqo-FashionCLIPはCLIPアーキテクチャを基にしたファッション分野の多モーダル検索モデルで、一般化対照学習によりファッション製品検索タスクで最先端の性能を達成しています。
MiewID-msv2 は対照学習で訓練された野生動物個体再識別の特徴抽出器で、54種の陸生・水生動物の識別をサポートします。
mlsa-iai-msu-lab
SciRus-tinyはロシア語と英語の科学テキスト埋め込みベクトルを取得するための小型モデルで、eLibraryデータでトレーニングされ、対照学習技術を採用しています。
aurelio-ai
X-CLIPはCLIPのミニマルな拡張で、一般的なビデオと言語の理解のために、ビデオとテキストのマッチング関係を対照学習でトレーニングします。
AIDA-UPM
STARは、ソーシャルメディアの執筆スタイル理解のための教師あり対照学習事前学習トランスフォーマーモデルです。
librarian-bots
SetFitフレームワークに基づく少数ショット学習のテキスト分類モデルで、対照学習と分類ヘッドのトレーニングにより効率的な分類を実現
BiomedCLIPは、PMC-15Mデータセットで対照学習により事前学習された生物医学視覚言語基盤モデルで、クロスモーダル検索、画像分類、視覚的質問応答などのタスクをサポートします。
X-CLIPはCLIPの拡張版で、一般的なビデオと言語の理解のために、ビデオとテキストのペアで対照学習によって訓練されています。
X-CLIPはCLIPのミニマルな拡張で、汎用ビデオ-言語理解のために設計されています。モデルは対照学習により(ビデオ、テキスト)ペアでトレーニングされます。
X-CLIPはCLIPの拡張版で、ビデオと言語の汎用的な理解のために、ビデオとテキストのペアで対照学習を行い、ビデオ分類やビデオ-テキスト検索タスクに適しています。
X-CLIPはCLIPのミニマルな拡張で、汎用的なビデオ言語理解のために、(ビデオ、テキスト)ペアの対照学習方式でトレーニングされています。
X-CLIPはCLIPを拡張したもので、ビデオと言語の汎用的な理解のために、対照学習を通じてビデオ分類とビデオ-テキスト検索タスクを実現します。