推論と理解のための小型言語モデル
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
$0.7
$2.8
Anthropic
$7
$35
200
$17.5
$21
$105
Alibaba
-
$2
$20
$8
$240
52
Moonshot
$4
$16
256
Bytedance
Deepseek
$12
128
Tencent
$1
32
Baidu
Openai
$0.4
$0.75
openaccess-ai-collective
DPOpenHermes 7B v2はOpenHermes-2.5-Mistral-7Bを基にした2回目のRL微調整モデルで、直接選好最適化(DPO)による強化学習を行い、Intel/orca_dpo_pairsとallenai/ultrafeedback_binarized_cleanedの選好データセットを使用しています。
TheBloke
Orca 2 13Bは、MicrosoftがLLAMA - 2をベースにファインチューニングした大規模言語モデルで、GGUF形式の量子化ファイルを提供し、さまざまなハードウェア環境での効率的な推論をサポートします。
microsoft
Orca 2はマイクロソフトが開発した研究用言語モデルで、小型言語モデルの推論能力向上に焦点を当てています。
Orca 2はマイクロソフトが開発した研究用言語モデルで、小型言語モデルの推論能力向上に焦点を当て、LLAMA-2をファインチューニングして作成されました。