Deepmark AIは、大規模言語モデル(LLM)の評価に使用されるベンチマークツールです。独自のデータ上で、様々なタスク固有の指標を評価できます。GPT-4、Anthropic、GPT-3.5 Turbo、Cohere、AI21などの主要な生成AI APIと事前に統合されています。