Deepmark KI ist ein Benchmark-Tool zur Evaluierung großer Sprachmodelle (LLMs). Es ermöglicht die Bewertung verschiedener, aufgabenbezogener Metriken auf eigenen Daten. Es ist vorintegriert mit führenden generativen KI-APIs wie GPT-4, Anthropic, GPT-3.5 Turbo, Cohere und AI21.