Deepmark IA es una herramienta de evaluación comparativa para modelos de lenguaje extenso (LLM) que permite evaluar métricas específicas de la tarea en sus propios datos. Está preintegrada con las API de IA generativa líderes, como GPT-4, Anthropic, GPT-3.5 Turbo, Cohere y AI21.