百度文心X1.1在SuperCLUE-CPIF中文指令遵循測評中以75.51分位列國產大模型第一。該基準評估10個國內外知名模型在中文複雜指令執行能力,包括GPT-5、DeepSeek等,重點關注任務類型與指令遵循表現。