百度文心X1.1在SuperCLUE-CPIF中文指令遵循测评中以75.51分位列国产大模型第一。该基准评估10个国内外知名模型在中文复杂指令执行能力,包括GPT-5、DeepSeek等,重点关注任务类型与指令遵循表现。