微软Bing团队开源词嵌入模型Harrier,支持超100种语言,在MTEB v2基准测试中表现优异。模型基于20亿示例及GPT-5合成数据训练,采用32,000词元上下文窗口,具备27亿参数,显著提升多语言任务准确性与灵活性。
微软必应团队开源全新词嵌入模型系列Harrier,包含三个版本,其中27B旗舰模型在多语言基准测试中超越OpenAI、亚马逊和谷歌Gemini等主流专有模型,位居榜首。该模型支持超100种语言,上下文窗口达32,000词,旨在重塑搜索、检索及AI代理的底层逻辑。