从编码到创意写作 xAI Grok-3 击败 GPT4.5全能登顶大模型竞技场
xAI 最近发布了一则激动人心的消息,其最新 AI 模型 Grok-3在 Chatbot Arena 排行榜上表现突出。这款模型被命名为“grok-3preview-02-24”,在多个关键领域展现了卓越性能。 xAI 的 Grok-3-Preview-02-24就以1分的微弱优势超越 GPT4.5-Preview。Grok-3获得了超过3,000票,并总体上与第一名并列。它在困难提示、编码任务、数学问题、创意写作、指令遵循以及处理较长查询方面表现尤为出色。Chatbot Arena 是一个通过人类偏好进行大规模语言模型(LLM)评估的众包平台,使用 Elo 评级系统为模型排名,提供全面的性