從編碼到創意寫作 xAI Grok-3 擊敗 GPT4.5全能登頂大模型競技場
xAI 最近發佈了一則激動人心的消息,其最新 AI 模型 Grok-3在 Chatbot Arena 排行榜上表現突出。這款模型被命名爲“grok-3preview-02-24”,在多個關鍵領域展現了卓越性能。 xAI 的 Grok-3-Preview-02-24就以1分的微弱優勢超越 GPT4.5-Preview。Grok-3獲得了超過3,000票,並總體上與第一名並列。它在困難提示、編碼任務、數學問題、創意寫作、指令遵循以及處理較長查詢方面表現尤爲出色。Chatbot Arena 是一個通過人類偏好進行大規模語言模型(LLM)評估的衆包平臺,使用 Elo 評級系統爲模型排名,提供全面的性