AIBase
首頁
AI 資訊
AI 產品庫
GEO 平台
MCP 服务
模型算力廣場
AI 全能力超市
TW

AI資訊

查看更多

長文本理解新王者?Gemini2.5Pro 擊敗 o3領跑 Fiction.Live 基準測試

在最近的 Fiction.Live 基準測試中,Gemini2.5Pro 在理解和再現複雜故事和背景方面表現出色,領先於競爭對手 OpenAI 的 o3模型。這項測試遠超傳統的“大海撈針”式任務,專注於模型在海量上下文中處理深層語義和背景依賴信息的能力。據測試數據顯示,在上下文窗口長度達到192,000個詞條(約14.4萬個單詞)時,o3模型性能急劇下滑,而 Gemini2.5Pro 的6月預覽版(preview-06-05)在同一條件下依然保持了超過90% 的準確率。值得注意的是,OpenAI 的 o3模型在8K 代幣以下保持完美準確率,但當上下文擴展至1

13.5k 17 小時前
長文本理解新王者?Gemini2.5Pro 擊敗 o3領跑 Fiction.Live 基準測試

模型

查看更多

Fiction.live Kimiko V2 70B GGUF

TheBloke

F

Fiction Live Kimiko V2 70B 是一個基於 Llama 2 架構的大型語言模型,提供多種量化格式,適用於不同推理場景。

自然語言處理TransformersTransformers英語
TheBloke
868
13
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商務合作網站地圖