階躍星辰開源320億參數深度研究模型Step-DeepResearch,能在開放環境中自主探索信息並生成專業報告。其研究能力接近OpenAI o3-mini等頂級商業模型,但部署成本僅爲傳統模型的十分之一,單次調用成本低於0.5元人民幣。
美團M17團隊推出Meeseeks評測基準,旨在評估大型語言模型如OpenAI、Claude3.5Sonnet等的指令遵循能力,解決模型輸出內容雖好但未滿足具體格式或內容要求的問題。
OpenAI發佈200億參數開源模型gpt-oss-20b,首次實現驍龍終端本地運行。該模型性能媲美o3-mini,通過高通AI Stack優化後,可在移動設備上提供快速響應和隱私保護。開發者可通過Hugging Face等平臺獲取,支持Turbo模式體驗。這標誌着AI推理從雲端向終端遷移的重要突破,爲智能應用發展開闢新可能。
開源大模型XBai o4發佈,創新採用"反思型生成範式",結合Long-CoT強化學習和過程評分學習,顯著提升複雜推理能力並降低99%推理耗時。該模型提供三種模式,其中Medium模式全面超越OpenAI o3-mini,部分測試優於Claude Opus。已在GitHub開源訓練評估代碼,推動開源大模型在複雜推理領域的發展。
OpenAI o3-mini 是 OpenAI 推出的最新高性價比推理模型,專為 STEM 領域優化。
Openai
$7.7
輸入tokens/百萬
$30.8
輸出tokens/百萬
200
上下文長度
$0.4
-
128
Alibaba
$2
32
Baichuan
$21
$84
一個通過MCP協議直接查詢OpenAI模型的服務器,支持o3-mini和gpt-4o-mini模型,提供簡潔和詳細的回答。