最好的星普大模型 AI工具模型_精選星普大模型資訊

AI資訊

百萬成本揭祕LLM訓練黃金法則，階躍星辰推出全領域適用的超參數優化工具

在人工智能的激烈競爭中，一場耗資百萬美元的大規模實驗正悄然改變着大語言模型的訓練方式。階躍星辰研究團隊日前發佈重磅研究成果，他們通過耗費近100萬NVIDIA H800GPU小時的算力，從零開始訓練了3，700個不同規模的模型，累計訓練了驚人的100萬億個token，揭示出一條被稱爲"Step Law"的普適性縮放規律，爲大語言模型的高效訓練提供了全新指南。這項研究不僅僅是對超參數優化的探索，更是第一個全面考察模型最優超參在不同形狀、稀疏度和數據分佈下穩定性的工作。研究結果表明，無

11.7k 2 小時前

新開普：星普大模型表現出色，算力消耗顯著降低

在最近的一次機構電話交流會上，新開普公司透露了其自研的星普大模型的最新測評結果。該模型採用了 SFT（監督微調）與 RL(強化學習)的訓練技術，在智能推理效果上與 DeepSeek-R1相近，且算力消耗僅爲 DeepSeek-R1的1/20。這一成果不僅彰顯了新開普在人工智能領域的研發實力，同時也爲降低硬件投入提供了可能。星普大模型的成功，不僅體現在其智能推理能力的提升上，更在於其高效的算力消耗。這一進展意味着，企業在部署此類模型時，所需的硬件投資大大降低，節約下來的算力預算可以

15.4k 昨天

AI日報：字節豆包大模型1.5Pro發佈；可靈AI推多圖參考功能；微信秒剪新增多項AI功能；特朗普啓動“星際之門”AI計劃

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。新鮮AI產品點擊瞭解：https://top.aibase.com/1、加量不加價！隨着AI行業競爭的加劇，開發大規模語言模型需要鉅額資金和頂尖人才，這使得Anthropic在市場中面臨更大的壓力。

12.9k 22 小時前

模型

Gemini 2.0 Flash-Lite

Google

$0.49

輸入tokens/百萬

$2.1

輸出tokens/百萬

上下文長度

GPT-4.1 mini

Openai

$2.8

輸入tokens/百萬

$11.2

輸出tokens/百萬

上下文長度

Grok 4 Fast

Xai

$1.4

輸入tokens/百萬

$3.5

輸出tokens/百萬

上下文長度

o3-mini

Openai

$7.7

輸入tokens/百萬

$30.8

輸出tokens/百萬

200

上下文長度

GPT-5 Codex

Openai

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Claude 3 Opus

Anthropic

$105

輸入tokens/百萬

$525

輸出tokens/百萬

200

上下文長度

Gemini 2.0 Flash

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

Claude Haiku 4.5

Anthropic

輸入tokens/百萬

$35

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash

Google

$2.1

輸入tokens/百萬

$17.5

輸出tokens/百萬

上下文長度

Claude Sonnet 4.5

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Claude 3 Sonnet

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash-Lite

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

qwen3-max

Alibaba

輸入tokens/百萬

$24

輸出tokens/百萬

256

上下文長度

qwen3-coder-plus

Alibaba

輸入tokens/百萬

$16

輸出tokens/百萬

上下文長度

Qianfan-Lightning

Baidu

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Doubao-Seed-Translation

Bytedance

$1.2

輸入tokens/百萬

$3.6

輸出tokens/百萬

上下文長度

Qwen3-Next-80B-A3B-Instruct

Alibaba

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

qwen3-omni-flash-realtime

Alibaba

$3.9

輸入tokens/百萬

$15.2

輸出tokens/百萬

上下文長度

Kimi-K2

Moonshot

輸入tokens/百萬

$16

輸出tokens/百萬

256

上下文長度

Doubao-Seed-1.6

Bytedance

$0.8

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商務合作網站地圖