ByteDanceのSeed AIチームが数学推論モデル「Seed Prover1.5」を発表。国際数学オリンピックで金メダル相当の成績を達成し、Scaling Law理論に基づき16.5時間でIMO2025の5問中4問を解決。Google Geminiと同等の35点を獲得し、効率性が大幅に向上。....
DeepSeekがV3.2標準版と深度思考版を発表。V3.2は128kコンテキストでGPT-5と互角、深度思考版はGemini3Proと同等性能でIMO2025で金メダル水準を達成。スパースアテンション技術の採用により、長文処理の効率化とメモリ使用量削減を実現し、オープンソースモデル初の100万トークン単一GPU推論を可能にした。....
説明はありません
Huawei
-
入力トークン/百万
出力トークン/百万
コンテキスト長
imone
これはLlama 3 8Bベースモデルの修正版で、元のモデルで特殊トークンの重みがゼロによるNaN勾配問題を解決しました。
盤古αは鵬城実験室と技術チームが共同開発した26億パラメータの中国語事前学習言語モデルで、2048基の昇騰プロセッサで学習を完了し、強力なテキスト生成能力を備えています。