微博がオープンソースのVibe Thinkerをリリース:150億パラメータでDeepSeek R1を下回る訓練コストは7800ドル
微博がオープンソースの巨大モデルVibe Thinkerを発表しました。150億パラメータながら、数学コンテストのベンチマークテストでは6,710億パラメータのDeepSeek R1を打ち勝ち、正確性が高いうえに、訓練コストはわずか7,800ドルです。軽量MoEアーキテクチャと知識蒸留技術を採用し、5GBの数学データセットだけで微調整可能です。Hugging Faceからダウンロード可能で商用利用も可能です。このモデルはAIMEなどの国際的な数学コンテストでも優れた実績を収めています。