このほど、メイティーは最新のオープンソースの大規模言語モデルLongCat(ロングキャット)を正式に発表しました。このモデルは人工知能技術の発展と応用を推進することを目的としています。このモデルのリリースは、メイティーがAI分野でまた一つ重要な進展を遂げたことを示すだけでなく、開発者や研究者にとって強力な新しいツールも提供しています。

LongCatのコアバージョンLongCat-Flashには560億のパラメータがあり、その中心的な利点は画期的な混合専門家(MoE)アーキテクチャです。このアーキテクチャは動的な計算メカニズムによって、文脈に応じて18.6B〜31.3Bのパラメータ(平均で約27B)のみをアクティブ化し、計算効率を大幅に最適化します。これにより、LongCatは推論プロセスにおいて1秒あたり100以上のトークンを処理する能力を持ち、優れた性能を示しています。

QQ20250901-091618.png

技術実装において、メイティーはモデルのトレーニングの安定性と拡張性に特に注力をしています。一連の最適化戦略を通じて、LongCatは10万を超えるアクセラレーターの規模で効率的にトレーニングでき、低遅延の推論が可能です。また、モデル設計ではパラメータのアクティブ配分の動的管理が考慮されており、異なるタスクでの計算負荷が均等になるようにしています。

モデルの能力向上のために、LongCatは多段階トレーニングパイプラインを採用しています。初期トレーニングでは基本モデルを構築し、データ統合戦略によって最適化を行います。後期トレーニングではさらに推論および符号化能力を強化し、文脈長を128kまで拡張してより複雑なタスクに対応できるようにしています。

評価結果によると、LongCatは多くのベンチマークテストにおいて業界をリードするモデルと同等の性能を示しており、特にMMLU、数学的推論、一般推論などの分野で高い正確性を示しています。これらの成果は、LongCatの技術的実力を証明するだけでなく、実際の応用における潜在能力にも基盤を築いています。

メイティーは、LongCatという強力なモデルを公開することで、AI技術の共有と発展を促進し、より多くの開発者に利便性を提供したいと考えています。これにより、業界全体の進歩を促進するでしょう。LongCatのオープンソース化は、将来のAI応用にとって強力なサポートとなるでしょう。

住所:https://longcat.chat/