Cerebras Systemsは2026年に上場に成功し、IPOで55億ドルを調達。時価総額は約600億ドルまで急騰し、創設者は富豪となった。同社は2016年に設立され、人工知能チップの製造に特化しているが、2019年には破産寸前になり、月々の支出は800万ドルに上り、資金はほぼ尽きた。
AIチップ会社であるCerebrasは、OpenAIと3年間で1億ドルを超える大規模な取引を締結しました。この規模は年初の契約の2倍であり、OpenAIが同社技術に対して高い信頼を持っていることを示しています。OpenAIはCerebrasのデータセンター開発に約10億ドルを提供するとともに、最大10%の少数株式購入権を取得し、戦略的協力を深化させることになりました。
OpenAIはCerebrasと新たに合意し、今後3年間で2000億ドル以上をサーバー演算能力購入に充て、株式取得の可能性も。既存の協力を拡大し、データセンター開発にも約100億ドルを支援、総支出は3000億ドルに達する見込み。....
OpenAIはCerebrasと長期的なパートナーシップを結び、3年以内にそのチップサーバーを使用するために200億ドル以上を投資する予定で、計算コストを低下させ、NVIDIAへの依存を減らすことを目的としており、パフォーマンスの自律化への決意を示している。
世界最速のAIリアルタイム推論ソリューション。
bartowski
これはREAP方法を用いてMiniMax-M2の専門家を均一に25%裁剪した172Bパラメータの大規模言語モデルで、llama.cppに特化して最適化された量子化処理が施されており、複数の量子化レベルをサポートし、LM Studioやllama.cppベースのプロジェクトで動作します。
これはREAP方法に基づいて、MiniMax-M2の40%の専門家を均等に剪定して得られた139Bパラメータの大規模言語モデルです。GLMアーキテクチャと専門家混合(MoE)技術を採用し、llama.cppを通じて様々な量化処理を行い、テキスト生成タスクに適しています。
DevQuasar
このプロジェクトでは、cerebras/MiniMax-M2-REAP-172B-A10Bモデルの量子化バージョンを提供しており、知識を大衆に利用してもらうことを目指しています。これは1720億パラメータの大規模言語モデルで、最適化と量子化処理が施されており、デプロイコストの削減と推論効率の向上を目的としています。
cerebras
MiniMax-M2-REAP-162B-A10BはMiniMax-M2の高効率圧縮バージョンで、REAP(ルーティング重み付き専門家活性化枝刈り)手法を採用し、性能をほぼ維持したままモデルサイズを30%削減し、230Bパラメータから162Bパラメータに圧縮し、メモリ要件を大幅に削減しました。
MiniMax-M2-REAP-172B-A10BはMiniMax-M2のメモリ効率の高い圧縮バリアントで、REAP専門家枝刈り方法を採用し、性能をほぼ維持したまま、モデルサイズを25%軽減し、230Bパラメータから172Bパラメータに圧縮しました。
noctrex
これはGLM-4.5-Air-REAP-82B-A12BモデルのMXFP4_MOE量子化バージョンで、テキスト生成タスクに特化して最適化されています。このモデルはcerebrasのGLM-4.5-Air-REAP-82B-A12B基礎モデルに基づいており、MXFP4ハイブリッドエキスパート量子化技術によって実現され、性能を維持しながらモデルサイズと推論コストを大幅に削減しています。
danielus
このモデルはcerebras/Qwen3-Coder-REAP-25B-A3BのGGUF形式に変換されたバージョンで、llama.cppツールを使用して形式変換と量子化処理を行っています。元のモデルは25Bパラメータの大規模言語モデルで、コード生成タスクに特化して最適化されています。
これはCerebras社のQwen3-Coder-REAP-25B-A3Bモデルの定量版で、llama.cppのimatrix技術を使用して定量処理を行い、モデルの保存スペースと計算リソースの要件を減らしながら、モデルの性能を維持することができます。
GLM-4.5-Air-REAP-82B-A12BはGLM-4.5-Airの効率的な圧縮バージョンで、REAP剪定技術を通じてパラメータ規模を106Bから82Bに圧縮し、メモリ要件を25%削減しながら、ほぼ損失のない性能を維持しています。
RedHatAI
MetaのLlama-2-7Bモデルをベースに、UltraChat 200kデータセットを使用してチャットタスク用に微調整された言語モデルです。このモデルはNeural MagicとCerebrasが共同開発し、高効率な疎水化転移と推論の高速化をサポートしています。
preemware
Cerebras-GPT-6.7Bをファインチューニングしたサイバーセキュリティ専用モデルで、基本的な対話能力を備えています
BTLM-3B-8k-chatはBTLM-3B-8K-baseを基に開発されたチャットバージョンで、DPO手法を用いて最適化され、人間の嗜好に合った対話シナリオ向けに設計されています。
BTLM-3B-8k-baseは8kコンテキスト長を持つ30億パラメータの言語モデルで、6270億トークンのSlimPajamaデータセットでトレーニングされ、オープンソースの70億パラメータモデルに匹敵する性能を発揮します。
Cerebras-GPT 13Bは、オープンアーキテクチャとデータセットに基づいて訓練された大規模言語モデルで、Cerebras-GPTシリーズに属し、大規模言語モデルのスケーリング法則を研究し、Cerebrasのソフトウェアとハードウェアスタックでの訓練の簡易性と拡張性を示すことを目的としています。
Cerebras-GPT 2.7BはTransformerアーキテクチャに基づく言語モデルで、大規模言語モデルの研究を支援することを目的としており、自然言語処理などの分野の基礎モデルとして利用できます。
Cerebras-GPT 590MはTransformerアーキテクチャに基づく言語モデルで、Cerebras-GPTモデルファミリーに属し、大規模言語モデルの拡張規則を研究し、Cerebrasのソフトウェアとハードウェアスタックで大規模言語モデルをトレーニングする際の簡便性と拡張性を示すことを目的としています。
Cerebras-GPTシリーズの111Mパラメータモデルで、GPT-3スタイルのアーキテクチャを採用し、The Pileデータセットでトレーニングされ、Chinchillaスケーリング則に従って計算最適化を実現しています。