ai9stars
AutoTritonは80億のパラメータを持つTritonプログラミングモデルで、Seed - Coder - 8B - Reasoningモデルに基づき、教師付き微調整と強化学習によって訓練されました。これは強化学習によって駆動され、Tritonプログラミングに特化した最初のモデルで、計算ユニット、メモリ管理、並列性などの複雑なカーネル開発タスクを自動的に最適化することができます。
unsloth
KernelLLMは、Llama 3.1 Instructをベースに特別に訓練された大規模言語モデルで、Tritonを使用したGPUカーネルの記述に特化しています。このモデルは、PyTorchモジュールを効率的にTritonカーネルに変換し、GPUプログラミングをより普及しやすく、効率的にします。
lmstudio-community
KernelLLMはLlama 3.1 Instructをファインチューニングしたモデルで、Tritonを使用したGPUカーネルの記述に特化しています。
facebook
Llama 3.1 Instructベースの8Bパラメータ大規模言語モデルで、Tritonを使用したGPUカーネルタスクの記述に特化して訓練されており、PyTorchモジュールをTritonカーネルに変換可能
Forge MCPサーバーは、32の並列AIエージェントを通じて、PyTorchモデルを高性能なCUDA/Tritonカーネルに自動的に最適化するツールです。推論速度を最大14倍に向上させることができ、さまざまなMCP互換のAIプログラミングアシスタントをサポートしています。