グーグルは「TorchTPU」計画を推進しており、PyTorchフレームワークに対するTPUチップの互換性を向上させることで、開発者がNVIDIA GPUからグーグルのTPUに移行する際のコストを低下させることが目的です。この動きは、AIチップ分野におけるNVIDIAの支配的地位を挑戦し、PyTorchとNVIDIA CUDAの深い結合を破るものです。
AI技術でAppleデバイスの性能向上、Metalカーネル最適化によりPyTorch推論速度87%アップ、平均1.87倍高速化。215モジュールでテスト。....
PyTorch 2.8が正式リリースされ、Intel CPU上での量子化大規模言語モデルの推論性能が向上。A16W8などの量子化モードをサポートし、レイテンシが20%以上削減。Intel GPU分散バックエンドの実験的サポートも追加。その他、SYCLサポート強化、XPUデバイスにA16W4モード追加、libtorch ABI安定化など。....
説明はありません
Fluxは、GPU上のテンソル/エキスパート並列化のための高速通信オーバーラップライブラリです。
V3/R1における計算と通信のオーバーラップ戦略を分析し、深層学習フレームワークの性能分析データを提供します。
PyTorchベースの音楽、楽曲、オーディオ生成ツールキット。高品質オーディオ生成に対応
Google Researchが開発した事前学習済み時系列予測モデルです。
pytorch
これはPyTorchチームがtorchaoを使用して量子化したQwen3-8Bモデルで、int4の重みのみの量子化とAWQアルゴリズムを採用しています。このモデルはH100 GPU上で53%のVRAM使用量を削減し、1.34倍の高速化を実現し、mmlu_abstract_algebraタスクに特化したキャリブレーション最適化が行われています。
これはPyTorchチームによって開発されたFP8量子化バージョンのGemma-3-27Bモデルで、google/gemma-3-27b-itに基づいてFP8量子化処理が行われています。このモデルはvLLMとTransformersの2つの方法で効率的な推論をサポートし、モデルの品質を維持しながらメモリ使用量を大幅に削減し、推論速度を向上させています。
minpeter
これは🤗 Transformersライブラリに基づいて構築された、kozistr/pytorch_optimizer内のMuon実装エラーを検出するための専用の学習モデルです。このモデルは、オプティマイザー実装内の潜在的な問題を識別および特定し、開発者がコード品質を改善するのを支援します。
FlameF0X
SnowflakeCore-G1-Tiny2は、GPTスタイルのカスタムTransformer言語モデルで、SnowflakeCore-G1-Tinyの改良版です。このモデルはPyTorchを使用してゼロから構築され、common-pile/wikimedia_filteredデータセットで訓練され、約4億のパラメータを持ち、2048トークンのコンテキストウィンドウをサポートし、テキスト生成タスク用に設計されています。
SmolLM3-3B-INT8-INT4は、HuggingFaceTB/SmolLM3-3Bモデルを量子化したバージョンで、torchaoを使用して8ビット埋め込み、8ビット動的活性化、および4ビット重みの線形量子化を実現しています。このモデルはExecuTorch形式に変換され、最適化によりCPUバックエンドで高性能を実現し、特にモバイルデバイスへのデプロイに適しています。
unsloth
KernelLLMは、Llama 3.1 Instructをベースに特別に訓練された大規模言語モデルで、Tritonを使用したGPUカーネルの記述に特化しています。このモデルは、PyTorchモジュールを効率的にTritonカーネルに変換し、GPUプログラミングをより普及しやすく、効率的にします。
Tournesol-Saturday
PyTorchベースのCBCT画像歯科分割モデル、領域認識ガイダンス学習を用いた半教師あり分割を実現
sicto
SICTOボーカル分離器は、PyTorchフレームワークに基づいて開発された高品質のボーカル分離モデルで、音楽オーディオから明瞭なボーカル部分を抽出するために特別に設計されています。このモデルはmusdb18hqデータセットで訓練され、音楽制作やオーディオエディットに専門レベルのボーカル分離効果を提供することができます。
ABDALLALSWAITI
これはShakker-Labs/FLUX.1-dev-ControlNet-Union-Pro-2.0モデルのFP8量子化バージョンで、PyTorchネイティブFP8サポートにより元のBFloat16フォーマットから量子化され、推論性能が最適化されています。
castiello
PyTorchベースのFPN画像セグメンテーションモデル、複数のエンコーダーアーキテクチャをサポート、セマンティックセグメンテーションタスクに適応
therarelab
PyTorchベースの動作認識モデルで、ロボット技術分野に適しています
facebook
Llama 3.1 Instructベースの8Bパラメータ大規模言語モデルで、Tritonを使用したGPUカーネルタスクの記述に特化して訓練されており、PyTorchモジュールをTritonカーネルに変換可能
jclinton1
Diffusion Policyは拡散戦略に基づくロボット制御モデルで、PyTorchで実装されHugging Faceのモデルハブに統合されています。
Metaが発表したPyTorchフレームワークに基づく事前学習言語モデルで、非商業研究用途に適しています。
Metaが発表したPyTorchベースの事前学習言語モデルで、非商業研究用途に適しています
Metaが提供するPyTorchベースの事前学習済み言語モデル、FAIR非営利研究ライセンスに準拠
waleko
このモデルは画像から画像への変換を行うPyTorchモデルで、PytorchModelHubMixinを介してHubに統合・プッシュされています。
Matiullah2401592
PyTorchベースのDeepLabV3Plus画像セグメンテーションモデル、効率的なセマンティックセグメンテーションタスクをサポート
PyTorchベースのDeepLabV3Plus画像セグメンテーションモデル、複数のエンコーダアーキテクチャをサポート
Diamantis99
PyTorchベースのUnet画像セグメンテーションモデル、複数のエンコーダーアーキテクチャと事前学習済み重みをサポート
PyTorchドキュメントの意味検索用のコマンドラインツールのプロトタイプです。現在、設計上の問題で開発を一時停止しています。
PyTorch Lightningフレームワークを構造化APIを通じてツール、エージェント、オーケストレーションシステムに公開するMCPサーバーで、トレーニング、チェック、検証、テスト、予測、およびモデルチェックポイント管理などの機能をサポートします。
PyTorchのCI/CDデータ分析ツールライブラリとMCPサービス