グーグルは「TorchTPU」計画を推進しており、PyTorchフレームワークに対するTPUチップの互換性を向上させることで、開発者がNVIDIA GPUからグーグルのTPUに移行する際のコストを低下させることが目的です。この動きは、AIチップ分野におけるNVIDIAの支配的地位を挑戦し、PyTorchとNVIDIA CUDAの深い結合を破るものです。
NVIDIAとSynopsysが戦略的提携を発表。GPU加速計算・AI・デジタルツイン技術を統合し、設計エンジニアリング能力を強化。NVIDIAは20億ドルでSynopsys株を取得。CUDAプラットフォームとEDAツールの連携により開発プロセスを加速。....
AppleのMLXフレームワークがCUDAサポートを追加し、NVIDIA生態系への歩み寄りを示した。AI市場での優位性確保のため、開発者がNVIDIA GPUで訓練したモデルをAppleデバイスに展開可能に。500万人の開発者を抱えるCUDA生態系への戦略転換。....
AppleのMLXフレームワークがCUDA対応を追加、Macで開発したAIアプリをNVIDIAプラットフォームに移行可能に。Metal依存の制限を解消し、開発コスト削減と展開柔軟性を実現。....
WoolyAIは、CUDA実行とGPUのデカップリングによって、無制限のAIインフラストラクチャ管理を実現する技術です。
AI駆動のCUDAコード最適化プラットフォーム。GPUのパフォーマンスを迅速に向上させ、複雑なコードを手動で最適化する必要はありません。
DeepGEMMは、効率的なFP8行列乗算のためのCUDAライブラリであり、細粒度スケーリングと様々な最適化技術をサポートしています。
AI技術を活用した、自然な効果を実現する強力な動画置換?編集ソフトウェアです。
DevQuasar
これはByteDance-Seed/cudaLLM-8Bの量子化バージョンで、モデル圧縮技術を通じて大規模言語モデルをより簡単にデプロイし使用できるようにし、「知識を誰もが利用できるようにする」という理念を実現します。
prithivMLmods
cudaLLM-8BはByteDance Seedによって開発された専門の言語モデルで、高性能かつ構文が正しいCUDAカーネルコードを生成するために特別に設計されています。Qwen3-8B基礎モデルをベースに構築され、監督微調整と強化学習の2段階のトレーニングを通じて、開発者が効率的なGPU並列プログラミングコードを記述するのを支援することができます。
lmstudio-community
Kevin 32BはCognition AIによって開発された大規模言語モデルで、超長コンテキスト(40960トークン)をサポートし、CUDAカーネル生成と強化学習タスクに特化しています。
nvidia
BigVGANは大規模トレーニングに基づく汎用ニューラルボコーダで、メルスペクトログラムを高品質な波形に変換できます。v2バージョンではカスタムCUDAカーネルによる推論加速とトレーニングデータの多様性拡張が行われています。
OpenSCADに基づくMCPサーバーで、AIを通じて多視点画像を生成し、パラメトリック3Dモデルに再構成し、リモートCUDAアクセラレーション処理をサポートしています。
OpenSCAD MCPサーバーは、テキストまたは画像からパラメトリック3Dモデルを生成するサービスで、多視点再構成、AI画像生成、リモートCUDA処理、ワークフロー承認をサポートし、最終的にOpenSCAD互換のモデルファイルを出力します。