テスラの生産計画変更により、サムスンの2nmラインのスケジュールが調整され、韓国AIチップ企業DeepXの次世代NPUチップDX-M2の量産が半年遅れ、2026年第3四半期以降のテスト開始が見込まれる。これは半導体ファウンドリー業界における大口顧客優先のスケジューリングが中小企業に与える影響を浮き彫りにしている。....
ASUSがUGen300 AIアクセラレータカードを発表。USB 3.1 Gen2接続で40 TOPSのAI推論性能を提供し、Hailo-10H NPU搭載で低消費電力(2.5W)を実現。8GBメモリ内蔵で大規模事前学習モデルの直接実行をサポート。....
Liquid AIが新たに小型基盤モデルLFM2.5を発表。エッジデバイスやオンプレミス向けに設計され、基本版と指示版、日本語・視覚言語・音声言語バリエーションを含む。LFM2ハイブリッドアーキテクチャを基にCPU・NPU最適化で高速推論を実現。Hugging Faceでオープンソース公開。....
Windows 11のAIコンポーネントの詳細な更新ログを提供し、ローカルAIモデルのサイレント更新を追跡可能に。Copilot+ PCのローカルAI体験を支えるNPU対応機能で、意味解析や画像処理などをカバー。....
新世代Snapdragon Xシリーズは、NPUを搭載し、クリエイターに革新的なツールを提供します。
ゼロコストのデバイス側AIを構築します。
インテル神経処理ユニット(NPU)向けアクセラレーションライブラリ
Openai
$0.63
入力トークン/百万
$3.15
出力トークン/百万
131
コンテキスト長
Huawei
-
32
Alibaba
Google
$0.14
$0.28
$0.7
$1.4
$0.35
Deepseek
$1
8
$2
128
Baichuan
$1.05
$4.2
1k
NexaAI
Qwen3-VL-4B-Instructは、アリババクラウドのQwenチームが開発した40億パラメータの命令調整済みマルチモーダル大規模言語モデルで、高通NPU用に最適化されており、強力なビジュアル言語理解能力と対話微調整機能を融合させ、チャット推論、文書分析、ビジュアル対話などの実際のアプリケーションシーンに適しています。
amd
Llama-3.1-8B-onnx-ryzenai-npuは、AMDがMetaのLlama-3.1-8Bモデルをベースに開発した最適化バージョンで、AMD Ryzen AI NPU向けに最適化されたデプロイが行われています。このモデルは、Quark量子化、OGAモデルビルダー、およびNPU専用の後処理技術を通じて、高品質なテキスト生成能力を維持しながら、AMDハードウェア上での推論効率を大幅に向上させています。
OmniNeuralは、世界初のニューラル処理ユニット(NPU)用に特別に設計された全マルチモーダルモデルで、テキスト、画像、音声をネイティブに理解し、PC、モバイルデバイス、自動車、IoT、ロボットなどの様々なデバイスで動作します。
FastFlowLM
これはMeta AIのLLaMA 3.1ベースモデルをベースにした派生モデルで、AMD Ryzen™ AI NPU上のFastFlowLMに特化して最適化されており、XDNA2アーキテクチャのみに対応しています。モデルはMetaが公開したコアアーキテクチャと重みを保持しており、特定のアプリケーションに合わせて微調整、量子化、または適合化されている可能性があります。
これはMeta AIがリリースしたLLaMA 3.2 1B Instructモデルの最適化バリエーションで、AMD Ryzen™ AI NPU(XDNA2アーキテクチャ)上のFastFlowLMに特化して最適化されています。モデルは元のアーキテクチャと重みを保持し、量子化、低レベルチューニングなどの技術を通じてNPU上での実行効率を向上させています。
stabilityai
AMD Ryzen™ AI最適化版SDXL-Turbo、世界初のBlock FP16フォーマット採用テキスト生成画像モデル、AMD XDNA™ 2 NPU専用設計
c01zaut
MiniCPM-V 2.6は単一画像、複数画像、動画理解をサポートするGPT-4Vレベルのマルチモーダル大規模言語モデルで、RK3588 NPU向けに最適化されています
Phi-3.5-mini-instructはマイクロソフトが開発した効率的な小型言語モデルで、先進的な量子化技術を用いて最適化され、NPUデプロイ向けに設計されています。このモデルはテキスト生成タスクで優れた性能を発揮し、自然言語処理とコード関連のシーンをサポートします。
本プロジェクトはMeta-Llama-3-8Bモデルに基づき、Quark量子化技術を採用し、OGAモデルビルダーを組み合わせ、後処理を行ってNPUデプロイに適合させ、テキスト生成タスクに使用できます。このモデルはAMD NPUハードウェア用に最適化されており、効率的な推論デプロイをサポートします。
Pelochus
このリポジトリは、Rockchipのrkllmツールキットで適応されたさまざまな大規模言語モデルを収集しており、RK3588 NPU向けに変換されたモデル専用です。