最高のNPU AIツールモデル_厳選NPU情報

AIニュース

グーグルがエッジ側AI開発ボードCoral Boardをリリース、Gemma3のローカル実行をサポート

2026年のGoogle I/Oで、エッジAI向けの小型シングルボードコンピュータ「Coral Board」を発表。RISC-VベースのオープンソースCoral NPUを搭載し、Synaptics Astra SL2619チップ、2GHzデュアルコアプロセッサ、2GBメモリ、1TOPSのローカル演算能力を備える。イヤホン、ARグラス、スマートウォッチなど小型デバイス向けで、AIアクセラレータの断片化問題解決を目指す。....

16.3k 昨日

大規模モデルもポケットに収まる！グーグル、夏に珊瑚AI開発ボードを発売　オフラインでリアルタイムの音声翻訳が可能

Googleなどのハイテク大手が、ローカルで大規模モデルを実行する新たな競争を繰り広げている。Googleは2026年夏、高性能NPUチップを内蔵し、最大1TOPSの演算能力を提供する「Coral AI開発ボード」を発表する。これにより、AIハードウェア開発者はクラウドやネットワークに依存せず、ローカルのオフライン環境でも大規模モデルをスムーズに実行できるようになる。....

15.9k おととい

清华大学と腾讯混元がMLSys2026 MoE推論チャレンジで優勝 NPU推論のスピードを4.1倍に向上

清华大学ストレージラボと腾讯混元AI Infraチームは、MLSys2026 MoEモデル推論最適化チャレンジで世界優勝を獲得しました。テラパラメータ級の混合エキスパート（MoE）アーキテクチャが非均質なNPUで抱える推論のボトルネックに対し、連携チームは全フロー最適化方案を設計しました。これはE-Shard戦略、PSUM三次元テンソルバッチ読み出しおよびGEMV経路を含み、性能を顕著に向上させました。

11.9k 14 時間前

清华大学と腾讯混元がMLSys2026 MoE推論チャレンジで優勝 NPU推論のスピードを4.1倍に向上

ローカライズされた計算力：Speechify、ネイティブなWindowsアプリを発表し、システムレベルの音声入力に挑戦

SpeechifyはネイティブなWindowsクライアントをリリースし、テキストから音声への変換ツールからフルスタックの音声アシスタントへと進化しました。このアプリには3種類のローカルAIモデルが統合されており、複数のアプリ間でリアルタイムの音声入力やドキュメントトランクリプトをサポートします。Superwhisperなどとの競合品に対抗しています。反応速度とプライバシーを確保するため、Copilot+ PCなどの高性能デバイスで完全なローカル実行をサポートしており、ユーザーは音声をクラウドにアップロードすることなく、ローカルのNPUまたはGPU駆動のWhisperモデルを利用して作業できます。

10.9k 昨日

ローカライズされた計算力：Speechify、ネイティブなWindowsアプリを発表し、システムレベルの音声入力に挑戦

AI製品

Snapdragon Xシリーズ

新世代Snapdragon Xシリーズは、NPUを搭載し、クリエイターに革新的なツールを提供します。

開発とツール

10.1k

ZETIC.ai

ゼロコストのデバイス側AIを構築します。

開発とツール

8.8k

インテルNPUアクセラレーションライブラリ

インテル神経処理ユニット（NPU）向けアクセラレーションライブラリ

AIモデルの推論訓練

14.3k

モデル

GPT OSS 120B

Openai

$0.63

入力トークン/百万

$3.15

出力トークン/百万

131

コンテキスト長

Pangu-NLP-N2-32K-5.0.1.1

Huawei

入力トークン/百万

出力トークン/百万

コンテキスト長

Wan2.1-T2V-1.3B

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

Gemma 3 4B

Google

$0.14

入力トークン/百万

$0.28

出力トークン/百万

131

コンテキスト長

Gemma 3 27B

Google

$0.7

入力トークン/百万

$1.4

出力トークン/百万

131

コンテキスト長

Gemma 3 12B

Google

$0.35

入力トークン/百万

$0.7

出力トークン/百万

131

コンテキスト長

Gemma 3 1B

Google

入力トークン/百万

出力トークン/百万

コンテキスト長

DeepSeek-R1-Distill-Llama-8B

Deepseek

入力トークン/百万

出力トークン/百万

コンテキスト長

Qwen_v2.5_7b_base

Alibaba

入力トークン/百万

出力トークン/百万

128

コンテキスト長

Baichuan-M2-32B

Baichuan

入力トークン/百万

出力トークン/百万

コンテキスト長

Pangu-NLP-N4-32K-2.5.35

Huawei

入力トークン/百万

出力トークン/百万

コンテキスト長

Gemini 1.5 Flash

Google

$1.05

入力トークン/百万

$4.2

出力トークン/百万

コンテキスト長

Gemma 2 27B

Google

入力トークン/百万

出力トークン/百万

コンテキスト長

未来を力づける、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

ビジネス協力サイトマップ

AIニュース

グーグルがエッジ側AI開発ボードCoral Boardをリリース、Gemma3のローカル実行をサポート

大規模モデルもポケットに収まる！グーグル、夏に珊瑚AI開発ボードを発売　オフラインでリアルタイムの音声翻訳が可能

清华大学と腾讯混元がMLSys2026 MoE推論チャレンジで優勝 NPU推論のスピードを4.1倍に向上

ローカライズされた計算力：Speechify、ネイティブなWindowsアプリを発表し、システムレベルの音声入力に挑戦