オランダのNebius社が2025年のAI計算競争で急成長し、MicrosoftとMetaから巨額受注を獲得、業績と株価が急上昇。2026年までに大規模計算クラスター建設を計画するが、電力消費は膨大。同社は新興企業ではなく、以前から実績を蓄積していた。....
オーストラリア政府は、大規模なAI企業に対して高消費電力のデータセンターに再生可能エネルギー発電所を整備することを義務付ける方針を示した。これはAI産業の急速な発展により増加する電力需要と環境への圧力に対処するためである。2050年までにAI施設は全国の約12%の電力を消費する見込みで、2024年のデータセンターは4テラワット時分の電力を消費している。
ChatGPTの月間利用者は8億人に達し、電力消費が深刻。HSBCの試算では、OpenAIは2030年までに2,070億ドルの計算リソース投資が必要で、米中西部の中規模発電所に相当。収益が2,130億ドルでも純利益は出ず、フリーキャッシュフローは継続的に赤字の見込み。....
マイクロソフトは神経処理ユニット(NPU)がWindowsのスマート化において重要な役割を果たすと強調している。現時点ではハードウェアの要件には含まれていないが、CPUと統合されており、ローカルでのAI推論を加速し、電力消費を抑えることができる。これはスマートフォンやCopilot+ PCなどのデバイスで広く利用されている。マイクロソフトはこの技術により、製造業者が競争力のある価格で複雑なAI体験を提供できると述べており、従来数千ドルかかる計算コストを数百ドルにまで引き下げている。
Xai
$1.4
入力トークン/百万
$3.5
出力トークン/百万
2k
コンテキスト長
Openai
$7.7
$30.8
200
Bytedance
$1.2
$3.6
4
$8.75
$70
400
Alibaba
$0.3
-
32
$2
$1
Deepseek
$8
Google
Tencent
$0.5
224
Baidu
8
$10.5
16
Chatglm
128
Iflytek
01-ai
TheStageAI
TheWhisper-Large-V3-Turboは、OpenAI Whisper Large V3モデルの高性能ファインチューニング版で、TheStage AIによって多プラットフォームのリアルタイム、低遅延、低消費電力の音声テキスト変換推論に最適化されています。ストリーミング文字起こし、単語のタイムスタンプ、拡張可能なパフォーマンスをサポートし、リアルタイム字幕、会議、デバイス端末の音声インターフェイスなどのシーンに適しています。
TheWhisper-Large-V3はOpenAI Whisper Large V3モデルの高性能ファインチューニング版で、TheStage AIによって多プラットフォーム(NVIDIA GPUとApple Silicon)のリアルタイム、低遅延、低消費電力の音声テキスト変換推論用に最適化されています。
Vikhrmodels
Llama-3.2-1B-Instructをベースにした命令モデルで、ロシア語のデータセットGrandMaster-PRO-MAXで訓練され、基礎モデルの5倍の効率を持ち、低消費電力またはモバイルデバイスへのデプロイに適しています。
Llama-3.2-1B-Instructをベースにしたロシア語最適化指令モデルで、効率が5倍向上し、低消費電力デバイスへのデプロイに適しています。
PrunaAI
PrunaAIが提供する圧縮版UniNER-7B-allモデル。量子化技術によりメモリ使用量と消費電力を大幅に削減しながら、良好な固有表現抽出能力を維持。
PrunaAIが提供する圧縮版MPT-7B-Chatモデル。llm-int8技術で最適化され、メモリ使用量と消費電力を大幅に削減。
dranger003
ggufはllama.cppベースのテキスト生成モデルで、量子化実行をサポートし、低消費電力デバイスに適しています。
google
MobileNet V2は、モバイルデバイス向けに最適化された小型・低遅延・低消費電力の視覚モデルです