AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

Alハードウェアです

すべてのAIハードウェアをリストアップします。

AIマネタイズガイド

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション MCP

Stability AIとArmがスマホ向けオーディオ生成AIを発表：7秒で11秒のステレオ音声を作成

AIbase基地

公開日AIニュース · 1 分で読めます · May 19, 2025

Stability AIとArmは、「スタビライズドオーディオオープンスモール」（Stable Audio Open Small）と呼ばれるコンパクトなテキストtoオーディオモデルを共同で発表しました。このモデルは約7秒以内で11秒間の高品質なステレオ音声を生成し、スマートフォンなどのモバイルデバイス上で効率的に動作するように最適化されています。

この技術革新は、カリフォルニア大学バークレー校の研究者たちが開発した「敵対的相対的コントラスト」（Adversarial Relativistic-Contrastive, ARC）技術に基づいています。高性能ハードウェア（例：Nvidia H100 GPU）では驚異的な性能を発揮し、わずか75ミリ秒で44kHzのステレオ音声を生成し、ほぼリアルタイムでのオーディオ合成を可能にします。

AI音楽人工知能 (3)

昨年発表された元の「スタビライズドオーディオオープン」（11億のパラメーターを含む）と比べると、この簡略化バージョンはわずか3.41億のパラメーターを使用し、計算資源の必要性を大幅に削減しました。これにより、消費者向けのハードウェア上でスムーズに動作するようになりました。これは、今年3月にStability AIとArmが協力することを発表して以来の最初の重要な成果です。

スマホ端での実行を実現するために、開発チームはモデルアーキテクチャを徹底的に改良し、システムを次の3つの主要なコンポーネントに再構築しました：オーディオデータを圧縮するオートエンコーダー、テキストプロンプトを解釈する埋め込みモジュール、最終的なオーディオを生成する拡散モデル。

Stability AIによれば、このモデルは効果音やフィールドレコーディングの生成において特に優れていますが、音楽生成にはまだ制限があります。特に歌声の処理ではその制約があり、現在は主に英語のプロンプトに対応しています。

モデルのトレーニングには、Freesoundデータベース内の約47万2千個のCC0、CC-BY、またはCC-Sampling+ライセンスの音声クリップを使用し、開発チームは自動化されたチェックを行い、著作権問題を回避するためのデータ選別を行いました。

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

Stability AIとArmがスマホ向けオーディオ生成AIを発表：7秒で11秒のステレオ音声を作成

AIbase基地

この記事はAIbaseデイリーからのものです