カーシューKling 2.6バージョンは音声と動作の制御の2つの機能を導入し、ネイティブなオーディオ生成を実現し、複雑なアクション処理の精度を向上させました。音声制御により、ビデオに合ったサウンドエフェクト、人の声、音楽を生成でき、カスタマイズ可能なボイスカスタマイズが可能です。
QQ音楽が「AI作歌」機能をリリースし、初めて完全なローカライズ型のAI音楽創作を実現しました。ユーザーはインターネット接続なしでも、クーレルUltraプロセッサを搭載したAI PCを使用すれば、数分で完成したオリジナル楽曲を作成できます。操作は簡単で、キーワードを入力するだけで作成可能です。例えば、最近話題の楽曲『大東北』のような曲も作成できます。
『Codex Mortis』は、コード、グラフィック、音楽の全てをAIで生成した初のゲームと自称。開発者はわずか3ヶ月で、ChatGPTなどを活用して制作を完了した。....
快手可灵AIが発表したAvatar2.0は、写真と音楽から5分間の歌唱動画を生成可能。表情や動作が自然で、AIコンテンツ制作が動的表現へ進化した。....
オンラインAI歌曲生成器で、創作を尊重し、放送レベルの高品質な音楽を提供します。
無料のAI音楽生成ツールで、テキストを著作権のない曲に変換できます。毎日5つの無料ポイントが提供されます。
無料のAI音楽生成器で、高度なモデルを使ってテキストを瞬時に専門的な音楽に変換します。
先進的なAIを使用して、著作権料の無料な音楽、歌曲、人の声を生成できます。音楽スキルは必要ありません。
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$6
$24
256
Baidu
128
$4
$16
$8
$240
52
Bytedance
$1.2
$3.6
4
calcuis
ACE-Step-v1-3.5Bはテキストからオーディオへの変換モデルで、高品質なオーディオ生成をサポートし、音楽やサウンドエフェクトの作成に適しています。
walterheart
BarkはSunoによって作成されたTransformerベースのテキストからオーディオへのモデルで、非常にリアルな多言語音声、音楽、背景ノイズ、音響効果を生成できます。
HKUSTAudio
AudioXは任意のコンテンツから音声や音楽を生成できる統一拡散トランスフォーマーモデルです。高品質な汎用音声と音楽作品を生成し、柔軟な自然言語制御を提供し、複数のモダリティ入力をシームレスに処理できます。
awsaf49
AIによって生成された完全な楽曲(ボーカル、音楽、歌詞、スタイルを含む)を識別できる、エンドツーエンド合成楽曲検出の先進モデル
Alissonerdx
YuEは、音楽生成のために設計された画期的なオープンソース基礎モデルシリーズで、特に歌詞から完全な楽曲への変換(lyrics2song)を目的としています。
Doctor-Shotgun
m-a-p/YuE-s1-7B-anneal-en-cotモデルを基にExllamav2で量子化したバージョンで、テキスト生成タスクに適しており、特に音楽関連分野で良好な性能を発揮します。
FunAudioLLM
InspireMusicは、音楽生成、楽曲生成、オーディオ生成に特化した統一フレームワークで、オーディオトークナイザーと自己回帰トランスフォーマー及びフローマッチングモデルを組み合わせ、高品質な長時間オーディオ生成をサポートします。
InspireMusicは音楽生成、楽曲生成、オーディオ生成に特化した統合フレームワークで、オーディオトークン化技術により自己回帰トランスフォーマーとフローマッチングモデルを統合し、高品質な長尺オーディオ生成をサポートします。
InspireMusicは、高音質かつ長時間の音楽生成をサポートする、音楽生成、楽曲生成、音声生成に特化した統合ツールキットです。
InspireMusicは音楽生成、楽曲生成、オーディオ生成に特化した統合フレームワークで、高音質かつ長時間の音楽生成をサポートします。
InspireMusicは、高音質と長時間音楽生成能力を備えた音楽生成、楽曲生成、オーディオ生成に特化した統合ツールキットです。
jadechoghari
QAMDTは、テキストから音楽生成に向けた品質認識拡散モデルで、革新的な訓練技術によりオーディオの忠実度と音楽表現力を向上させます。
ylacombe
facebook/musicgen-melodyを基にLoRAで微調整したモデルで、パンクスタイルの音楽生成に特化
facebook/musicgen-melodyをベースにLoRAモデルでファインチューニングされ、パンクスタイルの音楽生成に特化
nagayama0706
これはテキスト生成モデルと音楽生成モデルを統合して作成されたハイブリッドモデルで、テキスト生成と音楽生成の両方のタスクを処理できます。
nateraw
musicgen-stereo-melody-largeをファインチューニングしたテキストからオーディオへの変換モデルで、音楽プロデューサー向けに設計されており、32kHzステレオオーディオの楽曲アイデアを生成可能
Xenova
MusicGen SmallはTransformerアーキテクチャに基づく音楽生成モデルで、テキスト記述から高品質な音楽フレーズを生成できます。
stanford-crfm
これは7.8億パラメータを持つ大規模なTransformerモデルで、音楽生成とトランスクリプションタスクに特化しており、アンティシペーショントレーニング手法を採用しています。
MaziyarPanahi
ChatMusician-GGUFはGGUF形式に基づくテキスト生成モデルで、音楽関連のテキスト生成タスクに適しています。
unity
Unity Sentisで検証済みのMeta MusicGenモデルで、テキストプロンプトに基づいて最大30秒のスタイリッシュな音楽を生成できます。
オープンソースのショートビデオ自動生成ツールで、テキスト読み上げ、自動字幕、背景ビデオ、音楽を統合し、簡単なテキスト入力から専門的なショートビデオを作成します。
MusicMCP.AIの公式MCPサーバーで、自然言語の指示でAIアシスタント(Claudeなど)が高度なAI音楽生成プラットフォームを呼び出せます。インスピレーションモードとカスタマイズモードで曲を生成し、残高確認とヘルスチェック機能も提供します。
PythonベースのMCPサーバープロジェクトで、ClaudeなどのAIアシスタントと連携し、ユーザーの気分やテーマに基づいて.m3u形式のローカル音楽プレイリストを生成し、指定されたディレクトリに保存します。
FastMCPベースのMIDIサーバーで、LLMが仮想MIDIポートを介してMIDI入力に対応したソフトウェアにノートと制御信号を送信できます。
本番環境で使用可能なMCPサーバーで、Strudel.ccを通じてAI駆動の音楽生成を実現し、完全なブラウザー自動化制御、リアルタイムオーディオ分析、およびパターン生成機能を提供します。
MIDI MCPサーバーは、テキストデータからMIDI音楽ファイルを生成するツールです。
Emotion Playlist MCPは、MCPを基にしたツールで、ユーザーのエモーション状態に基づいてSpotifyのプレイリストを生成します。Brave検索とSpotifyを統合し、気分に合った音楽のプレイリストを自動的に作成します。
MiniMax Music APIに基づくMCPサーバーの実装で、AI駆動の音楽生成を行い、Claude Desktopとのシームレスな統合をサポートします。
Shorts Video Makerは、ショートビデオを自動生成するオープンソースツールです。テキストから音声への変換、自動字幕、背景ビデオ、音楽技術を組み合わせ、シンプルなテキスト入力で魅力的なショートビデオコンテンツを作成します。REST APIとMCPプロトコルをサポートし、コンテンツクリエイターと開発者に適しています。