最高のAI音声合成 AIツールモデル_厳選AI音声合成情報 - AIBase

AIニュース

もっと見る

抖音がAIGC創作の新規則を発表：無許可での顔交換や声の模倣は厳禁、本物の消費体験を強調

抖音生活サービスは『AIGC創作規範』を発表。AI生成コンテンツに法的・倫理的境界を設定。消費者への情報開示を義務付け、AI生成や深度合成コンテンツに明示的なラベルを要求。また、「顔交換・声模倣」などの人格侵害行為を厳しく取り締まり、著作権のレッドラインを明確化。....

16.4k 21 時間前

抖音がAIGC創作の新規則を発表：無許可での顔交換や声の模倣は厳禁、本物の消費体験を強調

抖音が新しい規則を発表：他人の肖像、声、作品を無許可で使用してAIGCによる創作を行うことを禁止

抖音の生活サービスが「AIGC創作規範」を発表。AIや深層合成技術を使用する際、消費者への知情権を保障し、生成合成成分を含む内容を明示する必要がある。他人の肖像、音声、作品を使用する場合は合法的かつ追跡可能な許可が必要で、違反行為は明確に禁止される。....

12.2k 13 分前

抖音が新しい規則を発表：他人の肖像、声、作品を無許可で使用してAIGCによる創作を行うことを禁止

抖音が生活サービスAIGC制作規範を発表：他人の肖像や声を無許可で使用することを厳禁

抖音生活サービスは4月22日に『AIGC制作規範』を発表し、核心的に権利保護と情報の真実性に焦点を当て、クリエイターが人工知能生成コンテンツや深層合成技術を使用する際の行為の境界を明確にしました。この規範では、AIGC技術を用いて他者の顔や声、作品を無許可でフェイク化や模倣、改編することを禁止しており、消費者の知情権を保障し、健全なコンテンツエコシステムを維持することを目的としています。

抖音が生活サービスAIGC制作規範を発表：他人の肖像や声を無許可で使用することを厳禁

マイクロソフトがフロントエンド音声AIシリーズVibeVoiceをオープンソース化：1回の処理で90分間の複数発話者対話、GitHubで27Kスターを獲得

マイクロソフトがオープンソース化したVibeVoice音声AIモデルは、ASRおよびTTSをサポートし、長時間の音声処理、複数発話者対話の生成、リアルタイムでの低遅延の特徴を持っています。GitHubで27Kスターを獲得しています。MITライセンスを採用しており、ローカル環境での展開が可能で、クラウドコストが不要です。音声合成分野のイノベーションを推進することを目的としています。

マイクロソフトがフロントエンド音声AIシリーズVibeVoiceをオープンソース化：1回の処理で90分間の複数発話者対話、GitHubで27Kスターを獲得

AI製品

もっと見る

Medeo Seedance 2.0

Medeo Seedance 2.0

AIとチャットし、Seedance 2.0でビデオを作成します。唇形の同期とAIによる音声合成をサポートしています。

Artta AI

Artta AI

統合型AIクリエイティブプラットフォームで、ビデオ、画像、音楽、音声合成などの機能を統合しています。

AIデザインツール

Noiz Agent

Noiz Agent

Noiz AIは自然で流暢な音声合成サービスを提供し、応用シーンが豊富で、生成が効率的です。

テキストを音声に変換

Klyra AI

Klyra AI

コンテンツ作成、画像、動画、音声用のワンストップAIプラットフォーム。

AI情報プラットフォーム

モデル

もっと見る

Gemini 2.0 Flash-Lite

Google

Gemini 2.0 Flash-Lite

$0.49

入力トークン/百万

$2.1

出力トークン/百万

1k

コンテキスト長

Gemini 2.5 Flash

Google

Gemini 2.5 Flash

$2.1

入力トークン/百万

$17.5

出力トークン/百万

1k

コンテキスト長

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

qwen3-livetranslate-flaltimeash-re-2025-09-22

$8

入力トークン/百万

$240

出力トークン/百万

52

コンテキスト長

wan2.5-i2v-preview

Alibaba

wan2.5-i2v-preview

-

入力トークン/百万

-

出力トークン/百万

-

コンテキスト長

wan2.5-t2v-preview

Alibaba

wan2.5-t2v-preview

-

入力トークン/百万

-

出力トークン/百万

-

コンテキスト長

qwen3-omni-flash-realtime

Alibaba

qwen3-omni-flash-realtime

$3.9

入力トークン/百万

$15.2

出力トークン/百万

64

コンテキスト長

qwen3-omni-30b-a3b-captioner

Alibaba

qwen3-omni-30b-a3b-captioner

$15.8

入力トークン/百万

$12.7

出力トークン/百万

64

コンテキスト長

qwen3-tts-flash

Alibaba

qwen3-tts-flash

-

入力トークン/百万

-

出力トークン/百万

-

コンテキスト長

qwen3-tts-flash-realtime

Alibaba

qwen3-tts-flash-realtime

-

入力トークン/百万

-

出力トークン/百万

-

コンテキスト長

Doubao-1.5-pro-32k

Bytedance

Doubao-1.5-pro-32k

$0.8

入力トークン/百万

$2

出力トークン/百万

128

コンテキスト長

qwen3-asr-flash

Alibaba

qwen3-asr-flash

-

入力トークン/百万

-

出力トークン/百万

-

コンテキスト長

百度スチームエンジン2.0音声映像一体型

Baidu

百度スチームエンジン2.0音声映像一体型

-

入力トークン/百万

-

出力トークン/百万

-

コンテキスト長

Claude Opus 4.1

Anthropic

Claude Opus 4.1

$105

入力トークン/百万

$525

出力トークン/百万

200

コンテキスト長

GLM-4.5-AirX

Chatglm

GLM-4.5-AirX

-

入力トークン/百万

-

出力トークン/百万

128

コンテキスト長

GLM-4.5-Air

Chatglm

GLM-4.5-Air

-

入力トークン/百万

-

出力トークン/百万

128

コンテキスト長

qwen-tts-realtime

Alibaba

qwen-tts-realtime

$2.4

入力トークン/百万

$12

出力トークン/百万

8

コンテキスト長

Hunyuan-TurboS-latest

Tencent

Hunyuan-TurboS-latest

$0.8

入力トークン/百万

$2

出力トークン/百万

32

コンテキスト長

Doubao-1.5-thinking-vision-pro

Bytedance

Doubao-1.5-thinking-vision-pro

$3

入力トークン/百万

$9

出力トークン/百万

128

コンテキスト長

Gemma 3n E2B Instructed LiteRT (Preview)

Google

Gemma 3n E2B Instructed LiteRT (Preview)

-

入力トークン/百万

-

出力トークン/百万

-

コンテキスト長

Gemma 3n E4B

Google

Gemma 3n E4B

-

入力トークン/百万

-

出力トークン/百万

-

コンテキスト長

MCP

もっと見る

bouyomichan-mcp-nodejs

Bouyomichan Mcp Nodejs

これはNode.jsベースのMCPサーバープロジェクトで、Model Context Protocolを通じてAIアシスタントと棒読みちゃん音声合成ソフトウェアを統合し、テキストを音声に変換する機能を提供します。

2.5ポイント

mcp-simple-aivisspeech

Mcp Simple Aivisspeech

AivisSpeechテキスト読み上げエンジン用に設計されたMCPサーバー。日本語音声合成、複数の音声キャラクター選択、パラメータ設定をサポートし、AIアシスタントとのシームレスな統合を実現します。

2.5ポイント

voicevox-mcp-server

Voicevox Mcp Server

Voicevox MCP ServerはVOICEVOX互換の音声合成サーバーで、MCPプロトコルを通じてAivisSpeech/VOICEVOX/COEIROINKとのインタラクションを実現し、CursorなどのエディタでのClaude 3.7代理モードの音声合成をサポートします。

2.5ポイント

listenhub-mcp-server

Listenhub Mcp Server

ListenHub公式MCPサーバーで、AIポッドキャスト生成、FlowSpeech音声合成などの機能をサポートし、複数のクライアント設定オプションと複数の転送モードを提供します。

2.5ポイント

AivisSpeech

AivisSpeech

AivisSpeechのMCPプロトコルサーバーの実装で、AivisSpeech Engineとのインターフェースを提供し、AIアシスタントの音声合成機能をサポートします。

2.0ポイント

mcp-server-hume

Mcp Server Hume

Hume MCPサーバーはAI協力ツールで、ユーザーがMCPクライアントアプリケーション（Claude DesktopやCursorなど）を通じてOctaveテキスト読み上げ技術を使用し、スマートな音声合成とインタラクションを実現できます。

2.0ポイント

mcp-assistant-playground

Mcp Assistant Playground

Streamlitベースのスマートチャットボットで、GPT - 4oを使用してユーザーのリクエストをチャット、画像生成、データベースクエリ、音声合成などのさまざまなツールに自動ルーティングし、AIツールのルーティング機能を迅速に実験できます。

2.0ポイント

tavus-mcp

Tavus Mcp

Tavus MCPサーバーは、Model Context Protocolに基づくAIビデオ生成サービスインターフェースで、Tavus API v2の完全な機能を提供し、AIデジタル人の作成、ビデオ生成、対話型AI、唇形同期、音声合成など25のツールを含んでいます。

2.0ポイント

Zonos-TTS-MCP-Linux

Zonos TTS MCP Linux

Claude AIにLinuxシステム上でのZonos TTS音声合成を統合する

2.0ポイント

bouyomi-mcp-nodejs

Bouyomi Mcp Nodejs

これはNode.jsベースのMCPサーバープロジェクトで、Model Context Protocolを通じてAIアシスタントと棒読みちゃん音声合成ソフトウェアの統合を実現し、テキストを音声に変換する機能を提供し、音色、音量、速度などのパラメータの調整をサポートします。

2.0ポイント

AIBase

未来を力づける、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

ビジネス協力サイトマップ