最高のAI音声モデル AIツールモデル_厳選AI音声モデル情報

AIニュース

快手可灵2.6が全量リリース！音と画像を同時に生成、映像、自然な音声、キーボードの効果音、環境の雰囲気

快手の可灵AIが初の「音画同出」モデル可灵2.6を発表。映像・音声・効果音・環境雰囲気を同時生成可能で、文章や画像から短時間で動画制作ができる。....

杭州トンコウテクノロジーが国内初のAIブラインドサポートメガネを発表 3000元以内で300ミリ秒以内の道路状況案内を実現

瞳行科技が国内初のAI視覚支援メガネを発表。アリババの大規模AIモデルを搭載し、視覚障害者にリアルタイムの移動支援を提供。300ミリ秒の低遅延で周囲状況を音声案内し、バス停表示や標識の認識も可能。開発コストを70%削減し、機能のローカル処理も実現。....

9.5k 3 時間前

杭州トンコウテクノロジーが国内初のAIブラインドサポートメガネを発表 3000元以内で300ミリ秒以内の道路状況案内を実現

パリのAI音声会社Gradiumが7000万ドルの資金調達を実施

フランスのAI音声スタートアップGradiumが7000万ドルのシードラウンドを調達。欧州音声AI分野で最高額。Kyutai研究所発の同社は、ミリ秒応答の音声言語モデル「音区」を開発。....

7k 6 時間前

千問APPが万相Wan2.5の動画機能を統合し、ビデオ能力が大幅に向上

アリ千問APPは万相2.5モデルを統合し、動画クリエイションの能力が向上しました。動作精度と体の動きの調整性が向上し、初めてモバイル端末で音声と映像の同期出力をサポートするAIアシスタントとなりました。このモデルは音声と映像の同期能力を備え、マルチモーダル入出力が可能で、LMArena評価において画像から動画を作成する能力は世界第3位です。

11k 23 分前

AI製品

S02AI

S02AIはSora2モデルに基づいており、テキストまたは画像から音声付きの高品質なAIビデオを生成することができます。

動画生成

4.5k

Hathora

音声AIのASR、TTS、LLMモデルを提供し、リアルタイムアプリケーション向けにテスト?デプロイ可能です。

開発プラットフォーム

5.4k

Lucent Chat

複数のAIモデルを統合し、対話を通じて画像、ビデオ、音声を生成し、クリエイティブプロセスを最適化します。

AIデザインツール

7.6k

TryVeo3.ai

Google Veo 3 AIビデオ技術を使用したビデオジェネレーターで、テキストや画像から映画のようなビデオを生成し、音声とビデオの同期、最新のGoogleビデオモデルを使った経験を行えます。

動画生成

7.2k

モデル

Gemini 2.0 Flash-Lite

Google

$0.49

入力トークン/百万

$2.1

出力トークン/百万

コンテキスト長

GPT-5 Codex

Openai

入力トークン/百万

出力トークン/百万

コンテキスト長

Gemini 2.0 Flash

Google

$0.7

入力トークン/百万

$2.8

出力トークン/百万

コンテキスト長

Claude Haiku 4.5

Anthropic

入力トークン/百万

$35

出力トークン/百万

200

コンテキスト長

Gemini 2.5 Flash

Google

$2.1

入力トークン/百万

$17.5

出力トークン/百万

コンテキスト長

Claude Sonnet 4.5

Anthropic

$21

入力トークン/百万

$105

出力トークン/百万

200

コンテキスト長

Claude 3 Sonnet

Anthropic

$21

入力トークン/百万

$105

出力トークン/百万

200

コンテキスト長

Gemini 2.5 Flash-Lite

Google

$0.7

入力トークン/百万

$2.8

出力トークン/百万

コンテキスト長

qwen3-vl-plus

Alibaba

入力トークン/百万

$10

出力トークン/百万

256

コンテキスト長

Qianfan-Lightning

Baidu

入力トークン/百万

出力トークン/百万

128

コンテキスト長

qwen3-max

Alibaba

入力トークン/百万

$24

出力トークン/百万

256

コンテキスト長

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

入力トークン/百万

$240

出力トークン/百万

コンテキスト長

wan2.5-t2v-preview

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

wan2.5-i2v-preview

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

qwen3-omni-flash-realtime

Alibaba

$3.9

入力トークン/百万

$15.2

出力トークン/百万

コンテキスト長

qwen3-omni-30b-a3b-captioner

Alibaba

$15.8

入力トークン/百万

$12.7

出力トークン/百万

コンテキスト長

qwen3-tts-flash

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

qwen3-tts-flash-realtime

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

Doubao-1.5-pro-32k

Bytedance

$0.8

入力トークン/百万

出力トークン/百万

128

コンテキスト長

qwen3-asr-flash

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

MCP

Mcp Hfspace

mcp-hfspaceは、Hugging Face Spacesに接続するMCPサーバーで、画像生成、音声処理、ビジュアルモデルなど、さまざまなAI機能をサポートし、Claude Desktopとの統合を簡素化します。

typescript

5.4k

3.5ポイント

Teamspeak Mcp

TeamSpeak MCPは、Model Context Protocolに基づくサーバー制御ツールで、ClaudeなどのAIモデルがTeamSpeak音声サーバーを管理できるように設計されています。ユーザー管理、チャンネル制御、権限設定などの包括的な操作をカバーする39種類の機能ツールを提供し、複数のデプロイ方法（PyPI/Docker/ローカル）をサポートして、TeamSpeakの自動管理を実現します。

python

7.2k

2.5ポイント

Voice Recorder Mcp Server

Whisperモデルベースの音声録音と文字起こしMCPサーバーで、Goose AI拡張としても独立して動作することもでき、様々な録音シーンとモデル設定をサポートします。

python

9.1k

2.5ポイント

Voicevox Mcp Server

Voicevox MCP ServerはVOICEVOX互換の音声合成サーバーで、MCPプロトコルを通じてAivisSpeech/VOICEVOX/COEIROINKとのインタラクションを実現し、CursorなどのエディタでのClaude 3.7代理モードの音声合成をサポートします。

typescript

6.7k

2.5ポイント

Message Mcp

Message MCPはAIタスク通知システムで、デスクトップ通知、カスタム音声、モバイルプッシュ、メール通知、APIプッシュ機能を提供し、ユーザーが画面を見続けることなくタスクの完了状態をタイムリーに知ることができます。

typescript

5.7k

2.5ポイント

Voice Recorder (Whisper)

Whisperモデルに基づく音声録音と文字起こしのMCPサーバーで、Goose AIの拡張機能として、または独立したサービスとして動作させることができます。

python

7.6k

2.5ポイント

Awesome_mcp

これは、Model Context Protocol（MCP）エコシステムに関する選りすぐりのリソースリストで、公式リソース、開発ツール、MCPサーバー、Web統合、データベース、ブロックチェーン、AI統合、音声、モバイルアプリ、開発環境、セキュリティテスト、生産性ツール、システムツールなどの複数のカテゴリを網羅しています。

人工知能チャットボット

8.4k

2.5ポイント

Teamspeak Mcp

TeamSpeak MCPは、Model Context Protocolに基づくサービスで、AIモデル（Claudeなど）を通じてTeamSpeakサーバーを制御し、包括的なチャンネル管理、ユーザー権限制御、音声調整などの機能を提供します。

python

4.6k

2.5ポイント

MCPollinations

MCPollinationsは、Model Context Protocol（MCP）に基づくマルチモーダルAIサービスで、Pollinations APIを通じて画像、テキスト、音声を生成することができます。認証不要の軽量サービスを提供し、複数のAIモデルと互換性があり、画像の保存とBase64エンコードの返却をサポートしています。

javascript

5.9k

2.5ポイント

Exotelmcp

ExotelMCPはモデルコンテキストプロトコル（MCP）サーバーで、Claude AIとExotelの通信APIをシームレスに統合し、SMSサービス、音声通話、高速オーディオツールサービスをサポートします。

通信ツール

4.6k

2.0ポイント

Hugging Face Spaces

MCP-hfspaceは、Hugging Face Spacesへの接続を簡素化するサーバーツールです。画像生成、音声処理、ビジュアルモデルなどのさまざまなAI機能をサポートし、Claude Desktopとシームレスに統合されます。

typescript

2.0ポイント

1lc

大規模モデルに基づくインテリジェントチャットボットプロジェクトで、多プラットフォーム接続と複数のAIモデルをサポートし、テキスト、音声、画像処理およびプラグイン拡張機能を備え、企業用AIアプリケーションをカスタマイズできます。

python

8.7k

2.0ポイント

Groqcloud Mcp_server

完全なGroq MCPサーバープロジェクトで、アプリとGroq APIを接続するインテリジェントな橋渡し役として機能し、さまざまなAIモデル（テキスト、音声、ビジュアル、バッチ処理）をサポートし、インテリジェントなルーティング、レート制限、キャッシュ最適化などの高度な機能を備えています。

typescript

6.9k

2.0ポイント

Mcp Server Whisper

MCPサーバーWhisperはOpenAI WhisperとGPT - 4oモデルに基づく音声処理サーバーで、高度な音声文字起こし、形式変換、バッチ処理、テキスト読み上げなどの機能を提供し、Model Context Protocol標準を通じてAIアシスタントとのシームレスなインタラクションを実現します。

python

6.8k

2.0ポイント

未来を力づける、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

ビジネス協力サイトマップ

AIニュース

快手可灵2.6が全量リリース！音と画像を同時に生成、映像、自然な音声、キーボードの効果音、環境の雰囲気

杭州トンコウテクノロジーが国内初のAIブラインドサポートメガネを発表 3000元以内で300ミリ秒以内の道路状況案内を実現

パリのAI音声会社Gradiumが7000万ドルの資金調達を実施

千問APPが万相Wan2.5の動画機能を統合し、ビデオ能力が大幅に向上

AI製品

S02AI

Hathora

Lucent Chat

TryVeo3.ai

モデル

Gemini 2.0 Flash-Lite

GPT-5 Codex

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-vl-plus

Qianfan-Lightning

qwen3-max

qwen3-livetranslate-flaltimeash-re-2025-09-22

wan2.5-t2v-preview

wan2.5-i2v-preview

qwen3-omni-flash-realtime

qwen3-omni-30b-a3b-captioner

qwen3-tts-flash

qwen3-tts-flash-realtime

Doubao-1.5-pro-32k

qwen3-asr-flash

Neutts Air Vi

VieNeu TTS

Thewhisper Large V3 Turbo

Thewhisper Large V3

Kani Tts 400m Es

Kani Tts 400m Ar

Kani Tts 400m En

Kani Tts 370m

Neutts Air Q8 Gguf

Neutts Air Q4 Gguf

Neutts Air

Moonshine Tiny Vi

LFM2 Audio 1.5B

VoiceCore

Indicwav2vec Hindi

EchoLLaMA 1B

Soundwave

AudioX North V1

Asr Conformer Loquacious

AudioX South V1

MCP

Mcp Hfspace

Teamspeak Mcp

Voice Recorder Mcp Server

Voicevox Mcp Server

Message Mcp

Voice Recorder (Whisper)

Awesome_mcp

Teamspeak Mcp

MCPollinations

Exotelmcp

Hugging Face Spaces

1lc

Groqcloud Mcp_server

Mcp Server Whisper