最高のAI音声 AIツールモデル_厳選AI音声情報

AIニュース

AI音声の巨頭が誕生！ElevenLabsは50億ドルを調達し、110億ドルの評価額に急上昇。世界で最も高価なAI音声サービス企業となる

ElevenLabsは5億ドルのD輪資金調達を完了し、評価額は110億ドルに達し、世界で最も高い評価を受けるAI音声サービスプロバイダーとなりました。本ラウンドはSequoia Capitalが主導し、a16z、ICONIQ Capitalなどが参加し、音声AIおよび同社の企業向けビジネスの成長に対する資本市場の高い評価を示しています。....

9.7k 8 分前

AI日報：Kairen 3.0がリリース；アリババの大規模モデルブランドは正式にQianwenに名前変更；Mistral AIがVoxtral Transcribe 2音声モデルを発表

【AI日報】のページへようこそ！ここは毎日人工知能世界を探索するためのガイドです。毎日、AI分野のホットな情報をご提供し、開発者をフォーカスし、技術トレンドを理解し、革新的なAI製品の応用を学んでいただきます。新鮮なAI製品については以下から詳細をご確認ください：https://app.aibase.com/zh1、Kairen AI 3.0が正式リリースされ、世界初の本体参照機能を備えた15秒の長編ビデオがAIディレクター時代を開きました。Kairen AI 3.0のリリースにより、AI映像制作は新たな時代に入りました。

11.9k 28 分前

AI日報：Kairen 3.0がリリース；アリババの大規模モデルブランドは正式にQianwenに名前変更；Mistral AIがVoxtral Transcribe 2音声モデルを発表

0.2秒未満の遅延！Mistral AI、Voxtral Transcribe 2音声モデルをリリース。中国語リアルタイム変換をサポート

フランスのMistral AIがVoxtral Transcribe2音声認識モデルシリーズを発表。リアルタイム転写モデルは40億パラメータで、低遅延・低コストを実現。....

8.7k 1 時間前

0.2秒未満の遅延！Mistral AI、Voxtral Transcribe 2音声モデルをリリース。中国語リアルタイム変換をサポート

音声AIの巨頭エレベント・ラボが5億ドルの資金調達を完了、評価額は110億ドルに急上昇

ElevenLabsが5億ドルの資金調達を完了、シーコイア・キャピタル主導で評価額は110億ドルに急騰。年初比3倍以上増。シーコイアのパートナーが取締役会に参加。音声AI分野への市場の高い評価を示す。....

9.8k 1 時間前

AI製品

スーパーココ?スーパーココ

Macユーザー向けのAI音声アシスタントで、音声指令によって文章の整えや翻訳、オフィス自動化を実現します。

个人アシスタント

Genspark Speakly

AI音声听写アプリで、タイピングよりも4倍速く、音声を明瞭なテキストに変換できます。

音声をテキストに変換

5.9k

kikivoice.ai

無料のオンラインAI音声クローニング。99％の類似度。75種類以上の言語に対応。登録不要。

音声クローニング

4.4k

Voiceley

Voiceleyでは、無料で高速にAI音声クローンを行い、音声モデルを使用して音声を生成することができます。

音声クローニング

7.6k

モデル

Gemini 2.0 Flash-Lite

Google

$0.49

入力トークン/百万

$2.1

出力トークン/百万

コンテキスト長

Gemini 2.5 Flash

Google

$2.1

入力トークン/百万

$17.5

出力トークン/百万

コンテキスト長

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

入力トークン/百万

$240

出力トークン/百万

コンテキスト長

wan2.5-t2v-preview

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

wan2.5-i2v-preview

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

qwen3-omni-flash-realtime

Alibaba

$3.9

入力トークン/百万

$15.2

出力トークン/百万

コンテキスト長

qwen3-omni-30b-a3b-captioner

Alibaba

$15.8

入力トークン/百万

$12.7

出力トークン/百万

コンテキスト長

qwen3-tts-flash

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

qwen3-tts-flash-realtime

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

Doubao-1.5-pro-32k

Bytedance

$0.8

入力トークン/百万

出力トークン/百万

128

コンテキスト長

qwen3-asr-flash

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

百度スチームエンジン2.0音声映像一体型

Baidu

入力トークン/百万

出力トークン/百万

コンテキスト長

Claude Opus 4.1

Anthropic

$105

入力トークン/百万

$525

出力トークン/百万

200

コンテキスト長

GLM-4.5-AirX

Chatglm

入力トークン/百万

出力トークン/百万

128

コンテキスト長

GLM-4.5-Air

Chatglm

入力トークン/百万

出力トークン/百万

128

コンテキスト長

qwen-tts-realtime

Alibaba

$2.4

入力トークン/百万

$12

出力トークン/百万

コンテキスト長

Hunyuan-TurboS-latest

Tencent

$0.8

入力トークン/百万

出力トークン/百万

コンテキスト長

Doubao-1.5-thinking-vision-pro

Bytedance

入力トークン/百万

出力トークン/百万

128

コンテキスト長

Gemma 3n E2B Instructed LiteRT (Preview)

Google

入力トークン/百万

出力トークン/百万

コンテキスト長

Gemma 3n E2B Instructed

Google

入力トークン/百万

出力トークン/百万

コンテキスト長

MCP

Mcp Hfspace

mcp-hfspaceは、Hugging Face Spacesに接続するMCPサーバーで、画像生成、音声処理、ビジュアルモデルなど、さまざまなAI機能をサポートし、Claude Desktopとの統合を簡素化します。

typescript

5.7k

3.5ポイント

Systemprompt Code Orchestrator

SystemPrompt Coding Agentは、オープンソースプロジェクトで、ローカルワークステーションをMCPプロトコルでリモート制御可能なAIプログラミングアシスタントに変えます。音声コマンドとモバイル端末での操作をサポートし、異なる場所でのプログラミング管理を実現します。

typescript

6.6k

2.5ポイント

Teamspeak Mcp

TeamSpeak MCPは、Model Context Protocolに基づくサーバー制御ツールで、ClaudeなどのAIモデルがTeamSpeak音声サーバーを管理できるように設計されています。ユーザー管理、チャンネル制御、権限設定などの包括的な操作をカバーする39種類の機能ツールを提供し、複数のデプロイ方法（PyPI/Docker/ローカル）をサポートして、TeamSpeakの自動管理を実現します。

python

7.2k

2.5ポイント