最高の音声マウス AIツールモデル_厳選音声マウス情報

AIニュース

元メタ社員が開発したストリームスマートリングで、音声の記録と音楽の操作が簡単に！

Meta元社員が設立したSandbar社が音声対応スマートリング「Stream」を発表。音声でメモ作成、音楽操作、AI連携が可能な“音声マウス”として日常タスクを効率化。CEOはミナ・ファーミ、CTOはキラク・ホン。....

メイドゥー LongCat ビッグモデルアプリが正式リリース！音声通話とインターネット検索でAIにさらに近づく

メイドゥーは自社開発のLongCatビッグモデル公式アプリを正式リリースしました。このアプリはAndroidおよびiOSシステムからダウンロード可能です。インターネット検索、音声通話機能をサポートし、今後は動画通話も追加予定です。テキスト処理やマルチモーダル理解技術を通じて、ユーザーが効率的に情報を取得するのを支援し、メイドゥーが人工知能分野において重要な進展を示しています。

11.1k 4 時間前

AIデイリーニュース：ドウバオがオートマルチボイスシステムをリリース；Adobe Firefly Image 5の大幅アップグレード；Soulの音声モデルSoulX-Podcastが発表

豆包が全自動AIマルチボイスオーディオドラマシステムを発表。小説テキストから直接、98%の精度でキャラクターを認識し、プロ級の音声コンテンツを生成。AI音声制作に革新をもたらす。....

22.7k 3 時間前

AIデイリーニュース：ドウバオがオートマルチボイスシステムをリリース；Adobe Firefly Image 5の大幅アップグレード；Soulの音声モデルSoulX-Podcastが発表

AIによるオーディオドラマの革命が爆発！ドウバオが自動で多人数声優を提供するシステムをリリース 98％のキャラクター認識精度でプロのラジオドラマと匹敵

ドウバオ音声チームが、AI多人オーディオドラマの「完全自動製造ソリューション」をリリースしました。小説のテキストから完成品のラジオドラマまで、エンド・トゥ・エンドで手動作業なしの制作を実現します。声優の録音や編集、人間の介入は不要で、コストは大幅に低下し、効率は向上し、結果はプロフェッショナルなレベルに近づいています。キャラクター認識精度は98％に達しています。

11.2k 34 分前

AI製品

Qwen2.5-Omni

Qwen2.5-Omniは、アリババクラウドの通義千問チームが開発したエンドツーエンドのマルチモーダルモデルであり、テキスト、音声、画像、ビデオ入力をサポートしています。

AIモデル

7.3k

AIスピーカー

AIスマート拡声器 - ChatGPTの回答を自動朗読、録音し、MP3形式でダウンロード

AI音声アシスタント

13.7k

モデル

Gemini 2.5 Pro Preview (Mar' 25)

google

入力トークン/百万

$72

出力トークン/百万

コンテキスト長

Gemini 2.0 Flash (Feb '25)

google

$0.72

入力トークン/百万

$2.88

出力トークン/百万

コンテキスト長

Gemini 2.0 Flash (experimental)

google

$0.72

入力トークン/百万

$2.88

出力トークン/百万

コンテキスト長

MCP

Douyin Mcp Server

MCPプロトコルに基づく抖音動画処理サーバーで、ノーウォーターマーク動画のダウンロード、音声の抽出、テキストの変換機能をサポートします。

python

6.2k

3.0ポイント

MCP_tts_server

MCPフレームワークに基づく多機能なTTSサーバーで、KokoroのローカルTTSとOpenAIのクラウドTTSエンジンを統合し、リアルタイムオーディオストリーム、音声カスタマイズ、再生制御をサポートしています。

python

5.6k

2.5ポイント

Content Core

Content Coreは、AIによって駆動される多機能なコンテンツ抽出および処理プラットフォームで、ウェブページ、ドキュメント、音声/ビデオなどのさまざまなソースからコンテンツを抽出し、スマートなクリーニング、要約生成などの機能を提供します。コマンドライン、Pythonライブラリ、MCPサービスなどのさまざまな統合方法をサポートしています。

python

5.4k

2.5ポイント