Qwen-TTS新バージョンリリース中国語の3つの方言を新たにサポート

AIbase基地

公開日AIニュース · 1 分で読めます · Jul 1, 2025

最近、Qwen-TTSと呼ばれる音声合成モデルに新たな進展があり、最新バージョンがQwen APIを通じて更新され、ユーザーにより豊かな音声合成体験を提供しています。

今回のアップデートでは、北京語、上海語、四川語の3種類の中国語方言へのサポートが追加されました。これにより、その応用範囲がさらに広がりました。このモデルは300万時間以上の大規模な語料庫に基づいて訓練されており、合成効果は人間レベルの自然さと表現力に達しています。Qwen-TTSは正確な音声合成だけでなく、入力テキストに応じてリズム、テンポ、感情の変化を自動的に調整することができ、生成された音声はより現実的で表現力豊かになります。

通義 Qwen (5)

現在、Qwen-TTSは7種類の中英両語の音色をサポートしており、CherryやEthanなどの標準的な音色に加え、方言専用のDylan（北京語）、Jada（上海語）、Sunny（四川語）などの音色も含まれます。ユーザーは自分のニーズに合わせて適切な音色を選択して音声合成を行うことができます。

実際の応用において、Qwen-TTSは優れた性能を示しています。日常生活のシチュエーションを説明したり、複雑な感情を表現したりする場合でも、自然で滑らかな音声を生成できます。例えば、北京語のDylanという音色を使って子供の遊びに関するテキストを合成すると、音声には子供らしい楽しさと活気があります。一方、上海語のJadaという音色を使って生活の小さな出来事に関する会話を合成すると、地元の上海の風情が感じられます。

Qwen-TTSの開発チームは、今後もモデルの性能を最適化し、さらに多くの言語や音声スタイルをリリースする予定であると述べました。これは、ユーザーが日々多様化するニーズに対応できるようにするためです。また、開発者にとって使いやすいAPIインターフェースも提供しており、Qwen-TTSを自アプリケーションに統合することが容易です。

百煉:https://help.aliyun.com/zh/model-studio/qwen-tts

Qwen-TTS AI音声合成方言サポート QwenAPI

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

大規模モデルの革命！Gemini 2.5 Proが情報処理をどのように変えるか

Jul 1, 2025

AIニュース：アリババ通義がQwen-TTSモデルを発表；Cursorはウェブとモバイル端末をサポート；字節が画像合成技術XVerseを発表

【AIニュース】へようこそ！ここは毎日人工知能の世界を探索するためのガイドです。毎日、AI分野の注目コンテンツをお届けし、開発者に焦点を当てて、技術トレンドやイノベーティブなAI製品の応用を見てみましょう。最新のAI製品はこちらから確認できます：https://top.aibase.com/1、Qwen-TTSが注目される新発表：地域言語の音声合成における新たな突破、現実的な質感で人間そっくり。アリババ通義チームが開発したQwen-TTSモデルは、音声合成分野における重要な進歩を実現しました

Jul 1, 2025

PerMAXity：AI駆動型投資分析と自動生成の統合財務レポート

最近、Perplexityは新機能PerMAXityをリリースしました。この機能はスケジュールタスクを通じてラボを作成し、人間のアナリストが不要な状況下でも投資ポートフォリオの統合的な財務レポートを取得することができます。この革新的な機能はその効率性と知能性から広範な注目を集めています。PerMAXity：自動化財務分析の新たな基準 PerMAXityはPerplexityが提供する画期的な機能であり、ユーザーが事前に設計されたスケジュールタスクを通じて、投資ポートフォリオ内の各資産に関する詳細な財務レポートを自動的に生成できるようにします。

Jul 1, 2025

メタがスーパーアイ・ラボを設立し、人工知能の新時代をリード

メタ社は現在、重大な内部再編を行っており、すべての人工知能関連のチームを「スーパーアイ・ラボ（メタスーパーアイテクノロジーラボ）」という新しい部門に統合することを決定しました。この情報はブルームバーグによって明らかにされ、メタの内部文書によると、メタCEOのマーク・ザッカーバーグは今回の再編を通じて、会社の重点を「スーパーインテリジェンス（超知能）」人工知能の開発に移したいと考えています。

Jul 1, 2025

NoteGenが登場：AI駆動のクロスプラットフォームノートツール知識管理の新しい時代へ

デジタル化された時代において、効率的なノートツールは知識管理の重要な一部となっています。最近、クロスプラットフォームのAIノートソフト「NoteGen」が急速に注目を集めています。このソフトはWindows、MacOS、Linux、iOS、Androidの5つのプラットフォームをサポートし、無料で複数端末間でのデータ同期機能を提供しており、ネイティブなMarkdown形式と強力な第三者的な大規模モデルとの統合能力によって、ノート体験を再定義しています。全プラットフォームに対応し、無料でシンクでき、スムーズに接続できるNoteGenは、その強力なクロスプラットフォーム互換性により、話題となっています。

Jul 1, 2025

マイクロソフトがMAI-DxO AIシステムを発表医療診断の正確性が4倍に向上

Jul 1, 2025

淘天グループのハードコアボーイ技術祭4.0が大々的に発表: 1000億パラメータの推薦大規模言語モデルRecGPTが正式リリース

淘天グループは昨日、自社のハードコアボーイ技術祭4.0で、独自開発した1000億パラメータの推薦用大規模言語モデル「RecGPT」が正式にリリースされたことを発表しました。この革新的な成果により、スマートフォン版タオバオのホーム画面「お好みの商品」情報流が全面リニューアルされ、生成型推薦技術であるAIGRを活用して、ユーザーに対してより正確で個別化されたレコメンデーション体験を提供します。RecGPTのリリースは、タオバオがEC推薦分野において重要な一歩を踏み出したことを示しています。テストの結果では、RecGPT大規模モデル搭載の推薦情報流が優れたパフォーマンスを示し、ユーザーのクリック数が実際の測定値で高くなっています。

Jul 1, 2025

TEN VADがオープンソースを発表：エンタープライズレベルの音声検出ツールで、超スマートなAI音声アシスタントを開発！

Jul 1, 2025

Chai-2が衝撃的なリリース：AIを駆使したゼロサンプル抗体設計薬物開発を100倍速く

人工知能が医薬品開発分野で新たな波紋を広げています！Chai Discoveryは最近、新たにAIモデルChai-2をリリースし、分子設計分野における画期的な技術で広く注目を集めました。Chai-2はゼロサンプル抗体設計を実現しており、成功率は16％〜20％に達し、従来の方法よりも100倍以上向上しています。医薬品開発サイクルは数か月乃至数年からわずか2週間に短縮されました。ゼロサンプル抗体設計により伝統的な課題を突破 Chai-2はChai Discoveryが開発したマルチモーダルな生成型AIモデルで、専門的に設計されています

Jul 1, 2025

TEN AgentがオープンソースのTEN VADとトーン検出により、音声AIの超低遅延を支援

TEN Agentチームは近日、コアモデルである**TEN Voice Activity Detection（VAD）**および**TEN Turn Detection**を正式にオープンソース化したことを発表しました。これにより、リアルタイムでマルチモーダルな音声AIエージェントの構築に強力な技術的サポートが提供されることになりました。この取り組みは、TENフレームワークが音声インタラクション技術の民主化とオープンソース協力を推進する上で大きな前進を示しています。以下では、AIbaseがまとめた最新情報に基づき、この2つのコアモデルについて詳しく解説します。

Jul 1, 2025

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

Qwen-TTS新バージョンリリース 中国語の3つの方言を新たにサポート

AIbase基地

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

大規模モデルの革命！Gemini 2.5 Proが情報処理をどのように変えるか

AIニュース：アリババ通義がQwen-TTSモデルを発表；Cursorはウェブとモバイル端末をサポート；字節が画像合成技術XVerseを発表

PerMAXity：AI駆動型投資分析と自動生成の統合財務レポート

メタがスーパーアイ・ラボを設立し、人工知能の新時代をリード

NoteGenが登場：AI駆動のクロスプラットフォームノートツール 知識管理の新しい時代へ

マイクロソフトがMAI-DxO AIシステムを発表 医療診断の正確性が4倍に向上

淘天グループのハードコアボーイ技術祭4.0が大々的に発表: 1000億パラメータの推薦大規模言語モデルRecGPTが正式リリース

TEN VADがオープンソースを発表：エンタープライズレベルの音声検出ツールで、超スマートなAI音声アシスタントを開発！

Chai-2が衝撃的なリリース：AIを駆使したゼロサンプル抗体設計 薬物開発を100倍速く

TEN AgentがオープンソースのTEN VADとトーン検出により、音声AIの超低遅延を支援

Qwen-TTS新バージョンリリース中国語の3つの方言を新たにサポート

NoteGenが登場：AI駆動のクロスプラットフォームノートツール知識管理の新しい時代へ

マイクロソフトがMAI-DxO AIシステムを発表医療診断の正確性が4倍に向上

Chai-2が衝撃的なリリース：AIを駆使したゼロサンプル抗体設計薬物開発を100倍速く