中国初のAIGCアニメーション映画「團円令(タンユアンリング)」は2月28日に公開される。この映画は民革中央と中央テレビの指導のもと制作された。映画ではすべてのAI技術が活用され、技術革新を表現するとともに、中華文化伝播の新たな道を探究し、技術と感情の融合を実現する。
クンラン・ティアンゴンが音楽大規模モデル「Mureka V8」を発表しました。このモデルは、MusiCoT技術体系のアップグレードに基づいています。このモデルは、音楽構造やセクションの論理、表現意図を深くモデリングし、人間の創作ロジックに近いメロディーの展開と感情の伝達を実現します。これにより、音楽性、編曲の完成度、ボーカル表現、音質の質が顕著に向上しました。
クンリン・ワンウェイはMureka V8音楽大モデルを発表し、メロディの流れやすさ、ボーカルの表現力、編曲構造および感情の表現において業界最高水準に達しました。実験的な評価ではSunoを上回る性能を示しました。同時に、Mureka Studioツールの内製テストを開始し、AI技術を通じて専門的な音楽制作を推進します。
智元ロボットはMiniMaxと戦略的協力関係を結び、MiniMaxが人形ロボット向けにエンドツーエンドのテキストから音声への技術を提供し、ロボットの現実的な状況における自然な対話や感情表現能力を向上させます。協力の焦点は音声合成にあり、高自然度の音声生成や多様な感情的なトーンモデリングなどの技術を活用して、「話せる」スマートエージェントを作り出します。
Step-Audioは、多言語対応、感情表現、音声クローンなどの機能を備えたオープンソースのインテリジェント音声対話フレームワークです。
文脈理解に基づいた、人間レベルのリアルタイム双方向対話システムです。多様な感情表現と音声スタイルに対応しています。
記憶誘導拡散に基づく、表情豊かな動画生成ツール
音楽を通してあなたの感情を共有しましょう
Alibaba
-
入力トークン/百万
出力トークン/百万
コンテキスト長
Tencent
$0.8
$2
32
Google
$3
$9
16
Openai
$14
$56
1k
$525
$1050
128
$18
6
Stepfun
$1
Baidu
$3.2
$15
$45
4
$1.05
$4.2
$105
$420
$0.1
$0.4
$4
$8
28
AnasAlokla
これは強力な多言語、多ラベル感情分類モデルで、テキストを分析して27種類の異なる感情と中性カテゴリを識別でき、複数の感情を同時に検出し、異なる言語のソースからの微妙なテキスト表現を効果的に理解できます。
akhbar
これはノルウェー語に特化して最適化された高品質のテキストを音声に変換するモデルで、Chatterboxアーキテクチャに基づいて開発され、ノルウェー語の2つの主要な変種(書面ノルウェー語と新ノルウェー語)と複数の方言をサポートし、自然で流れる、感情豊かな表現力のある音声を生成することができます。
okezieowen
これは16ビット量子化され、マージされたテキスト音声変換モデルです。canopylabs/orpheus-3b-0.1-ftをベースに微調整され、UnslothとLoRAで最適化されており、アフリカの低リソース言語に特化して最適化されています。多言語音声合成と感情表現をサポートします。
webbigdata
VoiceCoreは商用可能な日本語音声AIエージェントモデルで、AIが音声で人間と自然にコミュニケーションすることに特化しており、感情表現と非言語音声の能力を備え、多种類の音声スタイルを選択できます。
OddTheGreat
複数の24Bパラメータモデルを融合し、言語表現力とロールプレイ能力を強化したハイブリッドモデルで、特に感情的なインタラクションシーンに最適化されています
thepushkarp
DiaはNari Labsが開発した16億パラメータのテキスト音声合成モデルで、テキストから高度にリアルな対話を直接生成でき、感情やイントネーションの調整および非言語表現の生成をサポートします。
lex-au
Orpheusは高性能なテキスト音声変換モデルで、自然な感情表現を伴う音声合成のために微調整されています。このリポジトリでは30億パラメータモデルの8ビット量子化バージョンをホストしており、高品質な出力を維持しながら効率を最適化しています。
Orpheusは高性能な韓国語テキスト読み上げモデルで、自然な感情表現を実現するために微調整され、8ビット量子化バージョンで効率化されています。
オルフェウスは高性能なテキスト読み上げモデルで、自然な感情表現を伴う音声合成のために微調整されています。このリポジトリでは30億パラメータモデルの8ビット量子化バージョンをホストしており、高品質な出力を維持しながら効率を最適化しています。
オルフェウスは高性能なテキスト読み上げモデルで、自然な感情表現を実現するために微調整されています。このリポジトリでは30億パラメータモデルの8ビット量子化バージョンをホストしており、高品質な出力を維持しながら効率を最適化しています。
Orpheusは高性能なテキスト音声変換モデルで、自然な感情表現を伴う音声合成に特化してファインチューニングされています。このリポジトリでは30億パラメータモデルの8ビット量子化バージョンをホストしており、高品質な出力を維持しながら効率を最適化しています。
Karayakar
オルフェウスはトルコ語をサポートするテキスト音声変換(TTS)モデルで、canopylabs/orpheus-3b-0.1-pretrainedを基に訓練されており、複数の感情表現をサポートしています。
SebastianBodza
Orpheus-3Bをベースにしたドイツ語テキスト音声変換(TTS)モデルで、複数話者と感情表現をサポートします。
Orpheusは高性能なテキスト音声変換モデルで、自然な感情表現を伴う音声合成のためにファインチューニングされています。このリポジトリでは30億パラメータモデルの8ビット量子化バージョンをホストしており、高品質な出力を維持しながら効率を最適化しています。
ai4bharat
VITSアーキテクチャに基づくテキスト音声変換モデルで、13種類のインド言語をサポートし、多様な話し方スタイルと感情表現が可能
HelpingAI
HelpingAI-TTS-v1は、個性化、感情表現、明瞭さに特化した次世代のテキスト読み上げ(TTS)ツールで、複数の言語と感情のカスタマイズに対応しています。
OEvortex
HelpingAI-TTS-v1は、トップクラスのテキスト読み上げモデルで、個性化、感情表現、明瞭な表現を特徴としています。テキスト内容に応じて、自動的に口調、話速、スタイルを調整し、高品質で自然な音声を生成します。
qhchina
BERTアーキテクチャをファインチューニングした中国語テキストの感情強度検出モデルで、弱い感情表現と強い感情表現を区別可能
Borcherding
『スターウォーズ』のC-3POキャラクター音声でファインチューンされた多言語テキスト読み上げモデル。皮肉なスタイルと感情表現能力を備えています
DavidAU
TeeZee/DarkSapling-7B-v1.1を基に全面リメイクした32kコンテキスト大規模言語モデルで、命令追従、推論深度、感情表現において優れた性能を発揮