腾讯搜狗入力20.0.0記念版がAI化を全面アップグレード。Tencent Hunyuan大モデルを基に、AI音声・翻訳・入力機能を重点強化。音声認識遅延40%低減、精度98%、方言認識精度30%向上。....
Tencent Hunyuan 3D Studioがバージョン1.2にアップグレードし、公測を開始。3D資産生成の専門性と制御性を大幅に向上。PartGenコンポーネント生成機能はバージョン1.5に更新され、コア分割精度が$1536^3$解像度に向上し、モデルの詳細をより良く保持。新バージョンでは革新的な「ブラシインタラクション」機能を導入し、ユーザー操作体験を強化。....
腾讯雲と安徽駅路微行科技が共同開発したETC助手の新機能「助手Agent」は、腾讯混元大モデルを基に、テキストや音声での対話を通じて効率的なサービスを提供。内測期間中に100万人以上のユーザーをカバーし、質問応答の精度は95%に達した。....
拓竹科技が「印你」3Dフィギュア生成器を発表。Tencent Hunyuan 3D 3.0モデルを基に、画像をアップロードするだけで高品質な3Dプリント可能モデルを生成。カスタム制作のハードルを下げ、愛好家や初心者に便利な創作ツールを提供。....
業界をリードするオープンソースの大規模混合専門家モデル
Bytedance
-
入力トークン/百万
出力トークン/百万
コンテキスト長
Tencent
$1
$4
32
Alibaba
24
$0.7
$1.95
16
$0.8
$2
Google
$0.5
224
$3
$9
4
$0.3
$0.6
$8
28
$2.4
$9.6
$1.5
$6
128
tencent
混元ビデオ - 1.5は軽量級で高性能なビデオ生成モデルで、わずか83億のパラメータでトップレベルのビデオ品質を提供し、使用の敷居を大幅に下げます。消費者向けGPUでスムーズに動作し、テキストからビデオ、画像からビデオの生成をサポートし、すべての開発者やクリエイターが簡単に使用できます。
混元OCRは、混元の独自のマルチモーダルアーキテクチャによって駆動されるエンドツーエンドOCRの専門的なVLMモデルです。わずか10億パラメータの軽量設計で、複数の業界ベンチマークテストで最先端の成績を収めています。このモデルは、複雑な多言語ドキュメント解析に長けており、テキストの位置特定、オープンドメインの情報抽出、ビデオ字幕の抽出、画像の翻訳などの実際のアプリケーションシーンで優れた性能を発揮します。
混元は騰訊がオープンソースした効率的な大規模言語モデルシリーズで、様々な計算環境での多目的デプロイに特化して設計されています。エッジデバイスから高並発生産システムまで、これらのモデルは高度な量子化サポートと超長文脈能力を活用して、最高のパフォーマンスを実現します。
混元3D - 2は、画像から3D、テキストから3Dへの変換をサポートするツールで、3Dコンテンツ生成に強力な解決策を提供します。
hunyuanvideo-community
TencentのHunyuanVideo-I2Vは、Diffusersベースの画像から動画への変換モデルで、静止画像を動画に変換できます。
混元3D - 2多視点版は、混元3D - 2を微調整したバージョンで、多視点で形状生成を制御できる高解像度テクスチャの3Dアセット生成モデルです。
Tencent Hunyuan3D 2miniは、軽量で効率的な画像から3Dモデルを生成するモデルで、パラメータ規模は6億、中国語と英語の入力をサポートしています。
混元ビデオ - I2Vは、全く新しい画像から動画への生成フレームワークで、騰訊の混元ビデオモデルを拡張したもので、静止画像から高品質の動画コンテンツを生成することができます。
jbilcke-hf
SkyReels-V1-Hunyuan-I2Vは、Tencent SkyworkAIによって開発されたテキストから動画を生成するモデルで、Hunyuanアーキテクチャに基づいており、テキスト入力から動画コンテンツを生成することができます。
混元-7Bは騰訊が公開したオープンソースの大規模言語モデルで、256Kの長テキスト処理能力とグループ化クエリ注意力メカニズム(GQA)を持ち、中国語7Bの稠密モデルで優れた性能を発揮します。
混元-7B-Instructはテンセントがリリースした中英バイリンガル大規模言語モデルで、強力なテキスト生成と理解能力を備えており、現在最も優れた中国語7B Denseモデルの一つです。
混元7BはTencentがオープンソース化した中英バイリンガル大規模言語モデルで、より優れたデータ比率とトレーニング方法を採用し、強力な性能を発揮し、現在最も優れた中国語7B Denseモデルの一つです。
テンセントが提供する先進的な3D合成システムで、画像やテキストから高解像度のテクスチャ付き3Dアセットを生成可能
calcuis
Tencent Hunyuanビデオモデルを基にしたアニメスタイルアダプターで、高品質なテキストからビデオ生成能力を提供し、特にアニメスタイルのコンテンツ生成に最適化されています。
FastVideo
Hunyuan動画はテキストから動画を生成するモデルで、Tencentによって開発されました。
テンセントがオープンソース化した大規模動画生成モデルで、テキストから動画を生成可能、主要なクローズドソースモデルに匹敵する性能を実現。
テンセント混元3D-1.0は、テキストから3Dおよび画像から3D生成をサポートする統一フレームワークで、2段階の方法により効率的かつ迅速な3Dアセット生成を実現します。