Tencent Hunyuan 3D Studioがバージョン1.2にアップグレードし、公測を開始。3D資産生成の専門性と制御性を大幅に向上。PartGenコンポーネント生成機能はバージョン1.5に更新され、コア分割精度が$1536^3$解像度に向上し、モデルの詳細をより良く保持。新バージョンでは革新的な「ブラシインタラクション」機能を導入し、ユーザー操作体験を強化。....
腾讯雲と安徽駅路微行科技が共同開発したETC助手の新機能「助手Agent」は、腾讯混元大モデルを基に、テキストや音声での対話を通じて効率的なサービスを提供。内測期間中に100万人以上のユーザーをカバーし、質問応答の精度は95%に達した。....
腾讯のAIアシスタント「元宝」が高品質な回答でユーザーに疑念を抱かせ、人工介入を疑われた。腾讯は公式に否定し、完全なAI生成で高EQと迅速正確な応答能力を強調した。....
拓竹科技が「印你」3Dフィギュア生成器を発表。Tencent Hunyuan 3D 3.0モデルを基に、画像をアップロードするだけで高品質な3Dプリント可能モデルを生成。カスタム制作のハードルを下げ、愛好家や初心者に便利な創作ツールを提供。....
業界をリードするオープンソースの大規模混合専門家モデル
多様なモーダルに対応するテキストから画像生成モデル
Bytedance
-
入力トークン/百万
出力トークン/百万
コンテキスト長
Alibaba
Tencent
$1
$4
32
$0.7
$1.95
16
$0.8
$2
Google
$3
$9
4
$0.3
$0.6
$0.5
$8
28
$2.4
$9.6
$1.5
$6
128
250
Stepfun
tencent
混元ビデオ - 1.5は軽量級で高性能なビデオ生成モデルで、わずか83億のパラメータでトップレベルのビデオ品質を提供し、使用の敷居を大幅に下げます。消費者向けGPUでスムーズに動作し、テキストからビデオ、画像からビデオの生成をサポートし、すべての開発者やクリエイターが簡単に使用できます。
混元OCRは、混元の独自のマルチモーダルアーキテクチャによって駆動されるエンドツーエンドOCRの専門的なVLMモデルです。わずか10億パラメータの軽量設計で、複数の業界ベンチマークテストで最先端の成績を収めています。このモデルは、複雑な多言語ドキュメント解析に長けており、テキストの位置特定、オープンドメインの情報抽出、ビデオ字幕の抽出、画像の翻訳などの実際のアプリケーションシーンで優れた性能を発揮します。
bojo9
franc3scaはtencent/SRPOベースモデルに基づく低ノイズLoRAモデルで、テキストから画像の生成タスクに特化しています。このモデルは特定のトリガーワード「franc3sca」を通じて画像生成を効果的にトリガーし、ノイズが少ないという特徴があります。
julien8082
これはテキストから画像を生成するプロジェクトで、LoRAとDiffusers技術を使用し、tencent/SRPOモデルに基づいており、特定のトリガーワード「hannah」を通じて関連する画像を生成できます。
TencentARC
ARC-Qwen-Video-7Bは、騰訊ARCラボが開発した現実世界の短動画を理解するためのマルチモーダルモデルで、Qwen2.5-VL-7B-Instructをベースに構築され、音声と動画の同期分析と理解をサポートしています。
SRPOは拡散モデルに対する人間の嗜好アライメント手法で、Direct-Align技術と意味的相対嗜好最適化により、FLUX.1-devモデルのリアリティと美学品質を大幅に向上させ、多段階ノイズ除去の計算コストが高い問題とオフライン報酬微調整に依存する問題を解決します。
DevQuasar
これは騰訊の混元-MT-キメラ-7Bモデルの量子化バージョンで、知識をすべての人が利用できるようにすることを目指し、量子化技術によってモデルのデプロイと実行の敷居を下げます。
本プロジェクトは、騰訊の混元-MT-7B大規模言語モデルの量子化バージョンを提供します。モデル圧縮技術を通じて計算と記憶の要件を削減し、知識をすべての人に利用可能にすることを目指し、高性能なAIモデルをより普及させ、使いやすくします。
bartowski
llama.cppに基づいて騰訊混元4B指令モデルを量子化したバージョンで、量子化技術によりモデルをリソース制限のある環境でより効率的に動作させ、同時に一定の性能と品質を維持します。複数の量子化タイプを提供し、オンラインでの再パッケージング最適化をサポートします。
騰訊混元1.8B指令モデルの量子化バージョンで、llama.cppを使用してimatrix量子化処理を行い、複数の量子化レベルを提供し、モデルの異なるハードウェアでの実行効率を効果的に向上させ、LM Studioまたはllama.cppに基づくプロジェクトでの実行をサポートします。
これは騰訊混元0.5B指令微調整モデルのGGUF量子化バージョンで、llama.cppのimatrix技術を使用して量子化処理を行い、BF16から極低ビットレートまでの複数の量子化オプションを提供し、リソース制限環境下の中国語対話タスクに適しています。
混元は騰訊がオープンソースした効率的な大規模言語モデルシリーズで、様々な計算環境での多目的デプロイに特化して設計されています。エッジデバイスから高並発生産システムまで、これらのモデルは高度な量子化サポートと超長文脈能力を活用して、最高のパフォーマンスを実現します。
ARC-Hunyuan-Video-7Bは、腾讯ARC研究所が開発したマルチモーダルモデルで、現実世界の短動画コンテンツを理解するために特化しています。このモデルは、ビジュアル、オーディオ、テキスト信号をエンドツーエンドで処理し、マルチモーダルの手がかりを統合することで、動画の深層的な構造化理解を実現します。
騰訊混元A13B指令モデルの量子化バージョンで、技術的手段により性能を維持しながら実行効率を向上させます。
混元3D - 2は、画像から3D、テキストから3Dへの変換をサポートするツールで、3Dコンテンツ生成に強力な解決策を提供します。
TencentBAC
テンセントPCG基礎アルゴリズムセンターによってファインチューニングされたマルチモーダル言語モデルで、Qwen2.5-VL-3B-Instructを基に最適化され、同規模モデルにおいて複数のマルチモーダル推論ベンチマークで最先端の性能を実現
AnimeGamerは無限アニメ人生シミュレーションのために特別に設計された画期的なモデルで、マルチモーダル大規模言語モデルを活用してダイナミックなアニメーションカットを生成し、没入型ゲーム体験を創出します。
hunyuanvideo-community
TencentのHunyuanVideo-I2Vは、Diffusersベースの画像から動画への変換モデルで、静止画像を動画に変換できます。
混元3D - 2多視点版は、混元3D - 2を微調整したバージョンで、多視点で形状生成を制御できる高解像度テクスチャの3Dアセット生成モデルです。
Tencent Hunyuan3D 2miniは、軽量で効率的な画像から3Dモデルを生成するモデルで、パラメータ規模は6億、中国語と英語の入力をサポートしています。
腾讯クラウドCOS MCPサーバーは、コードを書かずに大規模モデルが腾讯クラウドストレージ (COS) とデータワンシャン (CI) の機能に迅速に接続できるサービスで、ファイルのアップロードとダウンロード、画像処理、動画処理などのクラウドストレージと処理機能を提供します。
腾讯クラウドCOS MCPサーバーは、MCPプロトコルに基づくサービスで、コーディングなしで大規模モデルをすぐに腾讯クラウドストレージ(COS)とデータバリューアド(CI)の機能に接続でき、ファイルのアップロードとダウンロード、画像処理、ビデオサムネイル生成などのクラウドストレージと処理機能を提供します。