快手可灵AIが発表したAvatar2.0は、写真と音楽から5分間の歌唱動画を生成可能。表情や動作が自然で、AIコンテンツ制作が動的表現へ進化した。....
快手可灵数字人2.0が全面リリースされ、ユーザーは3ステップで「話し演技する」デジタルヒューマンビデオを生成可能。新バージョンはキャラクター画像のアップロード、音声追加、表現の記述をサポートし、最大5分の動画を作成できます。旧版に比べ、表現力が大幅に向上し、手の動きと口の形を精密に制御できるようになりました。....
快手クェルンAIは2.6バージョンをリリースし、"音画同出"機能を実現しました。一度に画面、音声、サウンド効果および環境雰囲気を生成できるため、コンテンツ制作の効率が向上します。
快手の可灵AIが初の「音画同出」モデル可灵2.6を発表。映像・音声・効果音・環境雰囲気を同時生成可能で、文章や画像から短時間で動画制作ができる。....
快手公式の動画編集ツール。面白い動画を簡単に作成できます。
可灵大規模言語モデルは、快手(クァイショウ)の大規模言語モデルチームが独自開発した、ビデオ生成を専門とする大規模言語モデルです。これにより、ユーザーは容易かつ効率的に芸術的なビデオ制作を行うことができます。
AIによるアート制作とキャラクターカスタマイズプラットフォーム
Kwai-Klear
Klearは、快手Kwai-Klearチームによって開発された疎なハイブリッドエキスパート(MoE)の大規模言語モデルで、高性能と推論効率の特徴を備えています。総パラメータは460億で、活性化パラメータはわずか25億で、複数の能力ベンチマークテストで優れた成績を収め、実際のアプリケーションに効率的で強力な解決策を提供します。
Kwai-Keye
快手Keye-VLは快手Keyeチームによって開発された最先端のマルチモーダル大規模言語モデルで、ビデオ理解、視覚認知、および推論タスクで卓越した性能を発揮します。1.5バージョンは革新的な高速・低速ビデオコーディング戦略、LongCoTコールドスタートデータパイプライン、および強化学習トレーニング戦略を通じて、ビデオ理解、画像認知、および推論能力において新たな高みに到達し、最大128kトークンの拡張文脈長をサポートします。