快手可靈AI發佈數字人模型Avatar2.0,用戶僅需提供一張照片和一段音樂,即可生成長達5分鐘的唱歌視頻。該模型顯著提升了數字人的表現力,使其能夠自然展現表情和肢體動作,告別僵硬“對口型”模式。這標誌着AI內容創作從靜態向動態敘事的重大進步。
快手可靈數字人2.0全面上線,用戶僅需三步即可生成“能說會演”的數字人視頻。新版本支持上傳角色圖片、添加配音並描述表現,最終可生成長達5分鐘的視頻。相比舊版,2.0版本在表現力上顯著提升,實現了手部動作和口型的精準控制。
快手可靈AI推出2.6版本,實現“音畫同出”功能,可一次性生成畫面、語音、音效及環境氛圍,提升內容創作效率。
快手旗下可靈AI推出首個“音畫同出”模型可靈2.6,能同時生成畫面、語音、音效和環境氛圍,打通音畫世界。該模型提供“文生音畫”和“圖生音畫”兩種創作路徑,用戶可通過一句話或圖片快速生成完整視頻,提升創作體驗。
快手官方視頻剪輯神器,創作有趣的視頻
可靈大模型是由快手大模型團隊自研打造的視頻生成大模型,讓用戶可以輕鬆高效地完成藝術視頻創作。
智能創作與形象定製的AI藝術平臺
Kwai-Klear
Klear是由快手Kwai-Klear團隊開發的稀疏混合專家(MoE)大語言模型,具備高性能和推理效率的特點。總參數460億,激活參數僅25億,在多個能力基準測試中表現出色,為實際應用提供了高效且強大的解決方案。
Kwai-Keye
快手Keye-VL是由快手Keye團隊打造的前沿多模態大語言模型,在視頻理解、視覺感知和推理任務中表現卓越。1.5版本通過創新的快慢視頻編碼策略、LongCoT冷啟動數據管道和強化學習訓練策略,在視頻理解、圖像感知和推理能力上達到新高度,支持長達128k標記的擴展上下文長度。
Kwai-Kolors
可圖(Kolors)是快手可圖團隊自研的大規模文生圖潛空間擴散模型,在生成圖像視覺質量、複雜語義還原度、中英文字體渲染等方面表現優異。