字節、上海交大聯合推全新語音模型LSLM 可邊聽邊說
上海交通大學與字節跳動合作開發的LSLM全雙工語言模型,顛覆了傳統AI助手交互模式,實現邊說邊聽的實時交互。LSLM核心優勢在於其同時處理語音輸入與生成輸出的能力,顯著提升對話自然流暢性。通過結合流式自監督學習與基於token的解碼器,該模型支持實時語音交互,甚至在嘈雜環境中表現優異。LSLM的中期融合策略在語音生成與實時交互間取得最佳平衡,展現強大噪聲抵抗與指令敏感性。此技術突破不僅大幅提升了用戶體驗,還具有廣泛的應用前景,預示着人機交互新時代的來臨,AI助手將與人類對話更加自然、流暢,技術與人性的融合達到新高度。