智譜團隊開源四項視頻生成核心技術,包括GLM-4.6V視覺理解、AutoGLM設備控制、GLM-ASR語音識別和GLM-TTS語音合成模型,展示其在多模態領域的最新進展,爲視頻生成技術發展奠定基礎。
智譜AI推出GLM-ASR系列開源語音識別模型,併發布桌面端“智譜AI輸入法”,提升PC語音輸入體驗。其中GLM-ASR-2512雲端模型支持實時轉寫,在複雜環境中表現優異,字符錯誤率(CER)極低。