智譜團隊開源四項視頻生成核心技術,包括GLM-4.6V視覺理解、AutoGLM設備控制、GLM-ASR語音識別和GLM-TTS語音合成模型,展示其在多模態領域的最新進展,爲視頻生成技術發展奠定基礎。
智譜開源AI Agent模型AutoGLM,該模型具備“Phone Use”能力,可穩定完成外賣點單、機票預訂等長達數十步的複雜手機操作。開源後,硬件廠商、手機廠商及開發者可在自有系統中復現能“看懂屏幕”、像真人一樣完成點擊、輸入、滑動等操作的AI助手。目前AutoGLM已支持微信、淘寶、抖音等超過50款高頻中文應用。
《AI日報》欄目每日提供AI領域熱點內容,聚焦開發者,幫助瞭解技術趨勢和創新產品。今日重點介紹智譜AI發佈的革命性產品AutoGLM 2.0,該產品通過自然語言理解和多平臺操作功能,實現語音操控,替代手動操作,具有劃時代意義。
智譜AI發佈AutoGLM2.0,以強大自然語言處理能力實現語音指令操控數字生活。用戶通過語音即可完成訂票、發視頻等複雜任務,徹底改變人機交互方式。
AI助手,提供觸控執行、內容理解和內容生成。