智谱团队开源四项视频生成核心技术,包括GLM-4.6V视觉理解、AutoGLM设备控制、GLM-ASR语音识别和GLM-TTS语音合成模型,展示其在多模态领域的最新进展,为视频生成技术发展奠定基础。
智谱开源AI Agent模型AutoGLM,该模型具备“Phone Use”能力,可稳定完成外卖点单、机票预订等长达数十步的复杂手机操作。开源后,硬件厂商、手机厂商及开发者可在自有系统中复现能“看懂屏幕”、像真人一样完成点击、输入、滑动等操作的AI助手。目前AutoGLM已支持微信、淘宝、抖音等超过50款高频中文应用。
《AI日报》栏目每日提供AI领域热点内容,聚焦开发者,帮助了解技术趋势和创新产品。今日重点介绍智谱AI发布的革命性产品AutoGLM 2.0,该产品通过自然语言理解和多平台操作功能,实现语音操控,替代手动操作,具有划时代意义。
智谱AI发布AutoGLM2.0,以强大自然语言处理能力实现语音指令操控数字生活。用户通过语音即可完成订票、发视频等复杂任务,彻底改变人机交互方式。
AI助手,提供触控执行、内容理解和内容生成。