字节跳动发布UI-TARS-1.5:开源多模态代理引领GUI自动化新风潮
字节跳动在Hugging Face平台正式发布了UI-TARS-1.5,一款基于强大视觉语言模型构建的开源多模态代理。这一发布标志着字节跳动在AI自动化交互领域的又一重大突破,为开发者与用户提供了一个高效、智能的跨平台GUI(图形用户界面)自动化解决方案。UI-TARS-1.5:多模态代理的创新标杆UI-TARS-1.5是字节跳动继UI-TARS系列后的全新迭代,专为自动化图形界面交互设计,具备卓越的感知、推理、行动和记忆能力。该模型采用端到端架构,依托纯视觉输入,能够实时理解动态界面,并通过自然语言指令完