近日,微软宣布重磅升级其开源项目 AgentUFO,推出了全新的 UFO² 版本,该版本新增了操作系统功能,并与 Windows 系统实现了深度集成。此举不仅增强了自动化任务的执行效率,还使得用户能够更便捷地进行复杂操作。UFO² 的一个显著特点是其能够直接调用 Windows 的原生 API 和 COM 接口。这种方式相比传统的机器人流程自动化(RPA),能够在执行复杂业务时更加高效且精准。例如,在 Excel 中将表格数据转换为图表,传统 RPA 需要模拟多次点击鼠标,而 UFO² 则可以通过一次 API 调用轻松完成,
["哈佛科学家提出外星UFO可能是人工智能计算机程序。","探测器穿越星际距离可能需要人工智能,因为它们需要自主性和独立的大脑。","哈佛的“伽利略计划”使用深度学习来寻找地球附近的UFO并研究其可能的外星起源。"]
["NASA强调人工智能在寻找外星生命和UFO方面的关键作用。","NASA发布36页UFO报告,强调人工智能和机器学习的必要性。","NASA计划使用人工智能来检测异常现象,继续探索宇宙,寻找适宜居住的星球。","人工智能的使用在NASA的研究中备受关注,但也需要监管措施确保安全和道德使用。"]
UFO是一个用于Windows操作系统交互的UI聚焦双Agent框架
ufoym
这是Qwen3-8B模型的GGUF格式版本,适用于llama.cpp框架,支持文本生成任务。
unum-cloud
UForm是一款轻量级多模态AI模型,支持图像和文本的多语言理解与生成。该模型可将21种语言映射到共享向量空间,生成高达256维的嵌入向量,具有高效的参数共享架构和跨平台兼容性。
UForm是一款小巧的多模态AI模型,可将视觉和英文文本映射到共享向量空间,支持内容理解与生成。该模型采用轻量级设计,文本编码器为4层BERT,视觉编码器为ViT-S/16,可生成256维嵌入向量。
UForm-Gen2-dpo 是一个小型生成式视觉语言模型,通过直接偏好优化(DPO)在 VLFeedback 和 LLaVA-Human-Preference-10K 偏好数据集上针对图像描述生成和视觉问答任务进行对齐训练。
UForm-Gen是一款小型生成式视觉语言模型,主要用于图像描述生成和视觉问答。
UForm-Gen-Chat是UForm-Gen的多模态对话精调版本,主要用于图像描述生成和视觉问答任务。