近日,微軟宣佈重磅升級其開源項目 AgentUFO,推出了全新的 UFO² 版本,該版本新增了操作系統功能,並與 Windows 系統實現了深度集成。此舉不僅增強了自動化任務的執行效率,還使得用戶能夠更便捷地進行復雜操作。UFO² 的一個顯著特點是其能夠直接調用 Windows 的原生 API 和 COM 接口。這種方式相比傳統的機器人流程自動化(RPA),能夠在執行復雜業務時更加高效且精準。例如,在 Excel 中將表格數據轉換爲圖表,傳統 RPA 需要模擬多次點擊鼠標,而 UFO² 則可以通過一次 API 調用輕鬆完成,
["哈佛科學家提出外星UFO可能是人工智能計算機程序。","探測器穿越星際距離可能需要人工智能,因爲它們需要自主性和獨立的大腦。","哈佛的“伽利略計劃”使用深度學習來尋找地球附近的UFO並研究其可能的外星起源。"]
["NASA強調人工智能在尋找外星生命和UFO方面的關鍵作用。","NASA發佈36頁UFO報告,強調人工智能和機器學習的必要性。","NASA計劃使用人工智能來檢測異常現象,繼續探索宇宙,尋找適宜居住的星球。","人工智能的使用在NASA的研究中備受關注,但也需要監管措施確保安全和道德使用。"]
UFO是一個用於Windows操作系統交互的UI聚焦雙Agent框架
ufoym
這是Qwen3-8B模型的GGUF格式版本,適用於llama.cpp框架,支持文本生成任務。
unum-cloud
UForm是一款輕量級多模態AI模型,支持圖像和文本的多語言理解與生成。該模型可將21種語言映射到共享向量空間,生成高達256維的嵌入向量,具有高效的參數共享架構和跨平臺兼容性。
UForm是一款小巧的多模態AI模型,可將視覺和英文文本映射到共享向量空間,支持內容理解與生成。該模型採用輕量級設計,文本編碼器為4層BERT,視覺編碼器為ViT-S/16,可生成256維嵌入向量。
UForm-Gen2-dpo 是一個小型生成式視覺語言模型,通過直接偏好優化(DPO)在 VLFeedback 和 LLaVA-Human-Preference-10K 偏好數據集上針對圖像描述生成和視覺問答任務進行對齊訓練。
UForm-Gen是一款小型生成式視覺語言模型,主要用於圖像描述生成和視覺問答。
UForm-Gen-Chat是UForm-Gen的多模態對話精調版本,主要用於圖像描述生成和視覺問答任務。