遊戲場景的智能助手來了!開源大模型 VideoGameBunny 讓你玩得更嗨
在遊戲開發領域,大模型逐漸成爲不可或缺的“智囊團”,從AI角色生成到場景構建,展現全面能力。然而,遊戲場景理解、圖像識別與內容描述仍需提升。加拿大阿爾伯塔的研究團隊推出開源大模型VideoGameBunny(VGB),針對遊戲開發優化,具備多語言支持、高度可定製性、強大的文本生成能力、開源易訪問性、兼容多種開發環境、豐富的模型文件和活躍社區支持。VGB支持多種功能,如遊戲對話系統、教育應用、客服聊天機器人等。其核心組件Bunny模型,通過多層感知器網絡將視覺信息轉換爲圖像標記,高效處理遊戲數據。通過與Meta開源LLama-3-8B結合使用SigLIP視覺編碼器和S2包裝器,VGB能夠捕捉遊戲視覺內容的多尺度特徵,理解遊戲環境,並生成匹配遊戲圖像的指令數據,如簡短和詳細的標題、圖像到JSON的描述及基於圖像的問答,從而提升遊戲的互動性和沉浸感,成爲開發者和玩家的強大助手。