AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
數據集市
TW

AI資訊

查看更多

vLLM-Omni開源:把擴散模型、ViT、LLM塞進一條流水線,多模態推理一次跑完

vLLM團隊推出首個“全模態”推理框架vLLM-Omni,將文本、圖像、音頻、視頻的統一生成從概念驗證變爲可落地的代碼。該框架採用解耦流水線架構,包括模態編碼器(如ViT、Whisper)、LLM核心(沿用vLLM自迴歸引擎)和模態生成器(如DiT、Stable Diffusion),支持多模態輸入與輸出。開發者可通過GitHub和ReadTheDocs獲取,並立即pip安裝使用。

8.5k 19 分鐘前
vLLM-Omni開源:把擴散模型、ViT、LLM塞進一條流水線,多模態推理一次跑完

vLLM-Omni 發佈:可以處理文本、圖像、音頻和視頻

vLLM團隊推出vLLM-Omni推理框架,支持文本、圖像、音頻和視頻等多模態輸入輸出,旨在簡化多模態推理過程,爲新一代全模態模型提供強大支持。

6.9k 15 分鐘前
vLLM-Omni 發佈:可以處理文本、圖像、音頻和視頻
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖