英偉達發佈OmniVinci全模態理解模型,在多項基準測試中領先頂尖模型19.05分。該模型僅用0.2萬億訓練Token,數據效率達競爭對手六倍,旨在實現視覺、音頻和文本的統一理解,推動機器多模態認知能力發展。
英偉達發佈全模態理解模型OmniVinci,在基準測試中比頂尖模型高出19.05分,僅用1/6訓練數據就實現卓越性能。該模型旨在讓AI系統同時理解視覺、音頻和文本,模擬人類多感官感知世界。
nvidia
OmniVinci是NVIDIA開發的全模態理解大語言模型,具備視覺、文本、音頻處理和語音交互能力,支持多模態推理和理解。