O voyage-multimodal-3, lançado pela Voyage AI, é um modelo de embedding multimodal que vetorializa texto e imagens (incluindo capturas de tela de PDFs, apresentações, tabelas etc.), captando características visuais-chave para aumentar a precisão da recuperação de documentos. Esse avanço tecnológico é crucial para RAG e busca semântica em bancos de conhecimento ricos em informações visuais e textuais. O voyage-multimodal-3 melhorou a precisão da recuperação em tarefas de recuperação multimodal em 19,63% em média, superando outros modelos.