O MiniCPM-Llama3-V 2.5 é o mais recente modelo multimodal para dispositivos de ponta lançado pelo projeto OpenBMB. Com 8 bilhões de parâmetros, ele suporta interação multimodal em mais de 30 idiomas e supera vários modelos comerciais proprietários em desempenho multimodal abrangente. Através de técnicas como quantização de modelos, otimização de CPU, NPU e compilação, ele consegue uma implantação eficiente em dispositivos finais, apresentando excelentes capacidades de OCR, comportamento confiável e suporte multilíngue.