Infini-Megrez es un modelo de comprensión multimodal para dispositivos perimetrales desarrollado por WuWenXinQiong. Se basa en la extensión Megrez-3B-Instruct y cuenta con la capacidad de comprender y analizar datos de tres modalidades: imágenes, texto y audio, logrando la máxima precisión en comprensión de imágenes, lenguaje y voz. Gracias a la optimización de la sinergia entre software y hardware, se asegura una alta compatibilidad de los parámetros de estructura con el hardware predominante, con una velocidad de inferencia hasta un 300% superior a la de modelos de igual precisión. Es fácil de usar, emplea la estructura LLaMA original y los desarrolladores pueden implementarlo en diversas plataformas sin modificaciones, minimizando la complejidad del desarrollo secundario. Además, Infini-Megrez ofrece una solución completa de búsqueda web, permitiendo al modelo decidir automáticamente cuándo realizar la búsqueda, alternar entre búsqueda y conversación y ofrecer mejores resúmenes.