O Video-MME é um benchmark focado na avaliação de desempenho de modelos de linguagem grandes multimodais (MLLMs) no campo da análise de vídeo. Ele preenche a lacuna na capacidade de processamento de dados visuais contínuos por MLLMs nas metodologias de avaliação existentes, fornecendo aos pesquisadores uma plataforma de avaliação completa e de alta qualidade. O benchmark abrange vídeos de diferentes comprimentos e avalia as capacidades centrais dos MLLMs.