O doesVideoContain é um modelo que utiliza inteligência artificial para detectar o conteúdo de vídeos no navegador. Permite que os usuários extraiam automaticamente capturas de tela de vídeos e identifiquem momentos importantes por meio de descrições em frases simples em inglês. Este modelo roda completamente no lado do cliente, protegendo a privacidade do usuário, sem custos de API e com capacidade de processar arquivos locais grandes sem necessidade de upload para a nuvem. Ele utiliza Transformers.js e ONNX Runtime Web do ecossistema Web AI, combinados com lógica personalizada para executar cálculos de similaridade de cosseno.