L'intelligence artificielle est en train de surmonter les dernières limites de la compréhension vidéo. Bien que les outils d'IA disponibles sur le marché puissent analyser une seule vidéo et en produire un résumé, ils se révèlent insuffisants face à des contenus vidéo s'étendant sur des milliers d'heures. Cette limite technique pose problème aux entreprises de sécurité et aux sociétés de marketing : la première doit filtrer d'énormes quantités de vidéos de surveillance, tandis que la seconde souhaite analyser différentes campagnes de marketing vidéo et des séquences de produits.

Une jeune entreprise nommée Memories.ai redéfinit ce domaine grâce à une technologie innovante. Cette plateforme d'IA a la capacité impressionnante de traiter jusqu'à 10 millions d'heures de vidéos, offrant ainsi à des entreprises possédant d'importantes données vidéo une couche complète de compréhension contextuelle, comprenant un index recherchable, un système de balises, une segmentation des fragments et une agrégation des données.

Investissement, financement, argent

Les deux cofondateurs de l'entreprise ont un solide parcours professionnel. Le Dr Shen a travaillé comme chercheur scientifique au laboratoire de réalité virtuelle de Meta, tout en suivant son doctorat, tandis que Zhou Wenmin était ingénieur en apprentissage automatique chez Meta. Cette base technique a permis à Memories.ai de construire une innovation solide.

Lors d'une interview, le Dr Shen a souligné le problème central du domaine de l'IA actuel : « Les grandes entreprises d'IA comme Google, OpenAI et Meta se concentrent sur le développement de modèles end-to-end. Bien que ces capacités soient excellentes, ces modèles présentent souvent des limites lorsqu'ils doivent comprendre le contexte de vidéos supérieures à une ou deux heures. »

Il a ensuite expliqué : « Mais lorsque les humains utilisent leur mémoire visuelle, nous trions d'énormes quantités de données contextuelles. C'est cette idée qui nous a inspirés pour créer une solution capable de mieux comprendre le contenu de vidéos s'étendant sur plusieurs heures. »

Cette vision a trouvé un fort soutien des investisseurs. Memories.ai vient de finaliser une levée de fonds de 8 millions de dollars en série A menée par Susa Ventures, avec la participation de Samsung Next, Fusion Fund, Crane Ventures, Seedcamp et Creator Ventures. Il est intéressant de noter que l'entreprise avait initialement prévu de lever 4 millions de dollars, mais grâce à l'intérêt des investisseurs, elle a obtenu une souscription excessive.

Micha Gordon-Ro, partenaire de Susa Ventures, a exprimé sa haute estimation des fondateurs : « Shen est un fondateur très compétent techniquement, passionné par l'expansion des limites de la compréhension vidéo et de l'intelligence. Memories.ai peut libérer une grande quantité de données d'intelligence visuelle de premier plan grâce à ses solutions. Nous pensons qu'il y a un vide sur le marché concernant l'intelligence visuelle à long terme, c'est précisément ce qui nous a attirés dans cette entreprise. »

Le raisonnement d'investissement de Samsung Next est différent. Cette division d'investissement de Samsung a mis l'accent sur le potentiel du marché grand public de Memories.ai. Sam Campbell, partenaire de Samsung Next, a déclaré : « Ce qui nous attire chez Memories.ai est sa capacité à effectuer un calcul important directement sur les appareils. Cela signifie que vous n'avez pas nécessairement besoin de stocker vos données vidéo dans le cloud. Cela peut offrir de meilleures applications de sécurité à ceux qui hésitent à installer des caméras de sécurité à la maison en raison de préoccupations liées à la vie privée. »

La structure technique de Memories.ai démontre sa force innovante. L'entreprise utilise une pile technologique et des modèles développés en interne pour l'analyse. Elle commence par éliminer le bruit des vidéos, puis traite les données via une couche de compression, stockant uniquement les informations importantes. Ensuite, il y a une couche d'indexation permettant de rechercher les données vidéo par requêtes en langage naturel, avec des fonctionnalités de segmentation et de balisage. Enfin, une couche d'agrégation regroupe les données indexées pour aider à générer des rapports.

Aujourd'hui, l'entreprise sert principalement deux types d'entreprises : les sociétés de marketing et les entreprises de sécurité. Les sociétés de marketing peuvent utiliser ses outils pour trouver des tendances liées à leur marque sur les réseaux sociaux et déterminer les types de vidéos à produire. Memories.ai propose également à ces professionnels des outils de création vidéo. En parallèle, l'entreprise collabore avec des entreprises de sécurité pour les aider à analyser les vidéos de surveillance, en identifiant les comportements potentiels dangereux des personnes dans les vidéos via l'inférence de modèles.

Pour l'instant, les entreprises qui collaborent avec Memories.ai doivent télécharger leurs bibliothèques de vidéos sur la plateforme pour les analyser. Toutefois, le Dr Shen a révélé que les clients pourront bientôt créer des disques partagés et synchroniser plus facilement leurs contenus. L'objectif ultime est que les utilisateurs puissent poser des questions telles que « Dites-moi tout sur toutes les personnes interviewées la semaine dernière. »

Le rêve du Dr Shen est encore plus ambitieux : il imagine développer un assistant IA capable de comprendre le contexte de la vie d'un utilisateur à partir de ses photos ou de ses lunettes intelligentes. Il pense également que cette technologie aura un rôle important dans l'entraînement des robots humanoïdes pour accomplir des tâches complexes ou dans l'aide aux voitures autonomes pour mémoriser différentes routes.

L'entreprise compte actuellement 15 employés et prévoit d'utiliser les fonds récemment obtenus pour renforcer son équipe et améliorer sa fonction de recherche. Sur le plan de la concurrence, Memories.ai fait face à des startups similaires comme mem0 et Letta, qui proposent également des couches de mémoire pour les modèles d'IA, bien que leurs capacités vidéo soient actuellement limitées. En outre, elle doit aussi faire face à des entreprises comme TwelveLabs et Google, qui ont déjà des avancées dans l'aide aux modèles d'IA pour comprendre les vidéos.

Cependant, le Dr Shen pense que la solution de son entreprise est plus scalable et peut fonctionner en synergie avec différents modèles vidéo. Cette avance technologique pourrait être le facteur clé permettant à Memories.ai de se distinguer dans une concurrence intense.