La détection d’anomalies vidéo est un secteur en expansion dans le domaine de la vision par ordinateur. Elle joue un rôle clé dans les systèmes de surveillance, qui nécessitent souvent des réponses immédiates. « Les méthodes de détection semi-supervisées ont suscité un intérêt croissant puisqu’elles permettent d’identifier les anomalies en détectant les écarts par rapport aux modèles normaux », souligne Mohammad Baradaran, auxiliaire de recherche de troisième cycle à la Faculté des sciences et de génie de l'Université Laval et premier auteur de l’étude.
Malgré une amélioration des performances, les méthodes existantes manquent souvent d’interprétabilité et de fiabilité. Mohammad Baradaran a collaboré avec Robert Bergevin, professeur à la Faculté des sciences et de génie, pour offrir une nouvelle perspective aux scientifiques dans le domaine de la vision par ordinateur. Contrairement aux études précédentes, les réseaux neuronaux profonds sont examinés du point de vue de l’extraction de caractéristiques spatiotemporelles adaptées à la détection d’anomalies vidéo.
« Cette évaluation fournit des indications précieuses pour les futurs travaux de recherche. Elle aide les utilisatrices et les utilisateurs à sélectionner le modèle approprié en fonction de leurs utilisations spécifiques et de leurs attentes », explique Mohammad Baradaran.
Par exemple, les méthodes qui se concentrent principalement sur l’analyse de caractéristiques de bas niveau, telle la couleur, ne sont pas adaptées pour la surveillance par caméras, qui demande de détecter des classes d’objets.
Pallier les lacunes
Grâce aux connaissances tirées de leur analyse, les deux chercheurs ont conçu et formulé de nouvelles méthodes, chacune visant à combler des lacunes observées dans les approches existantes. « Notre objectif est d’aider les chercheurs à développer des méthodes de détection d’anomalies vidéo plus efficaces », indique l’auxiliaire de recherche.
Il ajoute que de plus en plus de caméras de surveillance sont installées dans les lieux publics, comme les aéroports ou les centres commerciaux, mais que c’est impossible de surveiller toutes ces caméras en même temps. « À l’aéroport international d’Istanbul, il y a plus de 11 000 caméras ! Nous avons besoin de systèmes informatiques intelligents dotés d’une intelligence artificielle. Ces systèmes peuvent rapidement vérifier tous les flux de caméras et informer la sécurité si quelque chose d’inhabituel se produit », conclut Mohammad Baradaran.
L’étude, intitulée «A Critical Study on the Recent Deep Learning Based Semi-Supervised Video Anomaly Detection Methods», a été publiée dans la revue scientifique Multimedia Tools and Applications.