La forte augmentation de la taille de la bande passante, des ressources de stockage ainsi que des performances des ordinateurs et des smartphones/tablettes a permis la généralisation des contenus multimédia et de leurs usages sur Internet comme dans la vie quotidienne.
Aujourd’hui, nous communiquons de plus en plus en partageant des vidéos et des images. Les évolutions technologiques ont permis ce changement.
Chaque jour, ce sont près de 2 milliards de photos qui sont postées sur
les réseaux sociaux1 et, chaque minute, ce sont 100 heures de vidéos qui
sont mises en ligne sur YouTube2. Cette explosion complexifie grandement
la tâche de contrôle des contenus par les éditeurs de réseaux sociaux,
de plates-formes de partage et de plates-formes de stockage en ligne d’images et vidéos,
qui ont de plus en plus de difficultés à trier efficacement
et rapidement les contenus adressés par les internautes. De même les éditeurs
de solutions de filtrage proposent désormais des solutions « incomplètes »
car une partie importante des contenus n’est plus filtrée. Bloquer les sites
et les domaines identifiés comme étant pour adultes ne suffit plus à empêcher
l’échange et le partage de contenus inappropriés.
(1 KPCB – Internet Trends 2014. 2 YouTube)
L’industrie de la pornographie a su profiter de ces évolutions. La facilité d’accès à ce type de contenu expose davantage les mineurs et impacte la productivité en entreprises. Pour garantir une utilisation appropriée d’Internet, il est nécessaire de pouvoir analyser ces contenus et d’identifier ceux qui sont inappropriés.
L’identification en temps réel de la nudité ou de la pornographie contenue dans un flux vidéo s’effectue aujourd’hui manuellement. Si cela rend possible le blocage de certains sites, ces techniques ne sont plus suffisantes. La multiplication des plates-formes de stockage et de diffusion, publiques comme privées, rend ce type de catégorisation irréaliste. Il est également possible d’identifier les textes accompagnant des vidéos mais ces textes ne sont pas forcément en rapport avec le contenu de ces dernières.
Pour cette raison, Profil Technology a relevé ce défi en développant une technologie innovante d’analyse de contenu d’image et de vidéo : VISIA Technology (Video, Streaming & Image Analysis).
VISIA Technology est une technologie de reconnaissance en rupture avec les technologies précédentes pour répondre aux nouvelles formes de consommation de l’information et de communication.
Elle permet de détecter, d’analyser, de classifier les images et les vidéos à caractère pornographique que ce soit sur des supports physiques ou sur des flux en streaming. L’équipe de recherche et développement de Profil Technology a développé sa propre technologie de vision artificielle, basée sur la reconnaissance visuelle de formes par les ordinateurs. Elle identifie les informations les plus pertinentes et les plus significatives des images et des vidéos. Ces informations sont ensuite extraites, interprétées et analysées par l’intelligence artificielle propriétaire de Profil Technology, qui détermine la présence de contenus inappropriés. La technologie reste efficace quelles que soient l’échelle (taille), la position et l'orientation de l’image ou de la vidéo analysée. Loin de la simple détection de couleur de peau, VISIA Technology se base sur l’apprentissage, la fusion de données, la détection et la reconnaissance des formes visuelles.
Cette technologie, disponible sous la forme d’un SDK, peut se déployer suivant les deux grands modes de disponibilité des images et des vidéos :
L’identification des contenus explicites en ligne basée sur l’analyse sémantique de texte n’est plus suffisante. VISIA Technology analyse des flux streamés en temps réel et est donc capable d’identifier des contenus inappropriés. Même si la séquence est brève ou n’apparait que tardivement, elle sera néanmoins détectée par notre technologie.
La détection s’opère pendant que la vidéo est visionnée en ligne, sans ralentissement ni période d’attente (seul un chargement initial en mémoire de 5 à 10 secondes maximum est requis). Cette technologie ne nécessite pas de configuration particulièrement performante.
VISIA Technology rend possible l’analyse de n’importe quel type de support numérique afin de détecter la présence d’images ou de vidéos à contenu explicite. Les fichiers présents sur les supports de stockage ciblés sont analysés en profondeur. Ils sont reconnus par leur syntaxe et non par leur extension. Ainsi, une image ou une vidéo dissimulée dans un fichier de type .xlsx, .docx, .pdf, ou dans un fichier compressé type rar, zip, etc... sera détectée et analysée.
Nos algorithmes ont subi plusieurs phases d’optimisation qui leur permettent une exécution à la volée sur du matériel standard grand public.
Grâce à l’efficacité de nos algorithmes, nous dépassons les 95% de taux de détection tout en conservant un taux de faux positifs faible.
Le réglage asymétrique permet de définir le niveau de détection souhaité afin de minimiser le nombre de faux positifs ou le nombre de faux négatifs. Autrement dit, pour un usage familial il sera ainsi possible d’empêcher l’affichage de vidéos pornographiques de façon exhaustive afin d’éviter qu’un enfant soit confronté à ce type de contenu, quitte à bloquer quelques vidéos non pornographiques (faux positifs) et en milieu professionnel, il sera préférable de laisser passer quelques vidéos pornographiques plutôt que de risquer de bloquer des vidéos utiles de clients ou de fournisseurs (faux négatifs).
Le cœur de VISIA Technology fonctionne avec les systèmes d'exploitation : Linux, Mac OS X et Windows.
VISIA Technology est compatible avec plus de 100 formats de fichiers dont JPG, PNG, GIF, BMP, AVI, MP4, FLV etc.
Ce SDK offre la possibilité de développer ses propres applications ou d’intégrer ses fonctionnalités de détection dans des produits tiers.
Ces applications peuvent permettre le scan de n’importe quel type de support numérique afin de détecter la présence d’images ou de vidéos à contenu explicite. Pour les vidéos, ces applications auront la possibilité de bloquer ou tout simplement de sauter ou de flouter les séquences dérangeantes.
Ce kit de développement est fourni sous forme de librairie native pouvant s’interfacer avec de nombreux langages tels que C, C++ et C#.
Il contient, outre une documentation détaillée des APIs disponibles, des exemples d’applications de scan sous forme de code source pour vous guider dans vos développements.
Exemples d’intégration de VISIA Technology