L’annotation d’images en machine learning ou en deep learning, est le processus par lequel des images sont labellisées ou classées à l’aide de textes ou d’outils d’annotation, ou les deux à la fois permettant à un système d’intelligence artificielle (un robot, une machine ou un système automatisé, etc) de reconnaître des caractéristiques de données par lui-même. Annoter une image c’est ajouter des métadonnées à un ensemble de données.

Les différents types d’annotation d’images

L’annotation d’images est un type de labellisation de données. Elle est aussi parfois appelée taggage, transcription ou encore traitement. En effet, il est possible d’annoter des vidéos en continu, en flux ou image par image.

L’annotation d’images permet à votre système d’apprentissage automatique de reconnaître les éléments marqués que vous souhaitez qu’il reconnaisse. Les images peuvent être utilisées pour l’apprentissage supervisé de votre système. Une fois votre système entraîné, il sera en mesure de prendre une décision ou d’effectuer une action selon sa capacité à identifier les caractéristiques des images annotées.

L’annotation d’images est le plus souvent utilisée pour reconnaître des objets, des limites et pour segmenter des images en vue de la compréhension de leur contenu, de la signification ou de l’image entière. Pour chacune de ces utilisations, il faut une quantité importante de données pour former, valider et tester un modèle d’apprentissage automatique afin d’obtenir le résultat souhaité. L’annotation d’images peut être simple dans le cas où il est uniquement question de classer l’image selon sa description (exemple : nous avons une image d’un chat dans un salon, nous pouvons taguer l’image du chat avec le libellé “chat domestique”). Il peut être aussi complexe dans le cas où nous avons besoin de distinguer différents éléments ou zones de l’image à annoter (par exemple : nous avons besoin d’apprendre à notre machine à reconnaître la différence entre un chat siamois et un chat persan). 

Il y a 4 principaux types d’annotation d’images :

  • la classification,
  • la détection d’objet,
  • la segmentation sémantique
  • et la segmentation d’image deep learning

La classification

La classification est un type d’annotation d’images qui consiste à identifier la présence d’objets similaires représentés dans des images sur l’ensemble d’un ensemble de données. Ce type d’annotation est utilisé pour entraîner une machine à reconnaître un objet dans une image non labellisée, qui ressemble à un objet dans d’autres images déjà labellisées, déjà utilisées pour l’entraînement de la machine. 

Par exemple : un annotateur peut taguer des images d’intérieur avec les tags suivants selon leur type : cuisine, salon, etc. Il peut également taguer les images d’extérieur en déterminant si c’est le “jour” ou la “nuit”. 

La détection d’objets

La détection d’objets est une forme d’annotation qui consiste à identifier la présence, la position et le nombre d’un ou plusieurs objets dans une image et de les annoter le plus précisément possible. Il est possible d’annoter des objets dans une image avec des techniques telles que l’annotation de polygones ou l’annotation bounding box. Par exemple, nous pouvons avoir plusieurs images de scènes de rue dans lesquelles nous voulons identifier les camions, les piétons, les vélos ou encore des voitures. Il est possible de les annoter séparément sur la même image grâce à la détection d’objets.

La segmentation sémantique

La segmentation sémantique est une application plus avancée de l’annotation d’images. Elle est utilisée de plusieurs manières pour analyser le contenu visuel des images et déterminer en quoi les objets d’une image sont différents ou identiques. Cette méthode est utilisée lorsque nous voulons comprendre la présence, l’emplacement et parfois la taille et/ou la forme des objets des images. 

Par exemple : nous avons plusieurs images incluant une foule et un stade sur lesquelles nous voulons annoter, il est possible d’annoter la foule pour segmenter les sièges du stade.

La segmentation d’images deep learning permet de suivre et de compter la présence, la position, le nombre, la taille et la forme des objets présents dans une image. En utilisant l’exemple précédent du stade et de la foule, il est possible d’annoter à la fois les individus dans le stade et de déterminer le nombre de personnes dans la foule grâce à ce type d’annotation et à l’aide de la segmentation par pixel. 

La détection des limites

L’annotation d’images peut être également utilisée pour entraîner des machines à reconnaître les limites ou les lignes des objets (appelé en anglais “Boundary recognition”) figurant dans une image. Ces limites peuvent inclure les bords d’un objet individuel ou encore la zone de topographie affichée dans l’image. Ce type d’annotation est utilisé dans l’entraînement des voitures autonomes. Il sert à reconnaître les limites des trottoirs par exemple, ou encore les voies de circulation, etc.

Il peut également être utilisé dans l’entraînement des modèles d’apprentissage automatique pour les drones où il est important de suivre un parcours particulier ou de reconnaître des obstacles potentiels comme les lignes électriques, par exemple. 

La médecine ou le retail font aussi recours à ce type d’annotation pour améliorer leur système d’apprentissage automatique : pour l’annotation des imageries médicales par exemple où l’on doit reconnaître les différentes cellules, ou les différents rayons d’un magasin où nous pouvons nous concentrer sur les rayons les plus remplies et exclure les autres allées qui ne correspondent pas à ce que nous voulons annoter.

Comment faire de l’annotation d’images ?

Pour annoter vos images, plusieurs outils d’annotations de données existent. Certains outils sont disponibles à la vente comme d’autres sont trouvables en open source ou en freeware. Vous cherchez un partenaire pour vous accompagner dans l’annotation de vos images ? Isahit dispose de son propre outil innovant d’annotation au sein de sa plateforme digitale socialement responsable et d’une communauté de contributeurs compétents, répartis sur 4 continents prêts à vous aider.

ℹ️ Demandez une démonstration d’annotations d’images et parlons ensemble de votre projet.

Pour en savoir plus sur nos services d’annotations, consultez nos solutions pour la computer vision.