Created with Snap Created with Snap Created with Snap Created with Snap Created with Snap Created with Snap

Newsletter isahit – Août 2018 : Intelligence artificielle : la reconnaissance d’objet ou d’images

Ca y est, c’est la rentrée et nos newsletters reprennent ! Nous revenons avec un sujet qui nous passionne et qui anime notre plateforme de tâches digitales socialement responsables : l’intelligence artificielle (IA).

Avec l’essor des nouvelles technologies et la mutation de la société de demain vers le numérique, l’intelligence artificielle est en train de gagner du terrain dans nos vies quotidiennes. Elle impacte tous les secteurs de l’économie mondiale.

L’intelligence artificielle, qu’est-ce que c’est ? C’est un ensemble de techniques (machine learning, deep learning, computer vision, natural language processing, …) qui permettent à des machines d’imiter une forme d’intelligence humaine (essentiellement grâce à des tâches simples et répétitives). Aujourd’hui, l’intelligence artificielle est au coeur de toutes les stratégies de développement de grands secteurs industriels comme l’automobile, l’immobilier, la santé, etc avec la reconnaissance d’objet ou d’images. En effet, nous avons plusieurs exemples concrets en cours d’expérimentation qui méritent de s’y intéresser comme la voiture autonome qui utilise la technique de la reconnaissance visuelle, issue du deep learning.

 

Source : Intertraffic

 

La reconnaissance d’objet ou d’images, comment est-ce possible ?

L’intelligence artificielle existe aujourd’hui grâce à l’assimilation de milliards de données (Big Data), instruments qui permet à la machine de comprendre et d’apprendre à la machine à penser comme les humains. Ces données transférées à la machine restent un défi complexe pour l’IA. En effet, il y a encore du progrès pour que la machine arrive à voir et à penser voire décider comme un humain.

Le deep-learning est une sous-catégorie de l’apprentissage automatique (Machine Learning), un sous-domaine de l’intelligence artificielle. Grâce au deep learning, un algorithme peut être programmé pour détecter certaines formes et détails depuis les images en provenance d’une caméra vidéo. Suivant la base de données attribuée, il pourra repérer un individu recherché dans une foule, détecter le taux de satisfaction à la sortie d’un magasin en détectant les sourires, etc.

D’après Jean Ponce, chercheur en vision artificielle et directeur du département d’informatique à l’ENS, « Reconnaître un objet pose beaucoup de problèmes, un objet n’a pas le même aspect selon l’angle de la prise de vue, et deux chaises n’ont par exemple pas la même forme, couleur et texture » . De la même manière, un humain ou un animal n’ont pas la même forme selon leur position ou selon le point de vue de l’image, ce qui augmente, pour la machine, la difficulté de les identifier. Comment une voiture autonome peut-elle différencier un auto-stoppeur d’un policier qui lui fait signe de s’arrêter ? Un sac plastique sur la route d’une pierre à éviter ?

 

Source : SamaSource

Prenons le cas de la voiture autonome :

Aujourd’hui, Tesla commercialise plus de 250 000 voitures qui sont déjà sur les routes. Chacune de ces voitures sont dotées de caméras et capteurs de haute qualité pour capturer l’environnement, le monde qui les entoure. Les séquences vidéos collectées par une flotte de cette taille peuvent alimenter un système d’apprentissage faisant appel au Deep Learning, technique basée sur les réseaux de neurones artificiels, a des propriétés « très similaires au système visuel humain ». D’autres entreprises commercialisant des voitures autonomes font appel également à cette nouvelle fonction qui est de suivre des objets via la capture de données issues de vidéos.

Alors que l’industrie de la vision artificielle passe de l’identification d’objets simples au suivi d’objets, nous avons besoin d’outils pour annoter le flux de données vidéos et permettre aux machines de reconnaître et de décider d’agir selon les différentes situations qui se présenteraient face à elles. Pour y parvenir, les spécialistes de l’IA tentent d’apprendre aux machines à reconnaître ces formes grâce à l’apprentissage supervisé. Par exemple, pour permettre à un programme de reconnaître un chien, il faut « l’entraîner » en lui fournissant de nombreuses images de chiens, afin qu’il soit ensuite capable d’en repérer sur des nouvelles images. C’est pourquoi le Vision Lab de l’université Stanford, aux Etats-Unis, a élaboré ImageNet, une base de données de centaines de milliers d’images, toutes soigneusement labellisées à la main, mises à disposition des chercheurs qui en ont besoin.

Pourquoi un outil ?

L’approche traditionnelle d’un projet de suivi d’objets consiste à diviser la vidéo en images individuelles, puis à annoter chaque image séparément, en veillant à assurer des identificateurs cohérents pour chaque objet unique dans des images séquentielles. Etant un travail difficile, une attention particulière aux détails est nécessaires pour l’annotation de ces vidéos par un support externe à la plateforme intelligente qui entraîne la machine.

Grâce à l’annotation vidéo pour la reconnaissance des objets, une séquence vidéo entière peut être évaluée dans son ensemble, que le clip contienne 2 images ou 2 000 images. Cette fonctionnalité facilite et accélère le suivi d’un seul objet, même s’il est déplacé, du début à la fin d’une vidéo. Si l’objet disparaît de la vue de la caméra et réapparaît plus tard (pensez à dépasser un cycliste dans la circulation pour les faire sauter à la prochaine intersection). La précision est adaptable dorénavant grâce à l’outil d’annotation vidéo en fonction de la densité des objets capturés.

 

 

Et chez isahit, comment cela se passe ?

Notre plateforme intelligente de tâches digitales socialement responsable est actuellement capable de :

  • labelliser des images
  • annoter des images
  • tracker des données
  • taguer des images

dans le but de permettre à des machines de reconnaître des objets, des formes, des animaux et bien plus encore. Parmi les projets sur lesquels notre communauté a eu l’occasion de travailler, nous avons eu :

  • pour une entreprise de recrutements d’ingénieur : la labellisation de CV qui consistait à taguer des images afin de permettre à leur machine de reconnaître plus facilement un CV ou non.
  • pour une entreprise spécialiste de l’analyse de données par drône : le détourage d’images pour entraîner une machine à reconnaître des objets spécifiques.
  • pour un éditeur de logiciels d’automatisation et d’efficacité de l’entreprise : la labellisation de factures, en renfort d’un logiciel de gestion automatique de factures et de données sociales.

L’intelligence de notre communauté de hiteuses alliée à l’intelligence de notre plateforme permettront à vos projets d’entraînement de robots, machines de se développer.

Aujourd’hui, notre communauté rassemble plus de 490 personnes réparties sur 11 pays en développement d’Afrique Francophone et Anglophone. Nous leur permettons de gagner un complément de revenus en réalisant les tâches digitales de notre plateforme et les formons à être des acteurs du monde digital de demain. En effet, le monde se transforme et face à ces défis majeurs, la formation va jouer un rôle prépondérant. La mission d’isahit est aussi d’aider les populations menacées et en développement, à intégrer le monde digital de demain pour éviter une fracture numérique.

 

Lire la newsletter en PDF : cliquez ici

Pour en savoir plus sur ce que notre plateforme intelligente et notre communauté sont capables de faire, consultez nos cas d’usage : cliquez ici.

Pour demander un devis gratuit, utilisez notre simulateur de prix en ligne.