Use case NLP

 

 L’Oréal, numéro 1 mondial de l’industrie cosmétique, s’est associé à isahit pour répondre à la problématique suivante : Comment utiliser et entraîner ses modèles d’IA pour prédire les tendances de demain ?

L’Oréal en quelques mots : 

  • 1er groupe mondial de beauté grâce à des innovations majeures
  • Une présence dans 150 pays
  • 86 000 collaborateurs à travers le monde
  • 40 marques 
  • 505 brevets déposés seulement en 2018

Isahit en quelques mots : 

  • Première plateforme éthique de data labeling pour l’IA et le traitement de la Data en Europe
  • 2000 projets réalisés avec plus de 1700 HITers
  • HITers implantés dans plus de 37 pays
  • +250 clients satisfaits

 

Trendspotter : le projet de L’Oréal pour détecter des nouvelles tendances 

 

Afin de comprendre et de détecter les nouvelles tendances dans le monde de la beauté, L’Oréal à développé un outil prédictif, le trendspotter. Cet outil va récupérer des échantillons de données sur les réseaux sociaux à partir desquels les équipes de L’Oréal vont pouvoir identifier et analyser les tendances et les faire remonter aux équipes produit et marketing.

Les 3 grands objectifs de Trendspotter : 

  • Détecter les nouvelles tendances avant les concurrents
  • Prédire l’évolution de la tendance dans le futur
  • Illustrer la tendance pour gagner en rapidité

Comment cela fonctionne-t-il? 

  • Etape 1:  collecte des données sur les réseaux sociaux à l’aide d’APIs 
  • Etape 2: un classifieur qui vient trier et classer les données qui correspondent à l’univers de la beauté

 

Les challenges rencontrés 

 

L’outil récupère une très grande quantité de données ce qui présente certaines difficultés : 

  • L’incertitude de la donnée

Les APIs vont récupérer une très grande quantité de données qui n’est pas toujours en lien avec le monde de la beauté et par conséquent non pertinente pour L’Oréal. Or, il faut avoir de la donnée suffisamment propre pour entraîner un classifieur qui sera capable de détecter quels sont les posts qui vont parler de beauté dans un contexte qui intéresse L’Oréal. C’est notamment sur ce point qu’isahit va pouvoir aider L’Oréal. 

  • La gestion des différentes langues

L’Oréal est présent dans 150 pays donc il faut pouvoir analyser les données dans une multitude de langues, Il faut donc être capable de trouver les collaborateurs parlant les langues ciblées. 

  • Le maintien de la qualité 

La performance d’un modèle de machine learning est toujours inférieur à la qualité de la donnée; il est donc primordial d’avoir une donnée collectée de qualité et une labellisation très minutieuse pour garantir les performances du modèle.

 

La solution : connaître la donnée, grâce à isahit 

 

Afin de répondre à ces challenges, isahit est apparue comme la solution la plus adéquate car elle propose : 

  • La possibilité de travailler dans plusieurs langues : isahit travaille avec une très large communauté de HITers présente dans 37 pays
  • Une approche test & learn pour valider les itérations
  • Une revue qualité très exigeante :

Isahit met en place un suivi de projet très strict, tout au long de sa réalisation, forme ces contributeurs et met en place des tests en amont afin de s’assurer de maintenir une qualité constante.

  • Une grande agilité et une grande capacité d’adaptation des ressources en fonction des besoins fluctuants

 

Des process spécifiques mis en place en amont du projet

 

Afin de s’assurer de la bonne réalisation du projet, les équipes de L’Oréal et d’isahit ont réalisé des tests spécifiques en amont. 

Du côté de L’Oréal, les équipes data sciences ont défini un plan d’action afin d’obtenir un processus d’annotation efficace et de réduire la subjectivité:

  1. Extraction et traitement d’un échantillon de données en interne dans une langue connue
  2. Labellisation “à la main” de ces posts par plusieurs Data Scientist
  3. Mise en commun des résultats et ajustement de points de désaccords
  4. Élaboration d’une présentation avec les règles et les consignes précises
  5. Partage des instructions à isahit

Du côté d’isahit, l’équipe dédiée a veillé à mettre en place les process suivants pour garantir la meilleure qualité de traitement possible :

  1. Transmission des consignes en interne et sélection des contributrices en fonction de leur compétences et de leur expérience
  2. Formation des contributrices (HITers) et gestion de leur montée en compétence
  3. Mise en place d’un test sur un échantillon de posts
  4. Sessions d’ajustement des consignes 
  5. Lancement du projet sur une grande volumétrie et sur plusieurs langues

Et bien sûr, tout au long du projet : 

  • Suivi des coûts financiers depuis la plateforme isahit
  • Points hebdomadaires avec le project manager via e-meeting
  • Points trimestriels avec tous les interlocuteurs (commerciaux, opérationnels…)

Cette stratégie a permis de suivre en continu les KPIs suivants : progression du projet, taux de qualité, coûts par projet, temps par tâches, updates, volumétries, performances, finances.

 

Feedback de L’Oréal : pourquoi avoir choisi isahit ? 

 

  • Cette collaboration a permis une réduction de 50% des erreurs de classification des modèles de l’Oréal
  • La capacité d’isahit à gérer plusieurs langues (anglais, français, espagnol, mandarin, japonais…) leur a permis de couvrir l’intégralité des données
  • Enfin, la réelle consistance dans la qualité des labellisations, la réactivité et la flexibilité de l’équipe support à largement contribuer à la réussite du projet

 

UNE DOUBLE VICTOIRE: TECH & SOCIALE

 

Deux ans après le début de notre collaboration, nous sommes mutuellement très heureux de pouvoir faire l’état des lieux suivants :

  • 1 million de tâches réalisées
  • 5 langues couvertes
  • Un impact positif et durable sur près de 100 de nos HITers ! 

…et une place en finale pour le concours David avec Goliath 2021 !

 

 Si vous souhaitez en savoir plus sur le NLP, découvrez notre article dédié à ce sujet.