Natural Language Processing

Le Natural language processing (NLP) ou traitement du langage naturel, est une technologie révolutionnaire qui permet aux machines de comprendre le langage humain et de pouvoir communiquer avec lui, grâce à l’IA.

Comment un ordinateur, qui comprend habituellement un langage de programmation précis, balisé et structuré peut-il comprendre le langage humain, imprécis et ambigu ?

 

Définition

 

Pour François Yvon, chercheur spécialisé dans le NLP, cette technologie désigne « l’ensemble des recherches et développements visant à modéliser et reproduire, à l’aide de machines, la capacité humaine à produire et à comprendre des énoncés linguistiques dans des buts de communication ».

 

L’origine du NLP : 

 

La capacité à comprendre le langage humain n’est pas une notion nouvelle ; dès 1950, le célèbre mathématicien Alan Turing proposait un test qui évaluait l’intelligence d’une machine par sa capacité à tenir une conversation humaine. 

C’est au cours des années 1950s que les premiers tests de NLP ont été réalisés. En premier lieu, par le gouvernement américain qui souhaitait en cette période de guerre froide, déchiffrer les communications soviétiques. Puis en 1954, par l’Université de Georgetown et IBM qui ont traduit une soixantaine de phrases russe en anglais; réalisant la première démonstration influente de traduction automatique. 

Néanmoins, les moyens investis restent très faibles et les résultats peu significatifs. En effet, ces premiers essais s’appuient sur une base de faits et de règles qui présentent des difficultés à comprendre le sens et à gérer la contextualisation et les ambiguïtés du langage humain. 

Le NLP est alors largement critiqué et ne connaîtra un véritable essor qu’à l’arrivée du machine learning et du deep learning. 

 



 

Les techniques du Natural Language Processing :

 

Il existe plusieurs manières de capter le langage humain :  à partir de textes déjà numérisés ou de contenus dans une image, dans un manuscrit, par reconnaissance vocale ou encore par extraction de l’information sur des pages web, comme le font les moteurs de recherche.

Les deux principales techniques utilisées pour le traitement du langage naturel sont l’analyse syntaxique et l’analyse sémantique. 

 

L’analyse syntaxique 

Qui comprend elle-même : 

Le parsing : qui identifie les règles grammaticales d’une phrase et en déchiffre le sens

La segmentation par mot : qui fractionne le texte en unité

La segmentation morphologique : qui fractionne les mots en groupe

 

L’analyse sémantique

Qui consiste à analyser le contexte d’une phrase pour en comprendre le sens.



Quels sont les domaines d’application du NLP ? 

 

Aujourd’hui, le traitement du langage naturel est l’un des principaux moteurs de l’IA et couvre un champ d’application très large : 

Sentiment analysis : il s’agit d’identifier les informations subjectives d’un texte pour extraire l’opinion de l’auteur. Cela permet notamment de mesurer le niveau de satisfaction des clients et des utilisateurs.

Chatboat : c’est un robot logiciel qui va dialoguer avec un individu ou un consommateur par le biais d’un service de conversations automatisées. Les chatboats fonctionnent en différentes briques : comprendre la question, reconnaître les mots, déterminer le sens et le contexte, prendre la bonne décision, formuler la réponse.

La traduction automatique : algorithmes de traduction automatique qui permettent d’automatiser la traduction.

Classification de texte : il s’agit d’organiser, de structurer et de catégoriser un ensemble de texte. C’est notamment utilisé dans le cadre de la modération de contenu, par exemple pour déceler des fake news où le NLP va analyser les mots clés et comparer des articles à ceux de sources sûres pour évaluer la crédibilité d’une information. 

mais aussi :

 

Reconnaissance de caractères

Correction automatique

Résumé automatique

 

Les limites de la technologie

 

Bien que le NLP soit un axe majeur de l’intelligence artificielle et que cette technologie révolutionne aujourd’hui certains enjeux des entreprises comme le service client, elle est cependant confrontée à différents challenges. La compréhension du langage humain reste complexe en raison de : 

L’Ambiguïté : les différents significations d’un même mot en fonction d’un contexte donné, de la grammaire…

La Synonymie : il existe plus de 44 000 synonymes dans la langue française

Les styles d’écriture : selon les émotions et les intentions de l’auteur, une même idée peut être exprimée de diverses manières. Le NLP va très difficilement pouvoir discerner du sarcasme ou de l’ironie. 

Le langage humain est infiniment complexe, voir insoluble et la machine a encore aujourd’hui besoin de l’Homme pour saisir ce qui lui reste insaisissable. 

 

Speech Martin Luther King
Martin Luther King prononce l’un des discours les plus marquants de l’Histoire : ‘I have a dream’ (1963)

 

Lier l’intelligence artificielle et humaine : le fonctionnement d’isahit 

Chez isahit, nous avons choisi de faire le lien entre l’Homme et les machines en mettant en place une plateforme technologique et agile d’intelligence artificielle, augmentée par l’intelligence humaine.  

Ce choix de fonctionnement nous permet de répondre aux challenges du NLP et d’accompagner nos clients en garantissant une réelle compréhension de la technologie.

Nous avons développé notre propre outil afin d’accompagner au mieux nos clients, qui comme L’Oréal par exemple, ont fait appel à nous pour mieux qualifier leurs données (découvrez notre cas d’usage avec L’Oréal).

Si vous souhaitez en savoir plus, rendez-vous sur notre page NLP dédiée ou prenez-rendez vous avec nos experts.