مخطط الموضوع

  • Module TALN

    Module TALN Traitement Automatique du Langage Naturel  (NLP Natural Language Processing)

    Cours Présenté par :

    Pr. HACENE BELHADEF (Professeur à l'université de Constantine 2)

    Mr. ISLAM DJEMAL (Doctorant à l'université de Mila)

    NLP wordcloud



  • Objectifs et Sommaire

    • Objectifs :

    Le cours apportera à l'étudiant les bases théoriques nécessaires à la compréhension des objectifs et des défis actuels du traitement automatique du langage naturel (TALN). En parallèle, l'étudiant apprendra à analyser et à expliquer les limites pratiques et techniques que l'on rencontre dans la mise en place de systèmes informatiques destinés au traitement des langues.

    A la fin de ce cours, l’étudiant sera en mesure de :

    - maitriser des notions de base en Traitement Automatique des Langues,

    - prendre en main les outils et la programmation en python pour le traitement automatique du langage naturel.

    - Prendre en main un Pipeline (Processus ou chaîne de production) pour le développement des applications TALN.

    - visualiser, évaluer et critiquer les résultats de développent.

  • Chapitre 3 : Prétraitement (Preprocessing)

    Objectifs du chapitre :

    L’objectif de ce chapitre est d’amener l’étudiant à être en mesure de définir une procédure de nettoyage et de préparation des données textuelles appropriée à un type de projet en NLP.

    Appliquer des techniques de préparation de données textuelles,

    Appliquer des techniques de normalisation de texte,

    Créer une procédure de nettoyage de données textuelles.

    Prendre en main les bibliothèques dédiées de Python.

  • Chapitre 4 : Vectorisation (Représentation Vectorielle)

    Objectifs du chapitre :

    L’objectif de ce chapitre est d’amener l’étudiant à être en mesure de définir une procédure de représentation numérique d’un mot ou d’un texte sous forme vectorielle. Pour cela l’étudiant va apprendre comment :

    Créer une procédure de transformation d’un texte vers un vecteur numérique,

    Prendre en main les bibliothèques Python dédiées,

    Comprendre les avantages et les inconvénients de chaque méthode.

  • Chapitre 5: Techniques de Modélisation

    Objectifs du chapitre :

    L’objectif de ce chapitre est d’amener l’étudiant à être en mesure de définir une procédure de représentation numérique d’un mot ou d’un texte sous forme vectorielle. Pour cela l’étudiant va :

    Comprendre le principe de fonctionnement des algorithmes d’apprentissage automatiques classiques et profonds les plus utilisés et les plus répondus dans le domaine TALN,

    Apprendre à appliquer les mesures de performances pour évaluer un modèle TALN,

    Prendre en main les bibliothèques Python dédiées pour exploiter ces différents algorithmes.