Enrichissement linguistique des données textuelles

Préparer un jeu de données textuelles pour la modélisation

Public :

Membres de LIDILE
Doctorants de l’école doctorale ELICCE (Education, langages, interactions, cognition, clinique, expertise)
Autres équipes de Rennes 2 (places limitées, contacter Thomas Gaillat)
Link to follow: https://meet.jit.si/A4LL

Événement dirigé par Thomas Gaillat, Cyriel Mallart et Anatole Faugere.

Thomas Gaillat est enseignant-chercheur en linguistique et didactique au laboratoire LIDILE.

Programme

Le lien vers le Google Colab sur la page de l’évènement:

https://colab.research.google.com/drive/1MuP1LlCiWu9lSJJQIAIWTlolw6fEc96A#scrollTo=9BCzPJQ1kzFZ

Matinée :

Les potentialités linguistiques d’un traitement automatique ;

Initiation aux concepts fondamentaux pour le traitement automatique des données en Python. Les variables, fonctions et boucles et quel est le lien avec la notion de texte ;

Manipulation de texte : enrichissement linguistique et extractions.

Après-midi :

Créer son jeu de données à partir de ses textes ;

Manipulation par lots : Pandas et les tableaux ;

Discussion : vers la modélisation.

Pré-Requis

• Compréhension des types de fichiers ;
• Savoir naviguer dans un système de fichiers.

Objectifs de la Formation

1) Savoir manipuler des données textuelles avec Python ;
2) Savoir enrichir linguistiquement les données textuelles ;
3) Comprendre les représentations conceptuelles des données textuelles en vue de la modélisation.

Enrichissement linguistique des données textuelles

Préparer un jeu de données textuelles pour la modélisation

Programme

Nouvelles du projet Ce qui nous concerne – « Des paroles qui restent »

Journée d’Etude de l’APLV : Les finalités professionnalisantes de l’enseignement-apprentissage des langues étrangères et régionales

JE Sémiotique et participation 11-12 février 2025

Semaine Internationale LIDILE : Une célébration de la diversité linguistique et culturelle sur le monde virtuel RENNES2D