Comprendre les « Large Language Models » :
D’où viennent-ils et où peut-on aller avec ?
Lien vers la video de la conférence
Lors de cette présentation, nous aborderons les concepts fondamentaux du « machine learning » (apprentissage automatique) sans nécessiter de connaissances approfondies en mathématiques. Nous commencerons par définir, à haut niveau, ce qu’est un modèle et expliquerons les étapes de l’entraînement d’un modèle de machine learning, en soulignant les principes clés et les défis associés. Nous nous concentrerons ensuite sur les modèles de langage de grande taille (LLMs), en expliquant pourquoi ces modèles sont particulièrement puissants et ce qui les distingue des autres approches de traitement automatique du langage. Nous discuterons de leurs capacités en termes de représentation du langage, pour expliquer leurs possibilité de génération de texte, de compréhension contextuelle et surtout d’adaptation à des tâches diverses. Nous examinerons enfin les applications potentielles des LLMs, en mettant en avant les différentes familles de LLMs et les tâches qui y sont traditionellement associées. L’objectif principal de cette présentation est d’équiper des expert.e.s en linguistique du vocabulaire et des concepts essentiels pour dialoguer efficacement avec des expert.e.s en machine learning, afin d’accélérer la recherche dans les deux domaines grâce au croisement des idées et perspectives.
Lundi 27 mai 2024 – 14h – Salle L201
Cyriel Mallart
Ingénieur.e de recherche en traitement automatique du langage – LIDILE
Pour participer à la conférence à distance :
[ http://bit.ly/lundi_lidile | http://bit.ly/lundi_lidile ]
ID de réunion : [ callto:873 5180 7764 | 873 5180 7764 ]
Code secret : Evain