SCIAM - Expertise, Formation & Recherche

Pierre Lepagnol

Nous abordons le problème des données limitées et de mauvaise qualité pour les modèles d'IA. Pour traiter ce problème nous utilisons les modèles de langues génératifs (LLM) pour surmonter ces obstacles. Les données de mauvaise qualité peuvent être des données textuelles sans étiquette ou des données trop bruitées pour le problème. Par exemple, un email client peut contenir une demande qui n'apparait pas dans les problèmes déjà identifiés ou une demande trop vague. Pour résoudre cela, nous utilisons les LLM génératifs pour interpréter le contexte et identifier l'étiquette manquante, en créant des prompts de haute qualité. Une autre piste envisagée est la génération de texte de hautes qualités et entraîner des modèles de classification sur ces données dans le but de compenser les problèmes d'étiquetage. Nous utilisons des données de benchmarks internationaux et évaluerons les modèles de langue en mode zero-shot. Ces travaux nous permettront de développer des stratégies d'amorçage efficaces pour des données souvent rencontrées dans l'industrie, qui sont limitées ou de mauvaise qualité.

Pierre Lepagnol a rejoint SCIAM en 2022 en tant que consultant en data science et chercheur.

Avant de rejoindre l'équipe, il a acquis une solide expérience en intelligence artificielle et cybersécurité au sein de la DGA (Maintenant AMIAD- Agence Ministérielle pour l’Intelligence Artificielle de Défense), ainsi qu'une pratique des méthodes et des algorithmes de Data Science dans le milieu bancaire à la Société Générale.

Pierre est doctorant en traitement automatique des langues au LISN, Université Paris-Saclay, où il explore les approches à base de LLM pour exploiter des données textuelles.

Titulaire d’un master en mathématiques appliquées et statistiques, il a également contribué à des projets variés, allant du développement de la migration de code SAS vers Python, à l’optimisation des indicateurs bancaires. Passionné par la recherche, ses travaux combinent rigueur académique et applications concrètes pour relever des défis complexes.