Offre CIFRE : Détection de marqueurs psychologiques et linguistiques pour la relation client, Orange, Pessac / CLLE, Université de Toulouse

Offre CIFRE : Détection de marqueurs psychologiques et linguistiques pour la relation client, Orange, Pessac / CLLE, Université de Toulouse, Fr — date limite candidature : 30 sept. 2023

thèsevia la liste Langage Naturel — Thèse CIFRE (Orange / CLLE) : Détection de marqueurs psychologiques et linguistiques pour la relation client Orange Innovation propose un financement de thèse en convention CIFRE sur 3 ans, en collaboration avec le laboratoire CLLE (CNRS & Université de Toulouse) ref : 2023-24822 date limite de candidature : 30 sept. 2023 Lieu : – Orange Innovation, 23 rue Thomas Edison 33600 PESSAC – CLLE, Université de Toulouse Jean Jaurès, 5 alléees Machado, 31058 TOULOUSE Contexte global et problématique du sujet : Dans le cadre de la Relation Client, l’écoute des clients est un axe majeur de réactivité et de qualité. En miroir, l’écoute des salariés permet la mise en œuvre d’une symétrie des attentions nécessaire pour une Relation Clients efficiente : dimension expressive du travail, régulation (Dupuis, J., 2020). Dans le domaine du traitement du langage, nous cherchons à mettre en évidence l’état psychologique des locuteurs pour la Relation Client. Problématique : Comment procéder au repérage automatique, dans les discours des clients ou collaborateurs d’Orange, des traces correspondant à leur état psychologique (la charge mentale, les émotions, le rapport à autrui ou encore le rapport au temps etc.) ? Plus précisément, il s’agira dans le travail de thèse de se baser sur des théories et modèles en psychologie et des connaissances sur les marqueurs langagiers, mais aussi de prendre en compte la multiplicité des points de vue sur un même objet (RH, psychologie sociale et cognitive, ergonomie, linguistique, etc.). Objectif scientifique – résultats et verrous à lever : L’objectif applicatif est d’améliorer l’outillage de l’analyse des discours dans des corpus de la Relation Clients. Sur la base d’un corpus existant (en français), il s’agira de mettre en place une annotation multiple reflétant les différentes façons dont ces états psychologiques peuvent s’exprimer et être identifiés par un annotateur expert. Le recours à des annotations multiples est vu classiquement en traitement automatique des langues comme une façon d’atteindre un volume important de données pour entraîner un modèle, en visant un bon taux d’accord. Il s’agira ici au contraire d’exploiter les variétés de point de vue pour aborder un phénomène complexe et difficile à capter. Les annotations recueillies auprès de professionnels différents seront analysées et croisées entre elles et avec les différents niveaux de représentations du texte (des marques de surface jusqu’aux structures syntaxiques et sémantiques) et notamment celles qui sont obtenues par les grands modèles de langue préentraînés (LLM). Attendus : – Une revue bibliographique est à constituer, faisant émerger – les théories et modèles utiles à la caractérisation des catégories et à l’annotation des marqueurs, – les méthodes et outils disponibles. – Une méthodologie efficiente d’analyse des contextes et des typologies de marqueurs linguistiques afin de systématiser les analyses – une base d’annotation multidimensionnelle des données textuelles articulant des marques, des états psychologiques et des points de vue sur ces états. – L’entraînement d’un modèle de machine learning permettant d’éprouver les hypothèses et permettant de fournir une preuve de concept pour un outil de visualisation et d’aide à l’analyse des données de la Relation Client. Votre profil : – Vous avez une formation en sciences du langage ou en traitement automatique des langues. – Vous vous intéressez aux derniers travaux de recherche dans le domaine de l’IA et en particulier du TAL. Vous avez l’habitude de manipuler des données langagières numériques (annotation, analyse, exploration). – Vous avez une bonne connaissance des modèles de langage existants et des derniers modèles larges. Vous ne négligez pas pour autant les approches alternatives qui passent par une analyse sémantique de la langue (SRL, Frames, AMR). – Vous avez des connaissances en sciences cognitives (Linguistique et/ou psychologie cognitive) et de la curiosité pour d’autres disciplines. Vous possédez une bonne capacité d’adaptation et d’intégration dans une équipe pluridisciplinaire et multisites. – Vous avez de très bonnes capacités rédactionnelles et une très bonne maîtrise de la langue française (oral et écrit). Formation demandée : Master en sciences du langage (avec une composante informatique et statistique) ou en traitement automatique des langues. Une formation en informatique, sciences des données ou sciences cognitives peut également convenir si elle est accompagnée d’une première expérience réussie dans le traitement des données langagières. Expériences souhaitées : Première expérience dans l’annotation ou l’analyse outillée de données langagières. Au moins un stage effectué en entreprise. Le plus de l’offre : Cette thèse s’inscrit dans un champ particulièrement dynamique et offre un angle de recherche original : l’approche du traitement d’un type particulier de données langagières, par l’utilisation de modèles et de connaissances en psychologie cognitive notamment. La prise en compte de points de vue croisés sur un même jeu de données permet d’enrichir la représentation des phénomènes visés. Le type de langage étudié est un corpus de messages plus ou moins longs, obtenus dans le cadre d’une interaction asynchrone particulière, résultant de l’utilisation d’un outil issu de la recherche à Orange Innovation. Bibliographie indicative : – Galy, E. (2016). Approche intégrative de la charge mentale de travail : une échelle d’évaluation basée sur le modèle ICA (Individu–Charge–Activité) . 51ème Congrès International de la Société d’Ergonomie de Langue Française. – Ide, N. and Pustejovsky, J. (2017, eds). The handbook of linguistic annotation. Springer. – Klie, J. C., Bugert, M., Boullosa, B., de Castilho, R. E., & Gurevych, I. (2018). The Inception platform: Machine-assisted and knowledge-oriented interactive annotation. Proceedings of the 27th international conference on computational linguistics. – Le Gonidec, N., Dubois, C. Fenzy, C., Galy, E. (2023). Identification des facteurs de charge mentale de travail des conseillers en centre d’appels à l’aide d’entretiens semi-directifs. Psychologie du Travail et des Organisations. – Mohamed, Y., AbdelFattah, M., Alhuwaider, S., Fei-Fei, L., Zhang, X., Church, K.W., & Elhoseiny, M. (2022). ArtELingo: A Million Emotion Annotations of WikiArt with Emphasis on Diversity over Language and Culture. Conference on Empirical Methods in Natural Language Processing. Entités : L’ambition de la Division Innovation est de porter plus loin l’innovation d’Orange et de renforcer son leadership technologique, en mobilisant nos capacités de recherche pour nourrir une innovation responsable au service de l’humain, éclairer les choix stratégiques du Groupe à long terme et influencer l’écosystème digital mondial. Nous formons les expertes et les experts des technologies d’aujourd’hui et de demain, et veillons à une amélioration continue de la performance de nos services et de notre efficacité. La division Innovation rassemble, dans le monde, 6000 salariés dédiés à la recherche et l’innovation dont 740 chercheurs. Porteurs d’une vision globale avec une grande diversité de profils (chercheurs, ingénieurs, designers, développeurs, data scientists, sociologues, graphistes, marketeurs, experts en cybersécurité…). Au sein de la direction Customer Relation & Business Information System, vous rejoindrez l’équipe de recherche pluridisciplinaire du Programme Digital for hUman, piloté par Caroline Dubois. Les travaux de l’équipe utilisent les synergies entre technologies (IA, TAL…) et Sciences cognitives (psychologie cognitive, linguistique) pour concevoir et expérimenter des outils au service de la Relation Clients. Cet écosystème de recherche bénéficie d’infrastructures adaptées et de données issues de la relation clients. Le laboratoire CLLE (Cognition, Langues, Langage, Ergonomie) est une UMR CNRS créée en janvier 2007 et principalement hébergée sur le site de l’Université Toulouse Jean Jaurès. Le laboratoire fait partie de l’Institut des Sciences Humaines et Sociales du CNRS et est rattaché principalement à la section 34 du CNRS (Sciences du Langage) et de façon secondaire à la section 26 du CNRS (Cognition, Cerveau, Comportement) de l’Institut des Sciences Biologiques du CNRS. CLLE est donc une unité de recherche pluridisciplinaire relevant des Sciences Cognitives : les travaux qui y sont menés couvrent les champs, à périmètre plus ou moins large, de la linguistique, de la psychologie, de l’informatique, de la philosophie, de l’éducation et des neurosciences. La thèse se déroulera au sein de l’équipe PLC (Processus Langagiers et Cognitifs).La thèse sera dirigée par Ludovic Tanguy, enseignant chercheur en traitement automatique des langues. Lien pour candidater : https://orange.jobs/jobs/v3/offers/124890?lang=fr (note : le texte de ce message est plus récent et plus complet que celui de l’annonce sur le site orange.jobs) Contacts : – Caroline Dubois (caroline.dubois@orange.com) – Philippe Le Goff (philippe2.legoff@orange.com) – Ludovic Tanguy (ludovic.tanguy@univ-tlse2.fr)