L’AI Act Européen : Vers une IA responsable et régulée
04 novembre 2024
Le cadre de l'AI Act européen impose des règles strictes pour une IA responsable, avec des niveaux de risque et des exigences de conformité progressive…
Data science
L’attrition — ou churn — de la clientèle représente un enjeu majeur pour de nombreuses entreprises : le coût d’acquisition des clients étant élevé dans la majorité des industries, leur rétention est nécessaire pour assurer une bonne rentabilité. En effet un client déjà engagé continue de générer de l’activité en nécessitant beaucoup moins d’efforts de la part de l’entreprise. Ceci est non seulement vrai pour les entreprises reposant sur un modèle de contrats récurrents, mais aussi pour des modèles en vente unitaire, la probabilité de revendre à un client satisfait étant plus élevée que celle de vendre à un nouveau prospect (quelques statistiques supplémentaires).
L’attrition est parfois naturelle — le client n’a plus besoin du produit ou du service — mais elle reste le plus souvent le fruit d’un départ vers une offre concurrente. Ce phénomène est aujourd’hui amplifié par la disruption qu’apporte l’arrivée de nouveaux acteurs numériques, parfois plus agiles, ou répondant mieux aux aspirations des clients en terme de digitalisation (par exemple dans la banque et l’assurance).
Prévoir et comprendre l’attrition est nécessaire pour plusieurs raisons. D’une part, son anticipation est importante pour guider l’activité : pour prévoir des réductions éventuelles de volumes, adapter son fonctionnement, ou mettre l’accent sur le démarchage de nouveaux clients. D’autre part, identifier les facteurs responsables de l’attrition permet de prendre des actions préventives pour éviter le départ des clients. En effet, si certaines causes de l’attrition sont extérieures à l’entreprise (des crises comme la Covid en 2020), d’autres relèvent de facteurs qu’il peut être facile d’anticiper (saisonnalité, facteurs démographiques : vieillissement, changement des besoins) ou sur lesquels il est possible d’agir (mauvaise expérience ponctuelle, offre moins engageante), permettant de mieux prévoir et réduire les départs des clients, avec des résultats directs sur les coûts et bénéfices opérationnels.
Prédire l’attrition au niveau du client individuel est cependant un défi de taille : si elle résulte d’une insatisfaction ou d’un départ, la décision du client est prise avant que celui-ci ne résilie effectivement son contrat, et ce délai entre la décision et la réalisation empêche toute réaction pertinente. Pour ajouter à cette difficulté, les signaux forts disponibles sont souvent des marqueurs de la réalisation et non de la décision: tardifs, ne laissant pas la possibilité à l’entreprise de mettre en place des actions préventives. De façon générale, plus l’horizon de temps visé pour la prédiction est lointain, plus la précision des prédictions sera faible : les signaux les plus révélateurs sont ceux qui interviennent au plus proche de l’attrition effective.
Il est donc particulièrement important de développer une approche qui permette d’anticiper longtemps à l’avance le départ des clients, ou encore mieux, d’identifier directement les sources et les dynamiques de l’attrition pour prendre des actions correctives en amont.
Plusieurs approches sont possibles pour réaliser une telle étude :
L’analyse de survie et l’analyse de séquence sont deux approches très complémentaires, qui s’appuient sur une représentation différente des clients — la première basée sur des caractéristiques endogènes du client, la seconde sur son parcours.
L’analyse de survie (cours introductif et exemple Python) a été à l’origine développée pour estimer l’espérance de vie d’individus : pour une certaine population, dont un échantillon est connu (on sait pour différents individus si l’événement de « mort » a été observé, et, si oui, au bout de combien de temps), elle permet de modéliser la « fonction de survie », c’est-à-dire la probabilité qu’un individu donné soit toujours en vie à chaque instant.
Ce cadre semble très différent de celui de l’attrition à première vue, mais il est en fait parfaitement adapté : il suffit de considérer comme événement de « mort » l’attrition d’un client. L’analyse de survie modélise alors la façon dont la probabilité d’attrition évolue avec l’horizon de temps.
Le résultat d’une analyse de survie est plus riche que celui d’une régression linéaire qui aurait pour objectif la durée de vie de l’individu : elle ne modélise pas seulement son espérance, mais l’ensemble de la distribution. L’exemple suivant permet de visualiser cette nuance : si un client a 30% de chances de «survivre » 1 mois et 70% de chances de « survivre » 5 ans, cette information sur la distribution a beaucoup plus de valeur que de simplement savoir que le client a une « espérance de vie » de 42 mois. Ceci est particulièrement important pour le pilotage de l’attrition : il faut pouvoir simuler les moments effectifs des départs, et pas seulement leur espérance.
L’approche par analyse de survie n’est pas seulement plus riche, elle permet aussi de s’abstraire d’un biais important : le phénomène de censure.
Lorsque l’on modélise un phénomène de « survie » comme l’attrition à partir de données clients, une caractéristique importante de ces données doit être prise en compte : l’événement étudié n’a sans doute pas été observé chez tous les clients (l’ensemble des clients actuels par exemple, n’est pas entré en attrition). Une approche par régression nécessiterait de transformer cette donnée pour éviter des anomalies dans le modèle (espérance de vie moyenne infinie), par exemple en ne considérant que les clients déjà partis. Cette transformation biaise de façon incontrôlée le modèle et ses résultats : tous les individus utilisés pour entraîner le modèle ont vécu l’événement de « mort », ce qui est loin d’être le comportement désiré, surtout si la durée de vie normale d’un individu est plus grande que la période depuis laquelle la donnée est acquise ! (considérez un médecin qui étudie l’espérance de vie des patients après 10 ans ; s’il néglige tous les patients encore en vie, il ne parviendra jamais aux bonnes conclusions).
L’analyse de survie ne rencontre pas phénomène de censure, car elle ne modélise pas explicitement l’espérance de vie, et peut donc être entraînée à partir d’échantillons pour lesquels l’événement de mort n’a pas eu lieu — dans notre exemple, elle autorise le médecin à prendre en compte les patients survivants.
L’analyse de survie permet d’estimer pour chaque client, en fonction de ses caractéristiques, la probabilité qu’il soit encore présent pour n’importe quel horizon de temps. Cette information peut être ensuite transformée pour prédire l’attrition à un horizon de temps fixé (par exemple en déclenchant une alerte si la probabilité de départ du client à horizon six mois dépasse un certain seuil). Mais elle peut aussi être utilisée pour visualiser et estimer les différences d’attritions entre plusieurs groupes d’individus — en fonction du canal d’acquisition, de la période d’arrivée, ou encore de la présence ou non d’un événement dans leur parcours client —, et ainsi identifier les similitudes et différences dans les dynamiques d’attrition des groupes. Enfin, certains modèles comme celui de Cox sont directement interprétables : une fois entraînés, leurs paramètres reflètent l’influence des variables descriptives des individus sur la fonction de survie.
En pratique, l’analyse de l’attrition nécessite parfois de prendre en compte des facteurs supplémentaires :
C’est pourquoi il peut être pertinent de compléter cette approche en définissant un ensemble d’événements clefs du parcours clients (demandes, nouvelles commandes, litiges, etc…) et en s’intéressant à la succession de ces événements et à la façon dont cette succession influe l’attrition : c’est l’analyse de séquences (dont voici une présentation plus détaillée).
Celle-ci permet de visualiser et d’étudier la façon dont les individus évoluent dans le temps, et en particulier de comprendre les conditionnements entre les événements (par exemple : la majorité des individus ayant vécu l’événement C ont d’abord vécu les événements A puis B). En représentant sous forme d’un arbre les probabilités de passages successifs entre les événements, on est à même d’identifier quelles sont les successions d’événements influant grandement sur le risque d’attrition. On peut notamment détecter les événements synonymes d’attritions effectives (ceux qui aboutissent invariablement à une attrition détectée), ou les événements charnière (ceux à la suite desquelles les parcours possibles sont radicalement différents en terme de risque d’attrition) — sur lesquels une action est la plus susceptible de réduire l’attrition. En travaillant avec une grande banque française, eleven a pu constater que la détection de ces événements charnière par l’analyse de séquences a une valeur particulière : ceux-ci peuvent avoir lieu longtemps en amont de l’attrition sans pour autant être facilement détectés par un modèle de détection classique, qui se concentrera sur les événements les plus corrélés à l’attrition (donc les plus tardifs), là où l’arbre permettra d’étudier en premier lieu les événements sources. Cette approche a aussi une composante prédictive directe : pour un client individuel, cette modélisation permet d’évaluer la probabilité empirique de chacun des parcours à partir de sa situation actuelle.
Attaquée avec l’aide de ces outils, l’attrition des clients de l’entreprise n’est plus une fatalité, et son impact peut être fortement réduit :
L’intérêt de l’analyse de séquence dans l’entreprise ne s’arrête pas là : elle peut aussi être utilisée pour étudier les parcours d’acquisition, de vente, ou, de façon générale, l’ensemble du parcours client dans l’entreprise.
Louis Dumont, Charafeddine Mouzouni
Partager
Sur le même sujet