Combattre l’attrition avec l’analyse de séquence et l’analyse de survie | Eleven

Combattre l’attrition avec l’analyse de séquence et l’analyse de survie01 août 2021

Data science

L’attrition — ou churn — de la clientèle représente un enjeu majeur pour de nombreuses entreprises : le coût d’acquisition des clients étant élevé dans la majorité des industries, leur rétention est nécessaire pour assurer une bonne rentabilité. En effet un client déjà engagé continue de générer de l’activité en nécessitant beaucoup moins d’efforts de la part de l’entreprise. Ceci est non seulement vrai pour les entreprises reposant sur un modèle de contrats récurrents, mais aussi pour des modèles en vente unitaire, la probabilité de revendre à un client satisfait étant plus élevée que celle de vendre à un nouveau prospect (quelques statistiques supplémentaires).

L’attrition est parfois naturelle — le client n’a plus besoin du produit ou du service — mais elle reste le plus souvent le fruit d’un départ vers une offre concurrente. Ce phénomène est aujourd’hui amplifié par la disruption qu’apporte l’arrivée de nouveaux acteurs numériques, parfois plus agiles, ou répondant mieux aux aspirations des clients en terme de digitalisation (par exemple dans la banque et l’assurance).

Pourquoi étudier l’attrition de ses clients ?

Prévoir et comprendre l’attrition est nécessaire pour plusieurs raisons. D’une part, son anticipation est importante pour guider l’activité : pour prévoir des réductions éventuelles de volumes, adapter son fonctionnement, ou mettre l’accent sur le démarchage de nouveaux clients. D’autre part, identifier les facteurs responsables de l’attrition permet de prendre des actions préventives pour éviter le départ des clients. En effet, si certaines causes de l’attrition sont extérieures à l’entreprise (des crises comme la Covid en 2020), d’autres relèvent de facteurs qu’il peut être facile d’anticiper (saisonnalité, facteurs démographiques : vieillissement, changement des besoins) ou sur lesquels il est possible d’agir (mauvaise expérience ponctuelle, offre moins engageante), permettant de mieux prévoir et réduire les départs des clients, avec des résultats directs sur les coûts et bénéfices opérationnels.

Enjeux concrets de l’analyse de l’attrition

Prédire l’attrition au niveau du client individuel est cependant un défi de taille : si elle résulte d’une insatisfaction ou d’un départ, la décision du client est prise avant que celui-ci ne résilie effectivement son contrat, et ce délai entre la décision et la réalisation empêche toute réaction pertinente. Pour ajouter à cette difficulté, les signaux forts disponibles sont souvent des marqueurs de la réalisation et non de la décision: tardifs, ne laissant pas la possibilité à l’entreprise de mettre en place des actions préventives. De façon générale, plus l’horizon de temps visé pour la prédiction est lointain, plus la précision des prédictions sera faible : les signaux les plus révélateurs sont ceux qui interviennent au plus proche de l’attrition effective.

Il est donc particulièrement important de développer une approche qui permette d’anticiper longtemps à l’avance le départ des clients, ou encore mieux, d’identifier directement les sources et les dynamiques de l’attrition pour prendre des actions correctives en amont.

Plusieurs approches sont possibles pour réaliser une telle étude :

  • En utilisant un ensemble de modèles prédictifs classiques du Machine Learning, qui viseront à prédire l’attrition à différents horizons de temps, et dont l’analyse par des méthodes d’interprétabilité permettra de mettre en avant certains facteurs.
  • Par l’analyse de survie, qui permet avec un unique modèle de prédire l’évolution du volume d’attrition (pourcentage de clients entrant en attrition) au cours du temps, et de comparer sur différents segments de la base client (par offre, année d’arrivée, ou type d’expérience client) comment la probabilité d’attrition évolue au cours du temps.
  • En s’intéressant à la séquence d’événements vécus par les clients entrant en attrition, afin d’identifier quelles sont les suites d’événements qui augmentent ou diminuent la probabilité et la vitesse d’attrition.

L’analyse de survie et l’analyse de séquence sont deux approches très complémentaires, qui s’appuient sur une représentation différente des clients — la première basée sur des caractéristiques endogènes du client, la seconde sur son parcours.

Approche par analyse de survie

L’analyse de survie (cours introductif et exemple Python) a été à l’origine développée pour estimer l’espérance de vie d’individus : pour une certaine population, dont un échantillon est connu (on sait pour différents individus si l’événement de « mort » a été observé, et, si oui, au bout de combien de temps), elle permet de modéliser la « fonction de survie », c’est-à-dire la probabilité qu’un individu donné soit toujours en vie à chaque instant.

Ce cadre semble très différent de celui de l’attrition à première vue, mais il est en fait parfaitement adapté : il suffit de considérer comme événement de « mort » l’attrition d’un client. L’analyse de survie modélise alors la façon dont la probabilité d’attrition évolue avec l’horizon de temps.

Le résultat d’une analyse de survie est plus riche que celui d’une régression linéaire qui aurait pour objectif la durée de vie de l’individu : elle ne modélise pas seulement son espérance, mais l’ensemble de la distribution. L’exemple suivant permet de visualiser cette nuance : si un client a 30% de chances de «survivre » 1 mois et 70% de chances de « survivre » 5 ans, cette information sur la distribution a beaucoup plus de valeur que de simplement savoir que le client a une « espérance de vie » de 42 mois. Ceci est particulièrement important pour le pilotage de l’attrition : il faut pouvoir simuler les moments effectifs des départs, et pas seulement leur espérance.

L’approche par analyse de survie n’est pas seulement plus riche, elle permet aussi de s’abstraire d’un biais important : le phénomène de censure.

Censure et analyse de survie

Lorsque l’on modélise un phénomène de « survie » comme l’attrition à partir de données clients, une caractéristique importante de ces données doit être prise en compte : l’événement étudié n’a sans doute pas été observé chez tous les clients (l’ensemble des clients actuels par exemple, n’est pas entré en attrition). Une approche par régression nécessiterait de transformer cette donnée pour éviter des anomalies dans le modèle (espérance de vie moyenne infinie), par exemple en ne considérant que les clients déjà partis. Cette transformation biaise de façon incontrôlée le modèle et ses résultats : tous les individus utilisés pour entraîner le modèle ont vécu l’événement de « mort », ce qui est loin d’être le comportement désiré, surtout si la durée de vie normale d’un individu est plus grande que la période depuis laquelle la donnée est acquise ! (considérez un médecin qui étudie l’espérance de vie des patients après 10 ans ; s’il néglige tous les patients encore en vie, il ne parviendra jamais aux bonnes conclusions).

L’analyse de survie ne rencontre pas phénomène de censure, car elle ne modélise pas explicitement l’espérance de vie, et peut donc être entraînée à partir d’échantillons pour lesquels l’événement de mort n’a pas eu lieu — dans notre exemple, elle autorise le médecin à prendre en compte les patients survivants.

Usage pratique de l’analyse de survie

L’analyse de survie permet d’estimer pour chaque client, en fonction de ses caractéristiques, la probabilité qu’il soit encore présent pour n’importe quel horizon de temps. Cette information peut être ensuite transformée pour prédire l’attrition à un horizon de temps fixé (par exemple en déclenchant une alerte si la probabilité de départ du client à horizon six mois dépasse un certain seuil). Mais elle peut aussi être utilisée pour visualiser et estimer les différences d’attritions entre plusieurs groupes d’individus — en fonction du canal d’acquisition, de la période d’arrivée, ou encore de la présence ou non d’un événement dans leur parcours client —, et ainsi identifier les similitudes et différences dans les dynamiques d’attrition des groupes. Enfin, certains modèles comme celui de Cox sont directement interprétables : une fois entraînés, leurs paramètres reflètent l’influence des variables descriptives des individus sur la fonction de survie.

Utiliser l’analyse de séquences pour affiner l’étude

En pratique, l’analyse de l’attrition nécessite parfois de prendre en compte des facteurs supplémentaires :

  • D’une part, la remontée de l’attrition d’un client dans les données de l’entreprise peut n’être que très tardive, et indépendante de la fin réelle de l’expérience client (par exemple, si l’attrition correspond à la fermeture formelle d’un compte, celle-ci peut survenir bien après que le client ait cessé ses activités). Il est donc parfois nécessaire d’élargir la notion d’événement d’attrition, ou de s’intéresser à plusieurs phases de l’attrition.
  • D’autre part, l’attrition peut être causée par une succession de facteurs — qui sera difficilement détectée par des approches classiques, car celles-ci ne prennent pas ou peu en compte la temporalité dans la description d’un clients.

C’est pourquoi il peut être pertinent de compléter cette approche en définissant un ensemble d’événements clefs du parcours clients (demandes, nouvelles commandes, litiges, etc…) et en s’intéressant à la succession de ces événements et à la façon dont cette succession influe l’attrition : c’est l’analyse de séquences (dont voici une présentation plus détaillée).

Celle-ci permet de visualiser et d’étudier la façon dont les individus évoluent dans le temps, et en particulier de comprendre les conditionnements entre les événements (par exemple : la majorité des individus ayant vécu l’événement C ont d’abord vécu les événements A puis B). En représentant sous forme d’un arbre les probabilités de passages successifs entre les événements, on est à même d’identifier quelles sont les successions d’événements influant grandement sur le risque d’attrition. On peut notamment détecter les événements synonymes d’attritions effectives (ceux qui aboutissent invariablement à une attrition détectée), ou les événements charnière (ceux à la suite desquelles les parcours possibles sont radicalement différents en terme de risque d’attrition) — sur lesquels une action est la plus susceptible de réduire l’attrition. En travaillant avec une grande banque française, eleven a pu constater que la détection de ces événements charnière par l’analyse de séquences a une valeur particulière : ceux-ci peuvent avoir lieu longtemps en amont de l’attrition sans pour autant être facilement détectés par un modèle de détection classique, qui se concentrera sur les événements les plus corrélés à l’attrition (donc les plus tardifs), là où l’arbre permettra d’étudier en premier lieu les événements sources. Cette approche a aussi une composante prédictive directe : pour un client individuel, cette modélisation permet d’évaluer la probabilité empirique de chacun des parcours à partir de sa situation actuelle.

Ces deux outils rendent possible une étude fine et la mise en place de mesures préventives

Attaquée avec l’aide de ces outils, l’attrition des clients de l’entreprise n’est plus une fatalité, et son impact peut être fortement réduit :

  • D’un part, l’analyse de survie permet de mieux l’anticiper, à un niveau de granularité temporelle et sectorielle élevé.
  • L’analyse de séquence permet quand-à elle d’affiner la prédiction du parcours d’un client en l’enrichissant de plusieurs événements clefs pour prendre des actions ciblées. Mais son principal intérêt reste d’identifier rapidement les événements et les séquences d’événements qui sont les plus impactants sur le risque d’attrition, afin de guider les actions à mener pour la prévenir sur l’ensemble de la clientèle.

L’intérêt de l’analyse de séquence dans l’entreprise ne s’arrête pas là : elle peut aussi être utilisée pour étudier les parcours d’acquisition, de vente, ou, de façon générale, l’ensemble du parcours client dans l’entreprise.

 

Louis Dumont, Charafeddine Mouzouni

Sur le même sujet

nous suivre

Tous droits réservés Eleven Strategy ©2021