Quels sont les Enjeux du Big Data dans l’Assurance et la Banque ?

janvier 14, 2017
Data Univers

L’émergence du Big Data a profondément transformé la façon dont les entreprises optimisent leurs données au quotidien (pour celles qui le font), tout particulièrement dans le secteur de la banque et des assurances. Étroitement liés, ces deux secteurs analysent de plus en plus leurs données pour minimiser les risques financiers pris au quotidien. La concurrence dans le secteur bancaire, la diminution des rendements et la régulation croissante du métier amènent les banques à repenser progressivement leur approche client.

Limiter le churn / taux d'attrition

A l’heure où la concurrence entre les banques fait rage, analyser les comportements des consommateurs grâce à la collecte de données n’a jamais paru si crucial. Salaires, propension à dépenser, modes de consommation… toutes ces données permettent aux banques et assurances de proposer à leurs clients des offres sur-mesure à fortes valeurs ajoutées. Ce faisant, elles agissent pour limiter leur “taux d’attrition”, c’est-à-dire le taux de perte de clients. Dans un contexte où le coût d’acquisition de nouveaux clients explose, la démarche est primordiale.

Grâce au Big Data, le taux d’attrition des compagnies d’assurance et banques est donc tout naturellement amené à diminuer, et le taux de captation, à augmenter.

Minimiser les risques financiers

Une analyse approfondie des données à grande échelle peut également fournir aux banques des indicateurs précieux pour minimiser leurs risques financiers. Des modèles prédictifs développés par des Data Scientists permettent de définir les actifs les plus à risque, et donc d’adapter la prime de risque et les taux de rendement souhaités.

Dans les secteurs de la Banque et de l’Assurance, il faut valoriser les données recueillies, même si, bien sûr, cela doit se faire dans le respect de la réglementation en vigueur, pour préserver la sécurité des données et les informations personnelles des clients.

L'hyper-personnalisation de l'offre

La donnée est un asset qui permet une meilleure connaissance des clients : données socio-démographiques mais aussi habitudes de consommation, pratique d’un sport, type de conduite, clients en bonne santé ou non… Le but ? Connaître en temps réel le comportement de chaque client, de façon à déterminer les “profils à risque”. Ceux-ci sont le fruit d’une analyse poussée de données par les Data Analysts qui disposent à la fois de compétences techniques et métier précises. A terme, cette vision à 360° leur permet de déterminer un montant optimal dans la vie des assurés pour souscrire à une police d’assurance, ce qui leur permet donc, d’hyper personnaliser leurs offres.

Ce faisant, les compagnies d’assurance diminuent bien évidemment la sinistrabilité. Mais ce n’est pas tout. L’exploitation de leurs données permet également de prévenir les assurés d’éventuels risques de sinistres et donc de les fidéliser sur le long terme. Mieux : une hyper personnalisation des offres conduit à une meilleure satisfaction client, car ils ne paient que pour ce qu’ils consomment Grâce à une collecte et une analyse minutieuse de leurs données, les compagnies d’assurance et les banques ont une meilleure compréhension de la demande, ce qui les amène à réinventer l’offre.

La collaboration entre Saagie et la Caisse d’Epargne Normandie avait pour objectif de mettre à disposition les clés nécessaires à la compréhension d’un problème récurrent que rencontrait la CEN: l’attrition chez sa clientèle jeune (15 et 26 ans). La capacité de stockage de la plateforme Saagie a permis de travailler rapidement sur de gros volumes de données: plus d’un milliard de lignes (800 millions d’opérations, 200 millions de profils…) ont été analysées par nos experts. Après une phase de pré-traitement de la donnée, il a suffi d’une journée pour créer et construire le premier modèle.

L’équipe de Data Scientists Saagie a dû avoir recours à plusieurs technologies pour le chargement de toutes ces données, les analyses numériques et la visualisation: Sqoop, Talend, Impala, Python…Ensuite, plusieurs algorithmes, comme Random Forest, Gradient Boosting et ACP, ont été testés et combinés afin de compenser le manque de données sur les churners qui ne représentaient qu’un très faible pourcentage sur l’ensemble des clients.

L’analyse des données clients a donc permis une segmentation en fonction des actions et mouvements bancaires, dans le but de mieux cibler les clients « à risque », afin de leur proposer de meilleures offres et d’optimiser le suivi de clientèle. Grâce à Saagie, vous gérez simplement et facilement vos données: de la collecte à la visualisation graphique de vos données, nous mettons à votre disposition des experts dédiés, mais également les technologies les plus récentes du Big Data. Il vous est maintenant plus simple de détecter des corrélations entre vos données. Nous vous garantissons la parfaite maîtrise de vos données, même les plus sensibles grâce à une plateforme Big Data parfaitement sécurisée.

Les smart data dans la banque et les assurances

Avec les taux d’intérêt à des niveaux très bas, la sécurisation du PNB (produit net bancaire) et la recherche d’une meilleure rentabilité client sont devenues les priorités des banques et assurances. Les données sont un levier important pour améliorer la connaissance client et accroître l’efficacité opérationnelle. En particulier, l’anticipation de certains événements (sinistres ou moments de vie tels qu’un déménagement, une naissance d’enfant, un départ à la retraite) sont des opportunités essentielles pour proposer de nouveaux services et ainsi développer les cross-selling (Ventes croisées / Offres complémentaires) et up-selling (Montée en gamme).

Un autre phénomène intimement lié capte l’attention de nombreuses entreprises du secteur : l’attrition client. Traduisant le comportement d’un client qui quitte sa banque / son assurance, l’attrition est un phénomène complexe présentant des causes très diverses, comme :

Des causes sociodémographiques : situation sociale, maritale, professionnelle
Des causes psychographiques : valeurs, style de vie
L’apparition d’un « moments de vie » : achats de voiture ou de logement, mariage…
Le sentiment d’indifférence voire d’insatisfaction à l’égard des services souscrits ou de la relation client-entreprise.

La réalité est complexe car l’attrition est généralement due à la conjonction de plusieurs facteurs simultanés. Comprendre les critères qui amènent les clients à devenir des churners peut s’effectuer au moyen de deux approches complémentaires. L’étape préalable étant de définir, pour les clients actuels, ceux qui font preuve d’attrition (ce qui suppose avoir une définition claire de ce qu’est l’attrition en termes de mesure), et d’avoir un échantillon d’apprentissage avec des variables nettoyées et enrichies.

La première approche, non supervisée, consisterait à effectuer une segmentation du groupe des churners de la base. Cette segmentation commence généralement par une réduction dimensionnelle (visant à réduire le nombre de variables à manipuler) faite au moyen d’ACP (Analyse en Composantes Principales : analyse factorielle utilisée lorsque les variables sont numériques) ou d’ACM (Analyse des Correspondances Multiples : analyse factorielle utilisée lorsque les variables sont catégorielles) suivie des techniques de partitionnement (ex : K-Means, cartes de Kohonen) et/ou de regroupement hiérarchique (ex : CAH Classification Ascendante Hiérarchique). On fait ainsi émerger un certain nombre de clusters (ou segments) qui définissent les grandes typologies de churners, et que l’on caractérise pour les rendre plus opérationnels.

En complément de cette approche, on procède usuellement à des techniques de scoring (supervisé) à l’échelle individuelle. Grâce aux technologies actuelles, on confronte les traditionnelles méthodes de régression logistique et analyse discriminante à des techniques plus précises comme les random forests ou le gradient boosting. Il convient néanmoins de veiller à la répartition de la base d’apprentissage en termes de churners / non-churners. En cas de trop fort déséquilibre, on peut précéder ces modèles par une one-class SVM visant à écarter les grandes masses de non-churners pour rééquilibrer la base.

Tous ces modèles, théorisés il y a de nombreuses années, voient enfin leur mise en pratique concrète grâce à la multiplicité des sources de données clients et la puissance des frameworks exécutant les algorithmes.