Press "Enter" to skip to content

深度分享丨如何使用微细分仪打造金融场景下的战术级客户分群

本站内容均来自兴趣收集,如不慎侵害的您的相关权益,请留言告知,我们将尽快删除.谢谢.

银行、保险、证券等金融机构的客户总量可能高达数百万直至数亿,如何快速,科学,有效地对客户进行分群画像,是客户管理、精准营销、业务挽留的关键。一般而言,金融机构都做了客户细分,但具体做法不够细致,仅仅依据了其中最重要的几个变量(如学历、工作性质等)来划分大类(如大学生客群、白领客群、蓝领客群等);这种做法的后果是,每个大类的人数还是偏多(可能有百万量级),大类群员之间也依然存在着明显的行为特点差异。这样的分群方法过于宏观、粗放,缺乏对一线业务人员的战术级支撑。

 

为了解决金融机构客户分群画像的痛点,索信达控股有限公司(简称:索信达控股,股票代码:03680.HK)推出了基于深度学习的客户微细分仪。最近,索信达 AI 创新中心数据科学家万友平博士对此进行了详细介绍,本文就是根据万博士的《客户微细分仪—基于深度学习的战术级客户分群》直播内容整理而成,以飨读者。

 

客户微细分仪:基于深度学习的战术级客户分群利器

 

随着算力的突飞猛进和大数据的快速积累,深度学习技术在最近 10 年得以引爆,引领了新一轮人工智能的研究和应用热潮。从 Alex Krizhevsky 应用深度卷积神经网络赢得 ImageNet 竞赛开始,深度学习已经在计算机视觉、自然语言处理、语音识别等领域占据了绝对主导地位。

 

深度学习如何应用于金融领域呢?一般而言,客户的资产信息、交易明细和行为偏好等重要数据以宽表形式存储。然而,这种结构化的数据(表格数据)并不适合直接用深度学习进行计算,这样就难以享受到深度学习技术的强大威力。有没有办法将深度学习引入到金融客户宽表的数据分析中去呢?答案是有的,基于索信达客户微细分仪专利技术,可以首先将结构化数据转换成图像数据,进一步利用深度学习挖掘显着特征,最后采用密度聚类算法实现客户的微细分群。

 

金融机构的客户总量可以高达数百万直至数亿,传统客户细分方法往往存在以下不足:

 

1)分群数量偏少,群成员可能高达几十万数百万人,群成员特征差异大,客户经理难以处理;

 

2)分群依据往往只用到众多标签中的一个,分群维度单一,忽略了标签之间的关联;

 

3)分群严重依赖专家的业务经验,分群工作繁复,复用性却很低。

客户微细分仪技术旨在帮助金融机构更有效地对其客户进行分群画像,其技术要点如下:

 

1)客户结构化数据(宽表)图像化,客户和客群都可以用一张图来直观表示;

 

2)利用深度学习挖掘图像的显着特征,基于图像聚类实现客户微细分;

 

3)“分箱编码”和合理的聚类算法选择,在保证精度的同时,大幅提升处理效率。

 

本次分享我们重点讲解客户微细分仪的实际应用效果,尤其是其在银行营销场景和券商场景的落地情况。客户微细分仪的技术细节在索信达首席科学家张磊博士的《人工智能在银行业的应用》一文中有详尽介绍,参见文末“相关阅读”,本文不再赘述。

 

客户微细分仪在银行营销场景的应用

 

首先来看客户微细分仪在某头部股份制银行的实施情况。我们拿到了 500 万富裕零售客户过去 12 个月的数据,他们的 AUM 月日均在 5 万元以上,每个客户字段包含 AUM、活存余额、定存余额、基金余额、理财余额等信息。下表摘取了其中的五位客户,每一位客户都可用对应的一行数字来刻画,换句话说,客户的数据是结构化的。

接下来对客户数据进入微细分处理,首先将其标准化(在这里是除以每一位客户的 AUM),然后进行离散分箱,得到每一个客户的分箱编码。如下图所示,每一个客户都有唯一的分箱编码如“x0090000000”,其位数等于变量的个数(首字母‘x’被用作标识符);其数值取 0-9 中间的一个数(对于 10 分箱而言),‘0’表示对应的资产占比位于最末分箱,‘9’代表对应资产占比位于最高分箱(前 top 10%),也最重要。

然后计算字段之间的相关性,显而易见,资产与资产之间存在着明显关联,传统分群方式往往仅考虑一个指标(如总资产占比最大的那一类资产)作为分群依据,但这样做很明显是忽略了变量之间的关联性。

为了将变量与变量之间的关联性也纳入分群依据,我们在网络布局算法里将相关系数建模成一种引力,将资产占比建模成星球的大小,经过星球系统的动力学演化,可以得到资产的星系图:

想要适应深度学习技术,可以结合插值和染色算法,将上述图像转化成热力图(见下图);至此,总体数据的图像化过程就完成了。很直观看到,客户总体里定期存款占据大头,那里出现了一个白热的亮点;活期存款形成了另一个更矮的暗红小山头;、理财比较少,黄金基本看不见。这符合我们对居民银行财富分布的大体认知。

接下来依次将每一个客户表达成一副图像(150*100*3),他们的资产分布形成了个性化的热力图:

在这里,左图客户的热点落在了定期存款那里,他/她是一个“纯定存客户”,一般来说,他/她的粘性比较差,定期存款到期的时候需要警惕;右图是一个“日常消费型”的客户,其活存和借记卡各占约一半,他/她可能追求的是资金流动性。通过结构化数据图像化技术,我们获得了客户特征的直观观感。

 

接下来我们用深度学习自编码器对客户图像进行降维处理,使之成为 128(4*4*8)维的特征:

基于此,进一步利用 DBSCAN 算法对图像进行聚类,实现对客户的微细分群。如下图所示,每一行代表了一个微细分客群,客群里群员都具有非常相似的图像特征,可见分群的纯度非常高,分群效果极好。

总结客户微细分仪在该股份制银行的落地,我们取得了如下效果:

 

1)将每月 500 万客户细分为 1616 个客群,并得到客群的微细分图像特征;

 

2)通过引入客户微细分产生的新图像特征,将上线模型(大额存单、结构性存款)前 10%名单的命中率提高 20%~40%;

 

3)前 5%名单的命中率最高提升 3/4。

 

客户微细分仪在券商场景的应用

 

我们接着来看客户微细分仪在某头部券商的实施情况。该头部券商非常重视 APP 客户访问理财模块的活跃度,我们拿到了 2020 年全年的客户数据,每月约 200-300 万条。经过变量筛选过程后,最终进入微细分建模的变量如下表所示:

经过相同的图像化技术,我们得到了客户总体的星球图:

从总体星球图,我们得到了各变量的星系坐标;然后我们得到客户总体的热力图:

从中我们看到占比最大的变量是 APP 登录次数、访问理财模块天数,此外,访问交易行情模块天数、访问技术指标模块天数也有一定占比。

 

遍历所有客户得到他们的图像表示。注意在这里我们使用了四分箱方式,客户的分箱编码数值因此位于 0-3 之间,‘0’表示该客户的该项排名位于所有人的最后 25%,‘3’代表该客户的该项排名位于所有人的最前 25%。例如下图的“行情技术兼顾型”的客户,“APP 登录”为 3,意味着他/她的 APP 登录次数排到了所有人的前 25%,他/她属于高活跃频繁访问客户。

对于“行情技术兼顾型”客户,他/她有高活跃频繁访问,爱看行情看指标,但停留时间短,APP 登录最多,技术指标和交易行情访问最多,卖出盈利率低,APP 时长短;类似的,右图的客户高活跃频繁访问,只看行情无交易,停留时间长,APP 登录天数最多,交易行情访问最多,登录时长最久,其它均没有,我们把他/她叫做“无交易紧盯行情派”。

 

然后利用自编码器进行压缩图像,采用聚类算法得到分群,我们将 230 万客户细分成 588 个客群。在下图中,每个节点都代表一个微细分群,节点连线表示状态之间存在转化路径(转移概率超过 0.05);不同颜色表示了访问理财模块活跃的潜力(根据其提升度来进行划分),其中“高提升组”表示微细分特征提升大于 1.5,“中高提升组”表示提升介于 1.2-1.5,“中低提升组”表示提升介于 1.0-1.2,“低提升组”表示提升小于 1.0. 明显可以看出,高提升组的连线不多,很少转化到别的群组,他们应当是营销的主要客群;低提升组往中高提升组的转化较多,也有营销潜力;低提升组也较稳定,不太值得营销。

最后我们给出 16 个最值得做营销动作的客群编码及图像特征:

总结客户微细分仪在该头部券商的落地,我们取得了如下效果:

 

1)将 230 万客户细分为 588 个客群,得到客群的微细分图像特征,并提供了 16 个最值得营销的高提升度客群的画像;

 

2)通过引入客户微细分产生的新图像特征,理财活跃度前 10%名单的命中率提高 1.5 倍(随机命中率为 33%);

 

3)在 AB test 中,理财活跃前 5%名单的命中率提升 12.5%。 最后总结一下,索信达客户微细分仪拥有如下业务优势:

 

第一,“战术级微细分群”效果,可将总体分为成百上千个高纯度客群,精准找出目标营销群体,可按群制定有效营销策略;第二,分群过程高度自动化,标准化,速度快,降低分群任务对业务经验的依赖;第三,分群结果直观,易复用,大幅减少建模的次数。

 

Be First to Comment

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注