收藏本页 打印 放大 缩小
0

大数据如何改变寿险定价模式

发布时间:2016-12-20 11:12:03    作者:张宁    来源:中国保险报·中保网

寿险定价的核心忽略这样一个事实,即寿命本身的含义。日历年龄本质上并不能反映一个人的健康状况,也就是说,这个因素恰好和保险所关心的“风险”相关性不大,这样的矛盾在过去数百年并不可能实质性的解决,但是如今科技的高速发展,孕育出了可以让保险人在某种程度上更有效把握风险因素的可能,我们将这种可能归结为生理年龄(Biological Age),以反映个性化的风险程度。

□张宁

金融和保险行业积累了大量数据,但是在与大数据技术和人工智能技术结合上一直迈步不前,原因一方面是金融和互联网存在一定的跨界性,复合的人才和思维较少,也有金融业自身既有模式的惯性阻碍。这种阻碍在许多细分领域得到体现。

例如,以寿险定价为突破口,寿险定价的核心在于获得寿命的分布函数(或者是生存函数),然后通过计算精算现值获得精算纯保费,这样的模式从保险诞生之初持续到现在。各类研究也在努力探讨寿命的分布,但忽略这样一个事实,即寿命本身的含义。日历年龄本质上并不能反映一个人的健康状况,也就是说,这个因素恰好和保险所关心的“风险”相关性不大,也正因为此,保险需要通过大量的个体来实现风险的分担,因为保险人不能更好地“把握”投保人个体所面临的风险。

限于多方面因素,这样的矛盾在过去数百年并不可能实质性的解决,但是在过去十多年,基因、互联网、医疗技术、穿戴设备、人体量化、大数据等方面的高速发展,孕育出了可以让保险人在某种程度上更有效把握风险因素的可能,我们将这种可能归结为生理年龄(Biological Age),从而将深度学习和大数据技术引入,重新变革保险定价模式,以反映个性化的风险程度。

根据生理年龄实现精准定价

我们尝试用深度学习结合大数据技术来改变保险行业延续数百年的寿险精算定价方式。从技术实现、随机测试、结果比较都发现,传统的保险业面临着变革,作为经营风险的行业,保险公司真正可以做到个性化的风险度量,这本质上改变了“依赖大数定律”的根基。

通常,寿险精算定价都是基于生命表,通过计算精算现值获得精算纯保费,而所使用的年龄是其日历年龄,但同样日历年龄的人,由于生活方式、运动习惯、工作性质等原因,其健康风险以及“死亡风险”应该是不同的,所以,基于日历年龄的生命表并不能很好地反映该个体真实的风险,导致保险企业测算的保费和其承保的风险分离。

通过研究,我们认为,生理年龄能够更好地反应个体的风险,这在25岁以上的人群更加明显,由此提出将定价从日历年龄转移到“生理年龄”。

为了使生理年龄的应用可以简单高效地融合到保险既有体系中,我们提出了基于“手背纹理”照片的生理年龄测定方法。该方法所选用的手背纹理除了具有生理学研究的基础外,还通过30多项特征进行多次实践比较后最后选择的。

该方法具有如下特点:

第一,所需信息简单,容易获取。具体来说,就是一张相对清晰的完整手背照片,分辨率在1200×1200像素(含)以上即可,这在当前智能手机普及、拍照普遍800万像素以上的时代,要求极低。该照片只需要通过软件传输到云端即可处理。

第二,评价过程迅速快捷,在我们实验所使用的普通笔记本上,该识别过程不超过3.5秒。

第三,结果可靠,误差率低。通过进行随机检验,我们发现,不同年龄的个体生理年龄评价结果的误差是不同的,但整体上都在1岁左右,最大的偏差出现在24岁,其偏差达到了2岁,综合来看尽管没有达到生化方法所实现的0.8岁,但是考虑到简单易行,该结果是令人满意的。

第四,研究不涉及敏感隐私问题,手背纹不同于指纹,很难找出识别特征,从后面的研究可以看到,手背纹的特征分析非常好的反映了年龄特征和性别特征,但是并没有明显的个体识别特征。

第五,研究结果稳健。对于短时间内多张手背纹照片,评价结果差距很小,这个结果有望在改进算法后获得进一步提升;同时对于通过微信随机获取的3029张手背纹照片,能够获得结果的为2973个,几乎达到99%,具备可以实用的潜力。

需要注意的是,我们的方法是人工智能改变寿险定价的全新尝试,主旨是由此推动生理年龄用于精算的研究,推动人工智能和大数据技术在保险金融领域的应用,因此,并没有在技术层面进行更好地优化,这也意味着相关的结果可以做得更好、更有效以及更具应用性。

保险公司应形成自己的“智能大脑”

通过多次调整和实践,我们给出的基于卷积神经网络的深度学习框架为6层结构,而我们说的“手背纹理”照片不是直接输入到网络中学习,它需要通过一些特定的转换,使得对应结果可以更好的反应生理年龄。

尽管单纯从皮肤其实很难判断年龄,但选取手背纹作为生理年龄评价的输入却是有可能的,这是因为:真皮层与人的生理年龄的相关性很高,而真皮层对于纹理变化起到支撑作用,同时这也要求对于纹理的处理需要避免表皮层的干扰,这通过微分几何的“曲率”概念来达到目的;手背纹的信息还包含了骨骼和关节的信息,骨骼的密度和关节软骨的厚度会直接使特定区域手背纹理发生横切截面上切线方向变化;同时循环系统的信息会通过纹理的密度和连接层次得到反映。

这样我们构造的转换其实利用了这样两个信息:第一,真皮的细胞生长方向的差异能够凸显生理年龄;第二,骨密度及软骨变化更多体现在纵向的拉伸上。

我们使用的数据库是由数据灯塔(Data Lighthouse)计划健康因素库(Health Factor Measurement,HFM),包含370000幅手背纹图片,涵盖的日历年龄从15岁到53岁,其中带有标签数据371份。更大规模的数据获取有利于结果的更加稳定,针对日历年龄在21岁到52岁范围内的判断,已经达到可以实用的地步。

整体上,得到的生理年龄结果普遍要比正常日历年龄要老,意味着整体人群的健康风险要比日历年龄衡量的结果要大。基于这样的结果,我们可以变革传统的寿险定价模式。以30岁的人为例,随机抽取一个样本,其生理年龄评估为32.7岁,以1元作为保额,其终身人寿保险的纯保费对比如表。


表1:生理年龄定价与日历年龄定价差异

从表1可以看出,差异达到10%还要多,这意味着原来通过日历年龄定价的纯保费不足以反映投保人所面临的风险,或者说投保人用低的价格购买到了一份保障,从某种程度上,这是一种逆向选择。保险公司如果有大量保单,其聚集的风险是不足以通过保费来平衡的,将会给公司带来很大经营风险。

一个日历年龄为30岁的人,其生理年龄的分布情况可以统计出来,其分布区间为25岁到43岁,同时看可以计算各种情况下的生理年龄保费(如图1)。

图1:日历年龄30 岁的男性,其生理年龄的分布情况及保费情况

从图1可以清晰地看到,其生理年龄分布明显偏向右方,即整个群体的健康风险要比日历年龄30岁要大一些。如果以各测算的生理年龄对应百分比作为权重,测算保费的均值也明显要比日历年龄30岁的纯保费要大。

如果考虑日历年龄21岁到47岁的群体,计算每个日历年龄所对应的群体在生理年龄下测算的终身寿险纯保费(1元保额),并计算其均值,得到该均值随日历年龄变化的关系(如图2)。

图2:日历年龄定价结果与生理年龄定价结果比较

从图2可以看到,整体上看,生理年龄定价结果要普遍高于日历年龄定价结果,这反映了整个群体面临的风险要超过日历年龄定价测算保费所涵盖的范围,从另外一个角度说明了利用生理年龄定价更加公平合理,让保险公司避免“死差风险”,也减小投保人逆向选择的可能。

考虑到深度学习的特征,生理年龄应用于保险当然不仅仅局限于测算一下保费,保险公司引入生理年龄的本质,其实是建立以深度学习为核心的自我“智能大脑”。如同产品转向服务的趋势一样,保险公司提供的保险产品需要足够的用户黏性,而这个黏性一定是服务,而且是精准的服务、个性化的服务、高效率的服务。

以手背纹生理年龄框架为例,基于保险公司更多的样本、更多的“互动”数据,甚至基于客户的自身行为,可以建立起较完善的健康管理服务,并在这个服务基础上提供更多的产品,这一方面延续的产品对用户的吸引力,同时继续拓展了保险公司的业务线,是一个二维度的“连接”,而连接的中心,就是深度学习的生理年龄框架体系。

通过模型和实践,以及对保险行业的认识,我们认为:保险公司需要在多层面引入人工智能,形成自己的“智能大脑”,这在相当长时期将是保险公司核心竞争力的体现。

(作者系中央财经大学中国精算研究院大数据中心负责人)