信息来源:
一、全新的数字智能时代
自2018年下半年以来,几乎在一夜之间,我们所处的创新创业环境就已经发生了翻天覆地的变化,“互联网时代”进入下半场,并逐渐成为当前最时髦的一个词汇,而且不同行业、不同业界专家对此也有不同的解读,如“产业互联网时代”“人工智能时代”“金融科技3.0时代”“+互联网时代”“业务全球化时代”等。可以说,各自所处的行业及所在的立场不同,得出的结论也不尽相同。但是,无论大家如何理解,当前整个行业向前发展的总体趋势是确定的。目前,包括美国、中国、英国等在内的70多个国家和地区已将大数据应用上升为国家层面的重大发展战略。与此同时,随着大数据重要性的不断加强,越来越多的企业希望能够从大数据中挖掘价值,并将大数据应用作为获得差异化竞争优势的重要途径。数字智能时代有望开启下一次工业革命。
为了更好地理解这个全新的数字智能时代对人们生活、学习以及工作等方面所带来的深刻影响,我们可从以下几个数字化案例进行体会。
首先是坐姿的数字化。人们由于身高、体重、腿长的不同,平时所习惯的坐姿也不尽相同,如果在我们平时所坐的座位上安装一个传感器,就可以把我们所处的位置、身体落座后所保持的姿势等量化为数据,一旦传感器上传的数据显示与以往的坐姿出现比较大的差异时,就可以迅速觉察并予以分析可能存在的原因。这种坐姿的量化目前已有非常重要的应用:一是被应用到汽车防盗领域。驾驶员在发动汽车之前,系统会分析其坐姿与以往是否出现较大差异,如果出现较大的差异,则需要驾驶员进一步通过密码、指纹、虹膜或人脸等辅助认证后,才能发动汽车,否则就会自动报警。二是应用于疲劳驾驶识别领域。司机在驾驶行进过程中,如驾驶方式或坐姿出现与疲劳驾驶相似的异常时,汽车会自动发出警报声音提示司机注意休息,从而避免疲劳驾驶。
其次是旅程的数字化。以前,我们要想知道某个人去过什么地方旅游,了解的唯一途径就是他本人或别人替他写的游记,如马可波罗游记、徐霞客游记等。这种传统的游记方式,一方面检索查阅起来比较困难且难以复制;另一方面可信度也不高,当时马可波罗将他在中国的所见所闻写成游记并向意大利民众宣讲时,广大民众对其均抱怀疑态度。现在是“人手一机”的时代,人们在旅游出行到了目的地后,一般都会通过电话、短信、微信等方式给家人或朋友报平安,还经常拍照留影,并在朋友圈分享,这些都是对其旅程的量化过程,即便部分游客非常注重隐私,从不晒朋友圈,但手机一般都有GPS定位等功能,只要将这些多方面的量化过程所转换的数据予以清洗与整理,也能勾画出这个人的数字化旅程,或称“电子足迹”。
再次是城市出行的数字化。目前,当我们要驾车去城市的某个地方,即使知道怎么走,一般也会习惯性地通过百度地图或高德地图查看实时路况,规划最优出行路线,避开拥堵路段,以节省出行时间。部分互联网企业在此基础上创新推出了无人驾驶等更加智能的出行方式。试想,如果没有技术手段对整个城市道路及周边建筑进行量化并对数据进行实时分析的话,这种安全便捷的智能出行方式还有可能出现吗?
二、大数据与大数据应用的价值
对以上情况进行分析发现,这些事物量化后转换的数据,与我们通常所提到的数据比较起来,有以下几个不同的特点:一是数据量非常大。资料显示,目前全球互联网每天产生的数据累计达1EB(即10亿GB或1000PB),相当于660亿部《金庸全集》(一部《金庸全集》大约860万字),可刻满1.88亿张DVD光盘。二是数据的种类较多,包括文本、图片、影像、音频、视频等,也就是我们通常所说的结构化数据、半结构化数据和非结构化数据等。三是数据的价值密度比较低,在互联网每天所产生的数据中,结构化数据、半结构化数据与非结构化数据的占比分别为5%、80%、15%,也就是说大约只有5%的结构化数据是可以直接用于分析的,其余超过95%的数据在用于分析之前,还需要进行大量的清洗与整理工作,否则就会出现“垃圾进垃圾出”的情况,不能产生真正的价值。四是数据的实时性要求很高,以上文提到的城市驾车出行为例,在驾车行驶的过程中,地图导航能够实时计算分析城市路况拥堵信息并及时推荐最优路线。
以上分析使我们不难理解大数据中的“大”并非仅是绝对意义上的“大”,它更强调数据的“全”,也就是“全量数据”的概念,每个数据的价值变得更加平等。
在宏观层面,全量数据不再是传统统计方法的抽样数据,不再采用“以点带面”的分析过程,进而避免了依据抽样数据分析导致的错误决策。在这方面的一个反面案例是,2008年苹果智能手机刚推出时,部分手机制造企业通过传统抽样数据分析得出“智能手机将受限于电池时间短等问题而不可持久”的结论,从而错失了企业转型的重大机遇。
在微观层面,更加强调个体数据的完整性。比如,金融行业在进行客户授信审批时均基于全量数据的理念,尽可能取得该客户的全部信息,除了分析客户在商业银行本身的基本信息与交易行为信息外,还尽可能从外部合作机构获取到客户的代发薪、社保、公积金等信息,甚至还从互联网渠道爬取与客户信用相关的负面信息等。
一般来讲,数据从产生到发挥价值需要经过三个阶段:一是找到真实的数据来源,二是加工处理这些数据,三是对这些经过加工处理的数据予以进一步分析鉴别并作出价值判断。我们先来看一个数据:2018年,某金融机构手机银行App的平均月活用户数突破4000万。这个数据有用吗?有用又没用。说有用,是因为我们可以从中了解该金融机构手机银行App的月活用户数,仅此而已;说没用,是这个数据没有经过加工处理,我们无法从中作出价值判断。因此我们需要对该数据予以加工处理,进一步得出以下信息,如同比增长75%、环比增长15%、占签约客户的30%、占基础客户的10%、列主要同业第二位等。数据经过加工处理后,维度更加全面,信息也更加丰富,但希望利用这些信息来指导后续业务的开展,还需进一步从客户结构、产品结构进行分析,得出客户不活跃的主要原因以及活跃客户经常交易的主要产品种类等,进而指导金融机构制定后续业务发展的策略与措施。
数据分析的过程其实就是数据价值发现和创造的过程,但知易行难,很多企业在具体实践过程中,普遍面临以下挑战。
一是现有的数据不联通,客户在企业内部的数据分散在不同的应用系统,长期存在的系统竖井使数据相互隔离,形成数据孤岛。
二是由于客户数据相互隔离,而且可获取的数据丰富度不够,难以通过数字化的手段为客户进行全方位的画像,也就是说无法有效识别客户并预测客户需求。
三是无法实时获取客户信用与产品交易等信息,也就无法及时判断客户的信用状况以及在交易环节可能存在的风险并实时处理。
三、大数据应用的“软实力”与“硬支撑”
投资建设大数据基础设施容易,但要发挥其价值则较难,这不仅需要硬支撑,更需要软实力。从业界实践来看,要想切实做好大数据应用,需要具备两个方面的条件:一是要有大数据思维,二是要有大数据平台,二者缺一不可。
大数据思维是切实做好大数据应用的“软实力”。这要求企业养成“依托数据来说话、依托数据做决策”的习惯,并在“用数据说话”的大数据应用过程中逐步建立“多、快、好、省”的数字化观念,包括量化思维、重视全量数据的关联性分析等。“多”是要有基于全量数据开展数据分析的思维,不要再局限于随机样本数据;“快”是要有基于实时数据开展数据分析的思维,不能再停留于“前台接受客户申请、中后台批量审批业务”的传统做法,而是要适应客户希望实时获得推荐定制产品服务、实时监控潜在风险的需求;“好”是指在进行数据分析时,不要仅局限于从因果关系中寻求价值,更要在大量数据之间的相关性分析的基础上作出预测;“省”是要接受不精准的数据,并通过一定手段清洗、整理并进行分析利用,因为随着数据量的增加,数据格式并不一致,数据错失率也在不断提升,这就更需要企业具有“去伪存真”的能力。
大数据平台是切实做好大数据应用的“硬支撑”。建设大数据平台,首先是要抓住大数据应用的精髓,即坚持“问题导向”与“价值驱动”,对症下药,利用数据解决业务问题并带来实际效益。其次是不要落入两个误区:一是技术误区,即把大数据应用当作一项纯粹的IT基础设施来建设;二是认识误区,即不尊重行业特性,将大数据应用当作“万能钥匙”,面对所有问题都言必称“大数据”。大数据平台建设需要一个好的顶层设计与循序渐进的实施策略,需要业务、信息、应用和技术等多方面的协同。
在业务方面,重点关注大数据应用支撑的业务流程和端到端的业务场景,定义在总体企业战略指导下希望实现的业务能力及其关系,帮助企业业务发展,实现高效运营。
在应用方面,重点实现支撑业务流程及场景需要的应用组件和分析模块,对大数据平台进行高层次应用划分,并基于业务架构和业界最佳实践,指导整个大数据平台的构建与实施。
在信息方面,主要构建支撑应用组件的数据模型和分析模型(包括基于人工智能的模型与基于规则的模型等),从跨组织、跨业务的视角对数据与信息进行组织与管理,构建客户的360度统一画像以及相应的规则引擎库(包括推荐规则引擎库、营销线索引擎库、授信规则引擎库等)与支持多租户的可视化分析建模工具(如数据沙箱)等,为预测客户需求、提升风险控制水平、向客户提供量身定制的产品与服务奠定良好的基础。
在技术方面,重点是要采取Hadoop、分布式、流计算等先进的信息科技建设符合应用架构和信息架构的大数据一体化技术支撑平台,基于面向服务的架构思路,实现信息、应用、流程的横向贯通,并运用各项成熟技术实现对企业各类数据的可视化展现,从而有效支撑智能决策。一般而言,大数据平台的技术体系架构包括集成层、存储层、计算层、整合层、智慧层、消费层与洞察层等多个层面,所需要的技术能力包括多形态数据存储、多维度数据集成、实时决策分析、规则引擎、模型部署、机器学习等。
四、金融大数据应用实践与未来展望
金融业是大数据的重要产生者,是信息科技密集型行业,也是典型的数据驱动型行业。对于金融机构而言,大数据不仅是一种创新工具,更是一种无可比拟的战略资源,构建并实施金融大数据应用的主要目标是为了实现大数据应用与金融服务的快速完美融合,并“从大数据中找客户、从大数据中控风险、从大数据中要效率”。可以说,“数据是金融服务的边界”,拥有的数据有多全,金融服务覆盖的领域就可以有多广。在“数据为王”的全新数字智能时代,谁真正掌握了金融大数据应用,谁就能最终赢得未来发展的主动权与竞争优势。事实上,目前国内外已有不少金融机构正在积极推动大数据平台的建设与大数据应用的创新,并在洞察客户行为、变革营销模式、创新数字风控、实时侦测风险等方面取得了非常显著的成效。
在洞察客户行为方面,金融机构主要是通过对数据资产的有效分析与应用,在深刻理解客户各项内外部数据(包括基本属性数据、交易数据、行为数据等)的基础上建立客户标签服务体系,并抽象出客户360度统一画像,还原客户行为特征,使企业能够更好地识别自己的客户(Know YourCustomer,KYC),这是一个“化抽象为具体”的数字化过程,是金融大数据应用的核心。构建客户360度统一画像是一个持续的过程,一方面需要充分利用大数据的技术与思维建立客户标签服务体系,另一方面也要根据不同的维度(包括渠道、来源、结构、内外部等)对客户标签服务体系进行分类动态管理。
在变革营销模式方面,在原有营销体系下,由于无法及时精确掌握每位客户的需求偏好,只能统计到“面”,营销方式多采取以产品为中心的“广而告之”,为客户提供各类产品的说明信息,由客户根据自己的需求进行选择,以这种被动的营销方式提供的产品和服务千篇一律,效果和效率都不尽人意。基于大数据构建客户360度统一画像后,可以精确到“点”,分析粒度将从客户群体精细化到每一位客户,使金融机构可以实时分析每一位客户当前的需求,准确及时地把握客户的行为偏好,从而改变原有粗放、被动的营销模式。在结合决策树、贝叶斯算法等规则模型后,可进一步构建以数据为驱动,以模型为核心的“千人千面”的精准营销模式,及时组织好匹配的产品与个性化服务以响应客户的需求。此外,这种新的营销模式还可引入客户交易信息反馈的量化分析与评价机制,不断优化和调整营销策略,真正达到“想客户之所想,荐客户之所需”的营销效果,进一步降低服务成本,不断提升客户的转换率、用户的留存率以及交叉渗透率,实现传统营销模式革命性的变革。
在创新数字风控方面,核心是充分利用大数据技术,通过与合作机构对接和数据共享等方式获取并分析处理客户业务项下的交易、资金、物流等数据,降低信息的不对称性与不透明性,基于客户360度统一画像建立基于数字信用的信用评级模型,金融机构可改变前期金融机构仅按照“三位一体”审批流程以及利用单一客户财务经营信息、抵质押担保信息等的传统授信审批模式,实现面向业务场景和交易过程授信,并结合小微企业、“三农”客群等长尾客户“额度小、期限短、需求频繁、办理要求快”的贷款需求特点在贷前、贷中和贷后等全流程丰富风险管理措施,如基于自然语义分析(NaturalLanguage Processing,NLP)的客户动态关联图谱等,推出高效便捷的“自动化、直通式”融资服务模式,提高融资效率,降低融资成本,服务实体经济。贷前,改变传统模式下客户信息收集困难、信息准确性难以验证的问题,通过大数据分析提高贷前调查获取信息的准确性,重点关注客户真实性与授信额度等问题;贷中,丰富模型变量,改变依靠财务报表建立信用评价体系对客户形成门槛的现状,通过大数据驱动建立基于交易闭环的信用评级体系,重点关注客户的还款能力与还款意愿等;贷后,改变传统贷后回访、年度审查模式下贷后管理的滞后和形式化问题,通过大数据分析实现动态、及时的风险监控和系统自动触发的预警等,重点关注客户逾期与催收以及相关分析与反馈等问题。
在实时侦测风险方面,金融机构主要通过大数据应用技术整合内外部收集到的各种数据,尽可能消除申请及交易等环节的信息不对称问题,并与客户行为建立关联,从而更全面地了解客户、评估客户、发现可疑的活动,不断通过金融大数据应用提升实时反欺诈的识别、评估、控制、缓释、监测和报告六大关键能力。一方面基于金融大数据应用建立丰富的反欺诈模型、规则以及反欺诈知识库(包括行业内外的欺诈信息、欺诈形式、影响范围和人群以及应急手段等),从账户、设备、位置、行为、关系、偏好等多个维度实时监测客户每笔交易行为并作出预警。另一方面通过强大的数据分析处理能力,可以在20~30毫秒识别每笔交易活动的潜在风险(目前比较常用的反欺诈分析识别手段主要有规则判断、行为特征分析、模型智能识别、关联分析等),并根据风险识别的不同情况采取差异化的智能处置措施,包括直接放行、拦截操作、增强验证、暂挂交易、账户冻结等,实现实时高效、客户无感的反欺诈服务,切实保障用户资金和账户安全,实现风险防控和客户体验“双提升”。