1、2015年2月互联网金融生态系统2020系列报告之大数据篇回归 “价值” 本源: 金融机构如何驾驭大数据?邓俊豪、张越、何大勇更多投研资料 公众号:mtachn目 录内容概览1. 价值导向与内嵌式变革BCG对大数据的理解 1.1 成就大数据的“第四个V” 1.2 变革中的数据运作与数据推动的内嵌式变革 2. 应用场景与基础设施纵览海内外金融机构的大数据发展实践 2.1 大数据的金融应用场景正在逐步拓展 2.2 大数据要求金融机构重新审视自己的基础设施与环境3. 超越技术的管理视角金融机构驾驭大数据的三个关键点 3.1 数据人为:建设团队是核心 3.2 高效行动:形成机制是保障 3.3 构筑优势
2、:转变思维是根本 4. 用实践引领思考BCG在大数据方面的能力推荐阅读 12245714181919 202123更多投研资料 公众号:mtachn波士顿咨询公司2015年2月回归 “价值” 本源: 金融机构如何驾驭大数据?内容概览横看成岭侧成峰,远近高低各不同。不识庐山真面目,只缘身在此山中。苏轼 题西林壁无论是接受还是拒绝, 中国金融业的大数据时代正在呼啸而至。 据调查, 经过多年的发展与积累,目前很多国内金融机构的数据量级已经达到100TB以上。 而且, 非结构化数据量正在以更快的速度增长。 在高数据强度的金融行业, 这一发展激起了 巨大的想象空间。 然而, 要抓住这一机遇并非易事。基于
3、多年的研究与全球项目实操经验, 波士顿咨询公司 (BCG) 系统梳理了 大数据在全球金融行业的发展现状、 潜在应用、 关键瓶颈及应对方案, 旨在协助金融机构从价值的角度更好地理解大数据, 并在大数据迅速渗入金融业务各个层面的当下抓住发展机遇。本报告主要观点: 成就大数据的不仅是传统定义中的 “三个V” , 即数量 (Volume) 、 速度 (Velocity) 和种类(Variety) 。 对金融机构而言, 更重要的是第四个V, 即价值 (Value) 。 大数据的价值不仅体现在对金融机构财务相关指标的直接影响上, 也体现在对商业模式变革的推动能力上, 即不断引发传统金融机构的内嵌式变革。
4、大数据从四个方面改变了金融机构传统的数据运作方式, 从而实现了巨大的商业价值。这四个方面 ( “四个C” ) 包括: 数据质量的兼容性 (Compatibility) 、 数据运用的关联性 (Connectedness) 、 数据分析的成本 (Cost) 以及数据价值的转化 (Capitalization) 。 大数据在金融业的应用场景正在逐步拓展。 在海外, 大数据已经在金融行业的风险控制、 运营管理、 销售支持和商业模式创新等领域得到了 全面尝试。 在国内, 金融机构对大数据的应用还基本处于起步阶段。 数据整合和部门协调等关键环节的挑战仍是阻碍金融机构将数据转化为价值的主要瓶颈。 数据技术
5、与数据经济的发展是持续实现大数据价值的支撑。 深度应用正在将传统IT从 “后端” 不断推向 “前台” , 而存量架构与创新模块的有效整合是传统金融机构在技术层面所面临更多投研资料 公众号:mtachn回归“价值”本源:金融机构如何驾驭大数据?2波士顿咨询公司2015年2月的主要挑战。 此外, 数据生态的发展演进有其显著的社会特征。 作为其中的一员, 金融机构在促进数据经济的发展上任重道远。 为了驾驭大数据, 国内金融机构要在技术的基础上着重引入以价值为导向的管理视角, 最终形成自上而下的内嵌式变革。 其中的三个关键点 ( “TMT” ) 包括: 团队 (Team) 、 机制(Mechanism
6、) 和思维 (Thinking) 。1. 价值导向与内嵌式变革BCG对大数据的理解 “让数据发声! ”随着大数据时代的来临, 这个声音正在变得日益响亮。 为 了在喧嚣背后探寻本质, 我们的讨论将从大数据的定义开始。1.1 成就大数据的 “第四个V”大数据是什么? 在这个问题上, 国内目前常用的是 “3V” 定义, 即数量 (Volume) 、 速度(Velocity) 和种类 (Variety) 。虽然有着这样的定义, 但人们从未停止讨论什么才是成就大数据的 “关键节点” 。 人们热议的焦点之一是 “到底多大才算是大数据? ” 其实这个问题在 “量” 的层面上并没有绝对的标准, 因为“量” 的
7、大小是相对于特定时期的技术处理和分析能力而言的。 在上个世纪90年代, 10GB的数据需要当时计算能力一流的计算机处理几个小时, 而这个量现在只是一台普通智能手机存储量的一半而已。 在这个层面上颇具影响力的说法是, 当 “全量数据” 取代了 “样本数据” 时, 人们就拥有了大数据。另外一个成为讨论焦点的问题是, 今天的海量数据都来源于何处。 在商业环境中, 企业过去最关注的是ERP (Enterprise Resource Planning) 和CRM (Customer Relationship Management) 系统中的数据。 这些数据的共性在于, 它们都是由一个机构有意识、 有目的
8、地收集到的数据, 而且基本上都是结构化数据。 随着互联网的深入普及, 特别是移动互联网的爆发式增长, 人机互动所产生的数据已经成为了另一个重要的数据来源, 比如人们在互联网世界中留下的各种 “数据足迹” 。 但所有这些都还不是构成 “ 大量数据” 的主体。 机器之间交互处理时沉淀下来的数据才是使数据量级实现跨越式增长的主要原因。 “物联网” 是当前人们将现实世界数据化的最时髦的代名词。 海量的数据就是以这样的方式源源不断地产生和积累。 (参阅图1)“3V” 的定义专注于对数据本身的特征进行描述。 然而, 是否是量级庞大、 实时传输、 格式多样的数据就是大数据?BCG认为, 成就大数据的关键点在
9、于 “第四个V” , 即价值 (Value) 。 当量级庞大、 实时传输、格式多样的全量数据通过某种手段得到利用并创造出商业价值, 而且能够进一步推动商业模式的变革时, 大数据才真正诞生。 (参阅图2)更多投研资料 公众号:mtachn回归“价值”本源:金融机构如何驾驭大数据?3波士顿咨询公司2015年2月?Teradata?1?Wikibon?http:/wikibon.org/blog/big-data-statistics/?A/B?/RFID/? ?GPS?/?/? ?MBGBTBPB2.5PB?1 2TB?500MB?15MB?2?BCG?BCG?GigaZetaTera Peta
10、Exa?更多投研资料 公众号:mtachn波士顿咨询公司2015年2月1.2 变革中的数据运作与数据推动的内嵌式变革多元化格式的数据已呈海量爆发, 人类分析、 利用数据的能力也日益精进, 我们已经能够从大数据中创造出不同于传统数据挖掘的价值。 那么, 大数据带来的 “大价值” 究竟是如何产生的?无论是在金融企业还是非金融企业中 , 数据应用及业务创新的生命周期都包含五个阶段: 业务定义需求; IT部门获取并整合数据; 数据科学家构建并完善算法与模型; IT发布新洞察; 业务应用并衡量洞察的实际成效。 在今天的大数据环境下 , 生命周期仍维持原样, 而唯一变化的是 “数据科学家” 在生命周期中所
11、扮演的角色。 大数据将允许其运用各种新的算法与技术手段, 帮助IT不断挖掘新的关联洞察, 更好地满足业务需求。因此, BCG认为, 大数据改变的并不是传统数据的生命周期, 而是具体的运作模式。 在传统的数据基础和技术环境下 , 这样的周期可能要经历一年乃至更长的时间。 但是有了现在的数据量和技术, 机构可能只需几周甚至更短的时间就能走完这个生命周期。 新的数据运作模式使快速、 低成本的试错成为可能。 这样, 商业机构就有条件关注过去由于种种原因而被忽略的大量 “ 小机会” , 并将这些 “ 小机会” 累积形成 “ 大价值” 。 (参阅图3) 具体而言, 与传统的数据应用相比, 大数据在四个方面
12、 ( “4C” ) 改变了传统数据的运作模式,为机构带来了新的价值。?IT?IT?BCG?12345回归“价值”本源:金融机构如何驾驭大数据?4更多投研资料 公众号:mtachn波士顿咨询公司2015年2月1.2.1 数据质量的兼容性 (Compatibility) : 大数据通过 “量” 提升了数据分析对 “质” 的宽容度在 “ 小数据” 时代, 数据的获取门槛相对较高, 这就导致 “样本思维” 占据统治地位。 人们大多是通过抽样和截取的方式来捕获数据。 同时, 人们分析数据的手段和能力也相对有限。 为 了保证分析结果的准确性, 人们通常会有意识地收集可量化的、 清洁的、 准确的数据, 对数
13、据的 “质” 提出了很高的要求。 而在大数据时代, “ 全量思维” 得到了用武之地, 人们有条件去获取多维度、 全过程的数据。 但在海量数据出现后, 数据的清洗与验证几乎成为了不可能的事。 正是这样的困境催生了数据应用的新视角与新方法。 类似于分布式技术的新算法使数据的 “量” 可以弥补 “质” 的不足, 从而大大提升了数据分析对于数据质量的兼容能力。1.2.2 数据运用的关联性 (Connectedness) : 大数据使技术与算法从 “静态” 走向 “持续”在大数据时代, 对 “ 全量” 的追求使 “实时” 变得异常重要, 而这一点也不仅仅只体现在数据采集阶段。 在云计算、 流处理和内存分
14、析等技术的支撑下 , 一系列新的算法使实时分析成为可能。 人们还可以通过使用持续的增量数据来优化分析结果。 在这些因素的共同作用下 , 人们一贯以来对“因果关系” 的追求开始松动, 而 “相关关系” 正在逐步获得一席之地。1.2.3 数据分析的成本 (Cost) : 大数据降低了数据分析的成本门槛大数据改变了数据处理资源稀缺的局面。 过去, 数据挖掘往往意味着不菲的投入。 因此, 企业希望能够从数据中发掘出 “大机会” , 或是将有限的数据处理资源投入到有可能产生大机会的 “大客户、 大项目” 中去, 以此获得健康的投入产出比。 而在大数据时代, 数据处理的成本不断下降, 数据中大量存在的 “
15、 小机会” 得见天日。 每个机会本身带来的商业价值可能并不可观, 但是累积起来就会实现质的飞跃。 所以, 大数据往往并非意味着 “ 大机会” , 而是 “ 大量机会” 。1.2.4 数据价值的转化 (Capitalization) : 大数据实现了从数据到价值的高效转化在 互联网金融生态系统2020: 新动力、 新格局、 新战略 报告中 , 我们探讨了传统金融机构在大变革时代所需采取的新战略思考框架, 即适应型战略。 采取适应型战略有助于企业构筑以下五大优势: 试错优势、 触角优势、 组织优势、 系统优势和社会优势, 而大数据将为金融机构建立这些优势提供新的工具和动力。 从数据到价值的转化与机
16、构的整体转型相辅相成, “内嵌式变革” 由此而生。例如, 金融机构传统做法中按部就班的长周期模式 (从规划、 立项、 收集数据到分析、 试点、落地、 总结) 不再适用。 快速试错、 宽进严出成为 了实现大数据价值的关键: 以低成本的方式大量尝试大数据中蕴藏的海量机会, 一旦发现某些有价值的规律, 马上进行商业化推广 , 否则果断退出。此外, 大数据为金融机构打造 “触角优势” 提供了新的工具, 使其能够更加灵敏地感知商业环境, 更加顺畅地搭建反馈闭环。 此外, 数据的聚合与共享为金融机构搭建生态系统提供了新的场景与动力。 (参阅图4) 2. 应用场景与基础设施纵览海内外金融机构的大数据发展实践
17、金融行业在发展大数据能力方面具有天然优势: 受行业特性影响, 金融机构在开展业务的过程中积累了海量的高价值数据, 其中包括客户身份、 资产负债情况、 资金收付交易等数据。 以银行回归“价值”本源:金融机构如何驾驭大数据?5更多投研资料 公众号:mtachn波士顿咨询公司2015年2月业为例, 其数据强度高踞各行业之首银行业每创收100万美元, 平均就会产生820GB的数据。(参阅图5)?BCG?BCG?41235?3M?Netflix?Tesco?Apple?SNIA?NextGen Storage?IMEX Research?BCG?20140150180200220220230300460
18、4906507608201.0008000600400200?/?/?100?GB?回归“价值”本源:金融机构如何驾驭大数据?6更多投研资料 公众号:mtachn波士顿咨询公司2015年2月2.1 大数据的金融应用场景正在逐步拓展大数据发出的声音已经在金融行业全面响起。 作为行业中的 “巨无霸” , 银行业与保险业对大数据的应用尤其可圈可点。2.1.1 海外实践: 全面尝试2.1.1.1 银行是金融行业中发展大数据能力的 “领军者”在发展大数据能力方面, 银行业堪称是 “领军者” 。 纵观银行业的六个主要业务板块 (零售银行、 公司银行、 资本市场、 交易银行、 资产管理、 财富管理) , 每
19、个业务板块都可以借助大数据来更深入地了解客户 , 并为其制定更具针对性的价值主张, 同时提升风险管理能力。 其中 , 大数据在零售银行和交易银行业务板块中的应用潜力尤为可观。 (参阅图6) BCG通过研究发现, 海外银行在大数据能力的发展方面基本处于三个阶段: 大约三分之一的银行还处在思考大数据、 理解大数据、 制定大数据战略及实施路径的起点阶段。 还有三分之一的银行向前发展到了尝试阶段, 也就是按照规划出的路径和方案, 通过试点项目进行测验, 甄选出许多有价值的小机会, 并且不停地进行试错和调整。 而另外三分之一左右的银行则已经跨越了尝试阶段。 基于多年的试错经验, 他们已经识别出几个较大的
20、机会, 并且已经成功地将这些机会转化为可持续的商业价值。 而且这些银行已经将匹配大数据的工作方式嵌入到组织当中。 他们正在成熟运用先进的分析手段, 并且不断获得新的商业洞察。 (参阅图7)?BCG?回归“价值”本源:金融机构如何驾驭大数据?7更多投研资料 公众号:mtachn波士顿咨询公司2015年2月银行业应用举例1: 将大数据技术应用到信贷风险控制领域。 在美国, 一家互联网信用评估机构已成为多家银行在个人信贷风险评估方面的好帮手。 该机构通过分析客户在各个社交平台 (如Facebook和Twitter) 留下的数据, 对银行的信贷申请客户进行风险评估, 并将结果卖给银行。 银行将这家机构
21、的评估结果与内部评估相结合, 从而形成更完善更准确的违约评估。 这样的做法既帮助银行降低了风险成本, 同时也为银行带来了风险定价方面的竞争优势。相较于零售银行业务, 公司银行业务对大数据的应用似乎缺乏亮点。 但实际上, 大数据在公司银行业务的风险领域正在发挥着前所未有的作用。 在传统方法中 , 银行对企业客户的违约风险评估多是基于过往的营业数据和信用信息。 这种方式的最大弊端就是缺少前瞻性, 因为影响企业违约的重要因素并不仅仅只是企业自身的经营状况, 还包括行业的整体发展状况, 正所谓 “覆巢之下 , 焉有完卵” 。 但要进行这样的分析往往需要大量的资源投入, 因此在数据处理资源稀缺的环境下无
22、法得到广泛应用, 而大数据手段则大幅减少了 此类分析对资源的需求。 西班牙一家大型银行正是利用大数据来为企业客户提供全面深入的信用风险分析。 该行首先识别出影响行业发展的主要因素, 然后对这些因素一一进行模拟, 以测试各种事件对其客户业务发展的潜在影响, 并综合评判每个企业客户的违约风险。 这样的做法不仅成本低, 而且对风险评估的速度快, 同时显著提升了评估的准确性。?BCG?Great Western Bank?2008? ?2008?300%? ? ?IBM Watson? ?Zions Bank?Hadoop? ?140? ?KeyBank? ?25%? ?9%?60%?38%? ?Ha
23、doop?Map Reduce? ?Bank of America? Bank of America?“?”? ?ATM? ?80%?ATM?3?Great Western Bank?Zions BankKeyBank?Bank of America?回归“价值”本源:金融机构如何驾驭大数据?8更多投研资料 公众号:mtachn波士顿咨询公司2015年2月银行业应用举例2: 用大数据为客户制定差异化产品和营销方案。 在零售银行业务中 , 通过数据分析来判断客户行为并匹配营销手段并不是一件新鲜事。 但大数据为精准营销提供 了 广阔的创新空间。 例如, 海外银行开始围绕客户的 “ 人生大事” 进行
24、交叉销售。 这些银行对客户的交易数据进行分析, 由此推算出客户经历 “ 人生大事” 的大致节 点。 人生中的这些重要时刻往往能够激发客户对高价值金融产品的购买意愿。 一家澳大利亚银行通过大数据分析发现, 家中即将有婴儿诞生的客户对寿险产品的潜在需求最大。 通过对客户的银行卡交易数据进行分析, 银行很容易识别出即将添丁的家庭: 在这样的家庭中 , 准妈妈会开始购买某些药品, 而婴儿相关产品的消费会不断出现。 该行面向这一人群推出定制化的营销活动, 获得了客户的积极响应, 从而大幅提高了交叉销售的成功率。客户细分早已在银行业得到广泛应用, 但细分维度往往大同小异, 包括收入水平、 年龄、 职业等等
25、。 自从开始尝试大数据手段之后, 银行的客户细分维度出现了突破。 例如, 西班牙的一家银行从Facebook和Twitter等社交平台上直接抓取数据来分析客户的业余爱好。 该行把客户细分为常旅客、 足球爱好者、 高尔夫爱好者等类别。 通过分析, 该行发现高尔夫球爱好者对银行的利润度贡献最高, 而足球爱好者对银行的忠诚度最高。 此外, 通过分析, 该行还发现了另外一个小客群: “败家族” , 即财富水平不高、 但消费行为奢侈的人群。 这个客群由于人数不多 , 而且当前的财富水平尚未超越贵宾客户的门槛, 因此往往被银行所忽略。 但分析显示这一人群能够为银行带来可观的利润, 而且颇具成长潜力, 因此
26、该行决定将这些客户升级为贵宾客户 , 深入挖掘其潜在价值。 在对公业务中 , 银行同样可以借助大数据形成更有价值的客户细分。 例如, 在BCG与一家加拿大银行的合作项目中 , 项目组利用大数据分析技术将所有公司客户按照行业和企业规模进行细分,一共建立了上百个细分客户群。 不难想象, 如果没有大数据的支持, 这样深入的细分是很难实现的。 然后, 项目组在每个细分群中找出标杆企业, 分析其银行产品组合, 并将该细分群中其他客户的银行产品组合与标杆企业进行比对, 从而识别出差距和潜在的营销机会。 项目组将这些分析结果与该行的对公客户经理进行分享, 帮助他们利用这些发现来制定更具针对性的销售计划和话术
27、, 并取得了良好的效果。 客户对这种新的销售方式也十分欢迎, 因为他们可以从中了解到同行的财务状况和金融安排, 有助于对自身的行业地位与发展空间进行判断。银行业应用举例3: 用大数据为优化银行运营提供决策基础。 大数据不仅能在前台与中台大显身手, 也能惠及后台运营领域。 在互联网金融风生水起的当下 , “O2O” (Online To Offline) 成为了银行的热点话题。 哪些客户适合线上渠道? 哪些客户不愿 “触网” ? BCG曾帮助西班牙一家银行通过大数据技术应用对这些问题进行了解答。 项目组对16个既可以在网点也可以在网络与移动渠道上完成的关键运营活动展开分析, 建立了12个月的时间
28、回溯深度, 把客户群体和运营活动按照网点使用强度以及非网点渠道使用潜力进行细分。 分析结果显示, 大约66%的交易活动对网点的使用强度较高, 但同时对非网点渠道的使用潜力也很高, 因此可以从网点迁移到网络或移动渠道。 项目组在客户细分中发现, 年轻客户、 老年客户以及高端客户在运营活动迁移方面潜力最大, 可以优先作为渠道迁徙的对象。 通过这样的运营调整, 大数据帮助银行在引导客户转移、 减轻网点压力的同时保障了客户体验。BCG还曾利用专有的大数据分析工具Network Max, 帮助一家澳大利亚银行优化网点布局。虽然银行客户的线上活动日渐增多 , 但金融业的铁律在互联网时代依然适用, 也就是说
29、在客户身边回归“价值”本源:金融机构如何驾驭大数据?9更多投研资料 公众号:mtachn波士顿咨询公司2015年2月设立实体网点仍然是金融机构的竞争优势。 然而, 网点的运营成本往往不菲, 如何实现网点资源的价值最大化成为了每家银行面临的问题。 在该项目中 , 项目组结合银行的内部数据 (包括现有的网点分布和业绩状况等) 和外部数据 (如各个地区的人口数量、 人口结构、 收入水平等) , 对350多个区域进行了评估, 并按照主要产品系列为每个区域制定市场份额预测。 项目组还通过对市场份额的驱动因素进行模拟, 得出在现有网点数量不变的情况下该行网点的理想布局图。 该行根据项目组的建议对网点布局进
30、行了调整, 并取得了良好的成效。 这个案例可以为许多银行带来启示: 首先, 银行十分清楚自身的网点布局, 有关网点的经营业绩和地址的信息全量存在于银行的数据库中 。 其次, 有关一个地区的人口数量、 人口结构、 收入水平等数据都是可以公开获取的数据。 通过应用大数据技术来把这两组数据结合在一起, 就可以帮助银行实现网点布局的优化。 BCG基于大数据技术而研发的Network Max正是用来解决类似问题的工具。 (参阅图8) 银行业应用举例4: 创新商业模式, 用大数据拓展中间收入。 过去, 坐拥海量数据的银行考虑的是如何使用数据来服务其核心业务。 而如今, 很多银行已经走得更远。 他们开始考虑
31、如何把数据直接变成新产品并用来实现商业模式, 进而直接创造收入。 例如, 澳大利亚一家大型银行通过分析支付数据来了解其零售客户的 “消费路径” , 即客户进行日常消费时的典型顺序, 包括客户的购物地点、 购买内容和购物顺序, 并对其中的关联进行分析。 该银行将这些分析结果销售给公司客户 (比如零售业客户) , 帮助客户更准确地判断合适的产品广告投放地点以及适合在该地点进行推广的产品。 这些公司客户过去往往需要花费大量金钱向市场调研公司购买此类数据, 但如今他们可以花少得多的钱向自己的银行购买这些分析结果, 而且银行所提供的此类数据也要可靠得多。 银行通过这种方式获得了传统业务之外的收入。 更重
32、要的是, 银行通过这样的创新为客户提供了增值服务, 从而大大增强了客户粘性。?8?BCG?BCG?01234回归“价值”本源:金融机构如何驾驭大数据?10更多投研资料 公众号:mtachn波士顿咨询公司2015年2月2.1.1.2 大数据正在保险业全面渗透与银行业在大数据应用方面的高歌猛进相比, 保险业的相关动作稍显迟疑。 从全球保险业来看, 美国财产保险业对大数据的应用最为广泛深入, 医疗保险紧随其后, 寿险对大数据的应用则相对滞后。 与美国竞争对手相比, 欧洲保险机构在大数据能力的发展水平上存在一到两年的差距。 尽管如此, 大数据在保险行业主要价值链环节的潜在应用也已逐渐清晰。 (参阅图9
33、)纵观海外保险机构, 我们发现领先险企正在定价、 营销、 保单管理、 理赔和反欺诈等不同领域对大数据应用进行积极的尝试和创新。 这些创新对于保险业的商业与运营模式产生了革命性的影响。 (参阅图10)保险业应用举例1: 用大数据预防或减少赔付。 赔付会直接影响保险企业的利润, 对于赔付的管理也一直是险企的关注点。 而赔付中的 “异常值” (即超大额赔付) 是赔付额的主要驱动因素之一。 以某海外险企的工伤补偿为例, 不到20%的 “异常值” 带来了超过80%的赔付费用。 但是, 这些高额赔付的案例往往早有端倪, 如果能够及早干预就可以在很大程度上控制事态的发展。 比如, 关注伤者的疾病发展过程并及
34、时建议跟进治疗以避免慢性疾病的发生, 尽早建议用人单位进行工作调整以减少误工等等。 大数据能够为险企及时、 高效地采取干预措施提供良好的支持。 一家领先的美国保险集团通过结合内部、 第三方和社交媒体数据进行早期异常值检测, 及时采取干预措施, 从而使平均索赔费?BCG?1?/?HRIT?回归“价值”本源:金融机构如何驾驭大数据?11更多投研资料 公众号:mtachn波士顿咨询公司2015年2月用下降了20%。 该集团的预测模型使用了约1.4亿个数据点, 其中既包括了客户的个人数据 (健康状况、 人口特征、 雇主信息等) , 也包括了集团的内部数据 (过往的理赔信息和已经采取的医疗干预信息等)
35、。 此外, 这个模型可以随着新数据的加入而不断进行调整, 以提升其准确性。 欺诈是影响赔付的另一个重要因素。 而借助大数据手段, 险企可以显著提升反欺诈的准确性与及时性。 在美国, 一家汽车保险公司通过大数据分析识别出诈骗规律, 从而使车险诈骗案例减少了30%, 误报率减少了50%, 整体索赔成本降低了2-3%。 一家大型财险公司通过大数据分析, 发现了赔付总额高达2.3亿美元的诈骗嫌疑案, 并将识别欺诈的时间提前了117天。保险业应用举例2: 用大数据支持差异化定价。 对保费的定义是基于对一个群体的风险判断,而大数据无疑为这样的风险判断带来了前所未有的创新。 一家澳大利亚保险公司通过分析客户
36、的购物筐数据来预测驾驶风险。 分析显示, 饮用大量牛奶并食用大量红肉的客户具有较低的驾驶风险, 而食用大量意大利面和米饭并在夜间开车和饮酒的客户则是高风险人群。 英国保险公司英杰华集团 (Aviva) 运用网络数据来为保费设定提供支持。 网络数据分析有效帮助该公司识别出申请者的潜在健康隐患及风险, 其准确程度不亚于验血和尿检。?BCG?250?20%?1?Facebook?2-3%?2?70%?20%?10? + ?NTTDOCOMO Baloise Group The Climate Corporation HCFWoolworths?LexisNexis?Allstate?Aviva?Hi
37、ghmark?FICOInsure The Box Limited?Aviva Roadsense?QBE?GMAC Insurance?Progressive回归“价值”本源:金融机构如何驾驭大数据?12更多投研资料 公众号:mtachn波士顿咨询公司2015年2月此外, 大数据还能帮助险企优化定价体系。 出于定价原因而导致价值流失有多种情况, 比如在价格方面过于 “一刀切” 、 当客户停止购买其中一种产品后还在延续捆绑折扣、 不能及时更新定价、销售团队在提供折扣方面缺乏纪律性等。 而大数据分析可以帮助险企及时、 准确地发现问题并予以纠正, 从而防止价值 “渗漏” 。保险业应用举例3: 用大
38、数据实现差异化营销。 大数据技术正在使客户细分不断走向深入, 并日益成为精准营销的有力支撑。 一家英国保险公司通过整合多元化的海量数据对5千多位客户进行了细分。 在此基础上, 该公司制定了高度差异化的营销和客户维护方案, 最终在目标客群中收获了10倍的价值, 并节省了近1亿英镑的成本。此外, 大数据正在为险企揭示营销工作中一些根深蒂固的误区。 例如, 许多销售人员认为涨价是客户流失的主要原因, 于是竭力使用价格手段来留住客户 , 从而对利润造成了影响。 然而, 一家险企的大数据分析显示仅有三分之一左右的客户流失与价格有关。 因此, 采用更经济有效且具有差异性的方式来挽留客户就成为 了海外险企保
39、护价值的一个重要抓手。2.1.2 国内现状: 亟待破冰在国内, 大数据的发展可谓风起云涌。 这样的热潮同样波及到金融行业, 众多金融机构纷纷布局。 以银行业为例, 在大数据发展方面最为活跃的群体当属股份制银行, 而大数据应用则主要集中在客户营销、 产品创新、 风险控制和运营优化等领域。 例如, 光大银行研发了 “阳光理财” 资产配置平台 (APP) 来整合数据, 对客户投资需求进行细分, 并设计了 与之匹配的资产配置方案以支持营销。 光大银行还推出基于大数据技术的风险预警平台以提升风控水平。 此外, 该行还基于大数据Hadoop技术构建起核心历史数据查询平台, 使以往需要3-4天的查询时间缩短
40、到当日即可完成, 从而显著提升了运营效率。 民生银行通过大数据分析来定义营销举措并防止客户流失。 中信银行与银联商务合作开发出基于商户信息和POS流水交易数据进行风控的 “POS贷” 。国内保险行业有三个经典 “痛点” : 与客户接触频率低, 因而难以进行场景营销; 数据基础差,从而限制了精算能力, 进而对产品创新产生制约; 运营整合难, 从而影响了成本和客户体验。 而大数据无疑为解决这些问题带来了契机。 多家险企已经进行了布局, 主要领域包括产品创新、 风险控制和运营优化等。 例如, 淘宝的 “运费险” 保费低, 购买频率高, 理赔快。 泰康人寿联手阿里小微金融服务集团推出国内首个针对电子商
41、务创业人群的 “乐业保” , 并与可穿戴设备制造商咕咚合作推出互动式保险服务 “活力计划” 。 平安借助金融集团的数据优势, 通过分析信用卡的交易数据识别出车险的高风险人群。 太平洋保险应用 “大云平移” 技术在其官方微信平台正式推出 “大数据客户体验官 (DEO) ” 概念, 旨在提升运营与服务质量, 优化客户体验。保险业基于大数据的创新层出不穷, 但其中最具突破性的发展当属2014年由中国保险保障基金有限责任公司出资20亿元人民币成立的大数据公司中国保险信息技术管理有限责任公司,其意义在于催生出中国保险行业的数据共享平台。 数据的整合与共享是发展大数据的基础, 而这一点却是任何险企都难以独
42、自实现的。 这样的平台必将成为整个行业在大数据发展方面的一个有力支撑。回归“价值”本源:金融机构如何驾驭大数据?13更多投研资料 公众号:mtachn波士顿咨询公司2015年2月虽然已有诸多举措, 但金融行业的大数据发展往往被形容为 “雷声大、 雨点小” , 意指金融机构虽然投入不菲, 但市场可感知的效果却十分有限。 究竟是什么原因导致这一局面的产生? 我们在与众多金融机构的接触过程中观察到三个阻碍数据转变为价值的现象: 数据虽多 , 但整合困难。 国内金融机构虽然同样坐拥海量数据, 但其数据的存在状态反映了整个组织的现状, 即 “部门分制” 。 数据在组织内部处于割裂状态业务条线、 职能部门
43、、 渠道部门、 风险部门等各个分支机构往往是数据的真正拥有者, 而这些拥有者之间却常常缺乏顺畅的共享机制。 然而, 成就大数据的是数据的 “全量” , 这就要求金融机构内部能够实现高度的数据共享与整合。 这样的矛盾导致金融机构中的海量数据往往处于分散和 “睡眠” 的状态。虽然金融机构拥有的数据量 “富可敌国” , 但到真正利用时却 “捉襟见肘” 。 想法虽多 , 但动手困难。 面对自己拥有的海量数据, 金融机构真正敢 “碰” 的却很少。 许多金融机构担心触犯监管或法律底线, 或者担心擅自使用数据会侵犯客户的隐私权, 又或是担心数据处理不当可能会给机构带来声誉风险和业务风险。 因此, 这些机构虽
44、然积累了 大量数据, 并对应用模式进行了思考, 但最终仍处于隔河观望的状态, 难以付诸行动。海外金融机构也曾经面临同样的问题。 在与海外金融机构的合作中 , 我们给出的建议十分简单: 与数据拥有者坦诚沟通并征询他们的许可。 BCG的大量项目经验表明, 许多客户对于自己的数据被使用的接受度远比金融机构想象得要高。 资源虽多 , 但协调困难。 “技术部门不作为! ” “业务说不清到底要什么! ”这样的相互指责在很多金融机构的业务部门与技术部门之间都曾出现。 许多大数据项目就是在这种不顺畅的沟通中 “夭折” , 而不成功的经验只会加深双方的矛盾, 导致新的合作更加艰难。 这样的恶性循环在很多机构重复
45、上演。 我们发现, 复合型人才的匮乏、 合作机制的缺失以及工作方法的不当往往是造成这一局面的主要原因。2.2 大数据要求金融机构重新审视自己的基础设施与环境2.2.1 数据技术: 融合提升金融行业的数据强度在一定程度上决定了金融机构的技术强度。 以银行业为例, 在海外成熟市场, 银行平均将营业收入的8%左右投入IT系统建设; 而这一比例在国内稍低, 但也可达到3%左右。 如此重金打造的技术基础设施在大数据时代却面临着全面优化升级的挑战, 这是因为数据的采集、 存储和处理在大数据环境下发生了质的变化: 日益开放的数据采集冲击着传统的结构化数据基础, 常规的数据清洗在大数据面前失去 了意义, 海量
46、数据的存储需要低成本的基础设施, 实时性的分析要求新的数据处理技术.然而, 挑战背后必有机遇。 大数据同时为传统金融机构打造差异化竞争优势带来了宝贵的契机。 那么, 金融机构如何才能在技术层面上驾驭大数据时代? BCG认为, 金融机构需要理解大数据分析的四个层次, 关注13项核心技术, 并做好两个决策。 大数据分析的四个层次及十三项技术: 数据经过层层晋级成为可以指导行动的智慧, 而技术在这一过程中贯穿始终。 (参阅图11)回归“价值”本源:金融机构如何驾驭大数据?14更多投研资料 公众号:mtachn波士顿咨询公司2015年2月 数据收集与存储层: 这一层是基础所在。 数据从各个渠道以各种形
47、态涌入, 其中包括结构化数据 (如交易信息) 、 半结构化数据 (如日志信息) 、 非结构化数据 (如社交信息、 多媒体、 地理位置等信息) 等。 在这个层面上, 数据被实时和非实时地清理、 加工, 并被归档存储为有效信息以供后续的分析处理。o 结构化数据集成: 即便是在大数据时代, 结构化数据依然举足轻重。 结构化数据的集成仍然是大数据技术体系中的重要组成部分, 这样的技术目前已经非常成熟。o 非结构化数据集成: 为了满足不同业务场景的数据调用和分析需求, 在大数据体系中需要融入能够应对数据的多样性与多时效性特点的集成技术。o 分布式存储: 与常见的集中式存储技术不同, 分布式存储技术并不是
48、将数据存储在某个或多个特定的节点上, 而是通过网络调用企业中每台机器上的磁盘空间, 并将这些分散的存储资源构成一个虚拟的存储设备, 为大规模的数据存储需求提供了低成本的手段。o 流计算: 由于业务发展不断提速, 业务流程也日渐复杂, 我们的注意力日益集中在 “数据流” 而非 “数据集” 上。 决策者需要的架构应能处理随时发生的数据流, 而当前的数据库回归“价值”本源:金融机构如何驾驭大数据?15?BCG?.更多投研资料 公众号:mtachn波士顿咨询公司2015年2月技术并不适合数据流处理。o 并行计算: 并行计算能够充分利用各种计算和存储资源, 把计算分布到多个计算节点上,再在指定节点上将计
49、算结果汇总输出, 轻松实现针对TB、 PB级数据分析的秒级响应。o 分布式计算: 如果在分布式的数据环境中工作并希望在很短的时间内处理数据, 这就需要分布式处理。 在分布式处理领域广为人知的一个例子就是Hadoop。o 内存计算: 一般而言, 内存访问速度要比磁盘访问速度快几百倍甚至上千倍。 内存计算同时利用多个节点的计算能力和内存容量, CPU直接从内存而非磁盘上读取数据并对数据进行计算。 内存计算是对传统数据处理方式的一种加速, 是实现大数据分析的关键应用技术。 信息整合层: 这一层是将数据转换为信息的关键。 在这个层面上需要对数据进行去噪和增强处理, 完成关系型信息和非关系型信息在一定程
50、度上的整合。o 关系型信息整合: 关系型数据库发展已经相对成熟, 具有良好的可扩展能力和较高的处理能力。o 非关系信息整合: 传统关系型数据库已无法满足需求, 非结构化数据库不仅需要可以处理结构化数据, 而且应当更适合处理非结构化数据 (如文本、 多媒体等信息) 。 知识发现层: 人工智能和数据挖掘技术在这一层面上大显身手, 对在上一个层面整合好的信息进行分解、 提炼, 从中找出对目标对象有价值的信息点, 完成从信息到知识的转化。o 数据沙箱: 按需收集各种实验数据, 建立业务实验模型, 是大数据架构下用于探索业务数据的一个分析平台。o 实时决策: 在不影响用户体验的情况下 , 从一组备选方案