在互联网、大数据及云计算技术迅猛发展的当下,保险行业作为金融领域的重要成员,面临着如何拓展渠道、及时转变方向、如何快速创新等问题。改革、改良现有的经营管理方式、信息系统构建、数据整合分析手段等,是目前保险行业重点探索的业务提升、创新落地的方向。
作为数据整合及处理的核心──数据仓库,既承担着与保险核心系统及其他各个业务系统的数据ETL功能,又承担着整合数据、分析挖掘数据等重要的数据处理功能,在当下时效性要求越来越高、数据需求变化越来越快、数据容量越来越庞大的多变形式下,传统的数据仓库技术架构已经无法满足新的需求,迫切需要新一代的数据仓库解决方案。
保险业新一代的数据仓库采用大数据平台(Hadoop)+分布式数据库(MPP)的混合式架构,包括了数据采集层、大数据存储及处理层、大数据挖掘及展示层、大数据应用层、大数据管控中心、运营及管理中心等。无论是结构化还是非结构化数据,都可以经由平台进行实时、非实时采集,使用分布式文件系统存储,运用基于离线、内存、实时流等不同计算引擎进行处理、运算、挖掘,最终实现数据价值的可视化及不同应用场景的数据支撑。
新一代数据仓库解决了传统数据仓库无法满足的实时流式数据处理、非结构化数据处理、海量数据计算查询效率过低、数据无法全时在线、扩容成本偏高等技术及成本问题,全面应对了新需求:
1. 数据ETL过程加速
从源系统的数据采集开始,运用分布式、高性能、高可靠的多种技术组件进行数据ETL,让源系统的业务数据变化以实时、准实时的方式尽快反馈到数据仓库中;
2. 数据整合及加工高效
使用分布式内存计算等手段,轻松应对海量数据的整合及处理,提升应用层的客户体验,提升决策支持的时效性;
3. 数据实时处理
面对应用系统产生的大量实时数据,使用实时流式数据处理技术,在毫秒级、秒级时间内完成数据计算,实时生成结果,快速响应外部需求变化;
4. 数据减负,保护投资
新一代数仓技术可以很好地降低企业既有老数仓的负载,分离数据,保证不同价值数据的存储及流转,保护企业的原始投资。
为了更好的体验,请使用竖屏浏览