收藏本页 打印 放大 缩小
0

微众银行基础架构科技部负责人卢道和:

技术会带来“三升两降”

发布时间:2019-07-02 12:43:55    作者:    来源:中国保险报网

记者 苏洁/整理报道

微众银行成立五年的时间,总结出来我们自身金融科技能力可以概括为“ABCD”,A是人工智能,B是区块链,C是云计算,D是大数据。我们觉得所有金融科技的技术最终会体现在“三升两降”,不管是A还是B、C、D,每一项技术都应该带来成本的下降、风险的下降,它应该可以提升业务的运营效率、提升客户的体验和提升业务做大规模的能力。

在AI领域除了成熟的生物识别、OCR,NLP这些技术在金融场景中的应用,我们的AI团队也提出了联邦学习的方案。主要是解决B2B场景,在保护隐私的前提下,跨机构的数据价值交换的痛点。比如A机构拥有一些数据,B机构也拥有一些数据的时候,如何可以让数据不从A流转B,也不从B流转到A,同时可以把AB集合的价值做出来,就是这样的技术。它和区块链有点像,它运用的大量加密技术,同样包括现在的建模和机器学习的技术,实现隐私、数据完全不交换的情况下,可以把A机构、B机构数据合起来产生的价值体现出来。

微众银行基础架构科技部负责人 卢道和

以下是文字实录(部分):

卢道和:谢谢大家,在这里汇报一下微众银行要做的科技创新,首先是通过一些数字介绍一下我们科技发展的现状,2018年交易峰值是3.2亿笔每天,这些都是来自于C端和B端客户的请求,内部消息总线处理峰值是22万笔每秒,现在微众56%的以上人是科技人员,基础架构我们做了深圳同城多活,我们去年申请的科技专利是234笔。

微众银行成立五年的时间,总结出来我们自身金融科技能力可以概括为“ABCD”,A是人工智能,B是区块链,C是云计算,D是大数据。我们觉得所有金融科技的技术最终会体现在“三升两降”,不管是A还是B、C、D,每一项技术都应该带来成本的下降、风险的下降,它应该可以提升业务的运营效率、提升客户的体验和提升业务做大规模的能力。

AI领域我们最新的进展是推出了联邦学习的开源项目,它主要解决什么问题?昨天我来参会的时候听到很多领导说现在的数据隐私越来越严了,包括GDPR发布之后数据散布在各个机构之间,如果我们没有办法在机构之间做希望数据的相互交互使用,如何做后续的创新、拓展我们的业务?这块儿我们的AI团队提出了联邦学习的方法,但是这个方法不是我们提出来的,这个算法在最近一次谷歌技术大会也提出来了,这主要是解决什么问题?实际上就是在B2B场景中,有两个机构,A拥有一些数据,B也拥有一些数据的时候,如何可以让数据不从A流转B,也不从B流转到A,也没有中间的角色C来同时搜集A和B的数据,最终同时产生把AB集合起来一起建模所带来的效果,这就是这样的技术。它和区块链有点像,它运用的大量加密技术,同样包括现在的建模和机器学习的技术,实现隐私、数据完全不交换的情况下可以把A机构、B机构数据合起来产生的价值体现出来。

某种意义上它是数据价值交换的技术而不是数据交换的技术,这个技术谷歌也在做,他们是把每一个安卓终端上引入联邦学习,这样可以把每一个人在终端里参与了模型的优化和计算,不需要再传到云端,也不需要采集每一个客户的信息就可以完成云端统一算法优化以及安卓端专门针对你的算法优化,通过这种方式可以实现更好的客户体验,就是同时起到最好的客户隐私的保护。我们认为未来有巨大的市场,的确在数据隐私方面未来的法规一定是越来越严格,我们在这件事情上已经有一些成功的案例,而且案例和风险模型相关,和我们合作的机构自身的数据完全不用离开他们自己的环境,我们可以通过联邦学习,为他们的数据进行风险模型的构建,举个更好理解的例子:比如说平安产险正在做的这个事情,如果A机构有一些人脸数据,B机构有车险出险数据,我们计算客户的人脸图像对于车险的风险度模型是怎样的,产生一个联邦学习的算法,最终可以把这个模型服务到客户,服务到我们商业的逻辑当中。

我们也在2019年1月份做了开源,上周在上海的开源大会上,我们把项目捐给了Linux基金会,大家都可以参与里面使用我们的技术,因为不同的模型下有不同的算法,这个模型还是逐步成长的过程。所以我们更希望通过开源,让更多的机构,在更多的场景下,可以丰富联邦学习的算法。最终让每个机构间可以方便的实现数据的价值。

区块链这块儿我们在开源方面持续努力,我们推出的FISCO BCOS区块链底层平台已经支持了几十家机构在线上跑了一百多个生产系统,他们当然在最初也可以选择更有名的IBM的Hyper-ledger,但最终的选择结果证明我们的平台无论在金融级别的企业级软件特性上,还是平台的易用性,成熟度上,都是有明显的优势的。并且这个平台的算法和实现都是我们自主可控的。因为我们本身是金融机构,所以对于区块链的企业级应用,我们做了很多优化,包含它的数据安全,包含它的高可用和一系列企业级的非功能性需求和支持并发的处理能力,做了很多这方面的努力。

我们这块儿推的是联盟链,也叫许可链,这块儿主要的应用解决机构间互相协作的时候如何能够减轻中介的压力,如何通过区块链的技术应用于价值交互的理念,加快机构间的合作。在开源方面也举办了开发者大赛,也积极的运营着我们的开源社区,不断的有越来越多的开发者在加入我们的社区之中。。

云计算领域的进展也给大家汇报一下,目前我们在深圳有五个数据中心,我们五个数据中心都实现了同城多活的架构,我们生产上有大概一万多台物理机器支持银行业务的运行,因为机器很多,所以我们五年的发展过程中,我们只能发展一定阶段必须再申请一个数据中心,从同城的主备我们演化到多中心多活的架构,多活架构带来的好处是非常明显的。第一我们同城不用担心任何一个数据中心会中断;第二没有备份资源,所以资源利用率非常高。因为我们走了完全基于银行分布式的架构,所以我的扩容非常弹性,不需要传统依赖传统的IBM主机进行发展,我们只需要加X86服务器就可以了,通过插X86服务器可以增加自己的扩容,我们最快实现了两天就把核心系统的容量扩大再增加一千万客户。

大家很多都是来自科技部门,稳定的运营对大家来说是生命线。我们从4年前就在核心系统这块儿没有依赖国外成熟的商业软件,全部是基于开源体系构建的全分布式系统,我们自从开源以来四年来没有一次中断过对外系统服务,不管是凌晨还是什么,我们一直保持7X24在线,而X86和主机架构最大的区别就是他会故障,为了这一块,我们做了很多。所以我们今年也打算把我们核心的消息中间件开源,我们正是依赖这个,才实现了我们的多中心多活,实现了我们弹性架构,实现了应对X86必然会故障的问题。我们希望这个开源能够推动金融行业在核心系统硬件依赖的安全可控上再更快一步,更容易一些。

最后是大数据领域我们的进展。我们之前一直讲安全可控集中在核心交易系统是国外的硬件服务器,商业数据库,高端存储,数据仓库我们讲的很少,但是几乎没有一个金融机构没有用商业的数据仓库和集市软件,我们从一开业就基于开源体系构建了所有的数据仓库和集市。第一个要解决的问题就是在Hadoop数据体系下怎么满足监管要求有两地三中心的架构,所有的这些核心影响你交易的数据在同城、异城有备,但是开源生态没有解决方案,所以我们几年前自己做了这样的方案,保证我们的数据都可以保证同城、异城有备,这只是解决存储和运算的问题。

第二就是,我们即使把线上跑的所有数据仓库和数据集市都用到开源的体系,但是有一个软件摆脱不了,如果做风控所有的业务人员最熟悉的软件就是SAS的建模工具,我们正在做的事情就是用我们一套开源的体系加上我们自建的一套IDE,我们会在行内把SAS的工具替代掉,同时可以保证业务人员对于SAS方面的操作习惯,而且提供更多的机器学习和AI相关的建模能力给到风控人员,我们相信这个能力是远远优于SAS这个商业软件的,而这一系列的组件我们今年打算开源出来,在大数据这块儿有四个产品开源出来,第一块儿就是IDE,这套目标是替换目前的SAS软件,而且性能和效率要更高。我们一直努力在数据环境去掉商业化软件,去掉对国外的数据仓库的依赖,这块儿我们做到就应该开源出来给到同行使用我们的工具。Transporter这个组件就是解决大数据也要有两地三中心的能力,不能是大数据就和互联网一样是非常大的集群放在哪里,集群坏了只能等待恢复。现在大数据越来越重要,已经不能简单的分离线数据和在线数据了,越来越多的在线交易是依赖大数据平台的。今年争取把这些东西开源出来给大家一起使用。

我们开源出来我们的最佳实践,一方面是希望对整个行业能够有自己的贡献,另外一方面就是希望和大家一起贡献在项目里,因为不同的场景都会有不同的需求,大家都有开发队伍。既然我们行业有这么多程序员,我们希望在国内也可以建立起更好的开源生态,做出好的国内的开源软件,进一步提升我们行业在全球的金融科技优势。

总体上来讲从我们自己已经成熟的ABCD,还有正在研发的好的能力,希望可以通过构建开源的生态体系,帮助大家、帮助整个行业,同时最终实现我们自己用科技驱动业务发展使命,谢谢。

 


pc版

微众银行基础架构科技部负责人卢道和:

技术会带来“三升两降”

来源:中国保险报网  时间:2019-07-02

记者 苏洁/整理报道

微众银行成立五年的时间,总结出来我们自身金融科技能力可以概括为“ABCD”,A是人工智能,B是区块链,C是云计算,D是大数据。我们觉得所有金融科技的技术最终会体现在“三升两降”,不管是A还是B、C、D,每一项技术都应该带来成本的下降、风险的下降,它应该可以提升业务的运营效率、提升客户的体验和提升业务做大规模的能力。

在AI领域除了成熟的生物识别、OCR,NLP这些技术在金融场景中的应用,我们的AI团队也提出了联邦学习的方案。主要是解决B2B场景,在保护隐私的前提下,跨机构的数据价值交换的痛点。比如A机构拥有一些数据,B机构也拥有一些数据的时候,如何可以让数据不从A流转B,也不从B流转到A,同时可以把AB集合的价值做出来,就是这样的技术。它和区块链有点像,它运用的大量加密技术,同样包括现在的建模和机器学习的技术,实现隐私、数据完全不交换的情况下,可以把A机构、B机构数据合起来产生的价值体现出来。

微众银行基础架构科技部负责人 卢道和

以下是文字实录(部分):

卢道和:谢谢大家,在这里汇报一下微众银行要做的科技创新,首先是通过一些数字介绍一下我们科技发展的现状,2018年交易峰值是3.2亿笔每天,这些都是来自于C端和B端客户的请求,内部消息总线处理峰值是22万笔每秒,现在微众56%的以上人是科技人员,基础架构我们做了深圳同城多活,我们去年申请的科技专利是234笔。

微众银行成立五年的时间,总结出来我们自身金融科技能力可以概括为“ABCD”,A是人工智能,B是区块链,C是云计算,D是大数据。我们觉得所有金融科技的技术最终会体现在“三升两降”,不管是A还是B、C、D,每一项技术都应该带来成本的下降、风险的下降,它应该可以提升业务的运营效率、提升客户的体验和提升业务做大规模的能力。

AI领域我们最新的进展是推出了联邦学习的开源项目,它主要解决什么问题?昨天我来参会的时候听到很多领导说现在的数据隐私越来越严了,包括GDPR发布之后数据散布在各个机构之间,如果我们没有办法在机构之间做希望数据的相互交互使用,如何做后续的创新、拓展我们的业务?这块儿我们的AI团队提出了联邦学习的方法,但是这个方法不是我们提出来的,这个算法在最近一次谷歌技术大会也提出来了,这主要是解决什么问题?实际上就是在B2B场景中,有两个机构,A拥有一些数据,B也拥有一些数据的时候,如何可以让数据不从A流转B,也不从B流转到A,也没有中间的角色C来同时搜集A和B的数据,最终同时产生把AB集合起来一起建模所带来的效果,这就是这样的技术。它和区块链有点像,它运用的大量加密技术,同样包括现在的建模和机器学习的技术,实现隐私、数据完全不交换的情况下可以把A机构、B机构数据合起来产生的价值体现出来。

某种意义上它是数据价值交换的技术而不是数据交换的技术,这个技术谷歌也在做,他们是把每一个安卓终端上引入联邦学习,这样可以把每一个人在终端里参与了模型的优化和计算,不需要再传到云端,也不需要采集每一个客户的信息就可以完成云端统一算法优化以及安卓端专门针对你的算法优化,通过这种方式可以实现更好的客户体验,就是同时起到最好的客户隐私的保护。我们认为未来有巨大的市场,的确在数据隐私方面未来的法规一定是越来越严格,我们在这件事情上已经有一些成功的案例,而且案例和风险模型相关,和我们合作的机构自身的数据完全不用离开他们自己的环境,我们可以通过联邦学习,为他们的数据进行风险模型的构建,举个更好理解的例子:比如说平安产险正在做的这个事情,如果A机构有一些人脸数据,B机构有车险出险数据,我们计算客户的人脸图像对于车险的风险度模型是怎样的,产生一个联邦学习的算法,最终可以把这个模型服务到客户,服务到我们商业的逻辑当中。

我们也在2019年1月份做了开源,上周在上海的开源大会上,我们把项目捐给了Linux基金会,大家都可以参与里面使用我们的技术,因为不同的模型下有不同的算法,这个模型还是逐步成长的过程。所以我们更希望通过开源,让更多的机构,在更多的场景下,可以丰富联邦学习的算法。最终让每个机构间可以方便的实现数据的价值。

区块链这块儿我们在开源方面持续努力,我们推出的FISCO BCOS区块链底层平台已经支持了几十家机构在线上跑了一百多个生产系统,他们当然在最初也可以选择更有名的IBM的Hyper-ledger,但最终的选择结果证明我们的平台无论在金融级别的企业级软件特性上,还是平台的易用性,成熟度上,都是有明显的优势的。并且这个平台的算法和实现都是我们自主可控的。因为我们本身是金融机构,所以对于区块链的企业级应用,我们做了很多优化,包含它的数据安全,包含它的高可用和一系列企业级的非功能性需求和支持并发的处理能力,做了很多这方面的努力。

我们这块儿推的是联盟链,也叫许可链,这块儿主要的应用解决机构间互相协作的时候如何能够减轻中介的压力,如何通过区块链的技术应用于价值交互的理念,加快机构间的合作。在开源方面也举办了开发者大赛,也积极的运营着我们的开源社区,不断的有越来越多的开发者在加入我们的社区之中。。

云计算领域的进展也给大家汇报一下,目前我们在深圳有五个数据中心,我们五个数据中心都实现了同城多活的架构,我们生产上有大概一万多台物理机器支持银行业务的运行,因为机器很多,所以我们五年的发展过程中,我们只能发展一定阶段必须再申请一个数据中心,从同城的主备我们演化到多中心多活的架构,多活架构带来的好处是非常明显的。第一我们同城不用担心任何一个数据中心会中断;第二没有备份资源,所以资源利用率非常高。因为我们走了完全基于银行分布式的架构,所以我的扩容非常弹性,不需要传统依赖传统的IBM主机进行发展,我们只需要加X86服务器就可以了,通过插X86服务器可以增加自己的扩容,我们最快实现了两天就把核心系统的容量扩大再增加一千万客户。

大家很多都是来自科技部门,稳定的运营对大家来说是生命线。我们从4年前就在核心系统这块儿没有依赖国外成熟的商业软件,全部是基于开源体系构建的全分布式系统,我们自从开源以来四年来没有一次中断过对外系统服务,不管是凌晨还是什么,我们一直保持7X24在线,而X86和主机架构最大的区别就是他会故障,为了这一块,我们做了很多。所以我们今年也打算把我们核心的消息中间件开源,我们正是依赖这个,才实现了我们的多中心多活,实现了我们弹性架构,实现了应对X86必然会故障的问题。我们希望这个开源能够推动金融行业在核心系统硬件依赖的安全可控上再更快一步,更容易一些。

最后是大数据领域我们的进展。我们之前一直讲安全可控集中在核心交易系统是国外的硬件服务器,商业数据库,高端存储,数据仓库我们讲的很少,但是几乎没有一个金融机构没有用商业的数据仓库和集市软件,我们从一开业就基于开源体系构建了所有的数据仓库和集市。第一个要解决的问题就是在Hadoop数据体系下怎么满足监管要求有两地三中心的架构,所有的这些核心影响你交易的数据在同城、异城有备,但是开源生态没有解决方案,所以我们几年前自己做了这样的方案,保证我们的数据都可以保证同城、异城有备,这只是解决存储和运算的问题。

第二就是,我们即使把线上跑的所有数据仓库和数据集市都用到开源的体系,但是有一个软件摆脱不了,如果做风控所有的业务人员最熟悉的软件就是SAS的建模工具,我们正在做的事情就是用我们一套开源的体系加上我们自建的一套IDE,我们会在行内把SAS的工具替代掉,同时可以保证业务人员对于SAS方面的操作习惯,而且提供更多的机器学习和AI相关的建模能力给到风控人员,我们相信这个能力是远远优于SAS这个商业软件的,而这一系列的组件我们今年打算开源出来,在大数据这块儿有四个产品开源出来,第一块儿就是IDE,这套目标是替换目前的SAS软件,而且性能和效率要更高。我们一直努力在数据环境去掉商业化软件,去掉对国外的数据仓库的依赖,这块儿我们做到就应该开源出来给到同行使用我们的工具。Transporter这个组件就是解决大数据也要有两地三中心的能力,不能是大数据就和互联网一样是非常大的集群放在哪里,集群坏了只能等待恢复。现在大数据越来越重要,已经不能简单的分离线数据和在线数据了,越来越多的在线交易是依赖大数据平台的。今年争取把这些东西开源出来给大家一起使用。

我们开源出来我们的最佳实践,一方面是希望对整个行业能够有自己的贡献,另外一方面就是希望和大家一起贡献在项目里,因为不同的场景都会有不同的需求,大家都有开发队伍。既然我们行业有这么多程序员,我们希望在国内也可以建立起更好的开源生态,做出好的国内的开源软件,进一步提升我们行业在全球的金融科技优势。

总体上来讲从我们自己已经成熟的ABCD,还有正在研发的好的能力,希望可以通过构建开源的生态体系,帮助大家、帮助整个行业,同时最终实现我们自己用科技驱动业务发展使命,谢谢。

 

未经许可 不得转载 Copyright© 2000-2019
中国保险报 All Rights Reserved