每日经济新闻

    北京市互联网金融协会专家组组长杨茂江:区块链不是高深的技术,而是思想

    每日经济新闻 2017-11-03 20:57

    “区块链不是一个多么高深的技术,它是一个思想,里面涉及到最核心的就是非常简单的密码技术,这些技术是非常简单,也非常基础。但它的思想很重要,是一个分布式的记账系统,非常具有原创性,我非常尊重区块链的思想。”北京市互联网金融协会专家组组长杨茂江在主题演讲中表示。

    11月3日,每日经济新闻主办的"2017中国新金融发展高峰论坛"在北京举行。本次以"新科技,新格局金融科技重构金融新生态"为主题。北京市互联网金融协会专家组组长杨茂江在主题演讲中表示,区块链不是一个多么高深的技术,它是一个思想,里面涉及到最核心的就是非常简单的密码技术,这些技术是非常简单,也非常基础。但它的思想很重要,是一个分布式的记账系统,非常具有原创性,我非常尊重区块链的思想。

    演讲实录:

    金融科技这个行业的发展,包括大数据的发展,实际上有一个特别根本的问题,就是数据从哪儿来?数据怎么在我们实际的工作当中得到应用?比如说现在互金机构从获客到风控等,整个行业都严重处于数据饥渴的状态,数据很难获取,数据的成本也非常高。

    两年前,各地做了很多的尝试,让那些数据有序、合规,并且安全地交互,让它共享起来。我这几年一直从事这方面的工作,有很多的心得,基本上现在的现状是这样的,数据共享非常困难,有价值的数据共享更困难。北京市互联网协会,10月份之前叫北京网贷协会,国内所有跟网络借贷相关的业务,北京市知名的机构都在我们的协会里,我们的协会占据了全国互联网贷款三分之一的市场份额,它是一个非常重要的力量。

    我们就在想,在数据共享没有解决之前,谈行业的整体风险,可能都为时过早,站在这个角度,我们觉得协会有必要建设一套或者建设一种机制,让会员之间的数据,包括特别敏感、特别有用的数据,比如说信贷数据、风险数据等这样的一些数据大家能够共享,这就是我们做这件事情的初衷。做了一年多,不断有一些进展,今天跟大家分享一下我们做的这件事。

    实际上数据共享、数据互通是非常基础的刚需,我这儿来了一个客户,我希望知道他在别的地方信贷表现怎么样,有没有欠钱。除了这种数据之外,还有各种各样的数据,整个行业的发展离不开数据互相的交流,各地也整理了所谓的大数据交易中心。但是结果是非常不理想的,这里面存在几个非常核心的问题,第一个问题就是让我拿数据出来可行性不大,这是行业的一个现状。

    当然,每个人站在自己的角度,这个都是对的。第二个,我把数据拿出来之后,第三方交易平台也好,共享平台也好,会不会把我的数据留一个备份,数据不像有形的资产可以随时留下来的。你拿到这些数据之后会不会滥用,这些东西都是不可控的。第三个,我的数据是好的,我很老实,我把数据拿出来了,结果别人拿的都是脏数据。这是大家面临的问题,而且都是难以克服的问题。

    基于这样一些问题,北京市网站协会的解决方案是盲交换系统,这是一套体系,我今天跟大家分享一下这个东西是怎么做的。因为是非常新的概念,也是非常新的技术和理念,在讲盲交换系统是什么之前,我们先讲它不是什么。

    首先它不是一个共享系统,这里面有一个挺绕的概念,什么是共享?今天我们开一个派对,每人炒一个菜带过来吃,我把东西拿出来。交换是什么呢?东西在我这儿,我给你一份,你给我一份,东西是我的,这是两两之间的关系,共享往往需要有一个中间的平台第三方,通过他共享。我们吃饭到某一家去,通过他共享,菜吃完就没了,数据第三方拿到之后获取了最大的利益。它是一个交换系统,每一个参与这件事情的人互相之间的关系是交换关系,这是第一点。

    第二点,它不是一个征信系统,通过人民银行征信中心,大家可以获得银行体系内的数据的共享,但是数据都给到了人民银行征信中心。它是一个P2P的关系,第三方是拿不到任何数据的,在第三方这里不存留任何数据。可能大家也听到过这种概念,我们家不存数据,但是北京市网站协会推的这个东西是真的不存数据。

    第三个,它不是监管系统,我们在协会内部会员使用的时候,大家知道协会虽然是一个第三方的机构,但是监管机构也经常会有一些任务,会有一些工作委托协会来做。大家会担心数据或者是这样的一个东西是不是为监管服务的,完全不是,跟监管完全没关系,它完全是机构之间数据互通和有效利用数据的平台,完全是站在机构的角度。

    首先讲它不是什么,下面我们讲它是什么。

    首先参与这件事情,不是谁有数据都可以来,有很多地方都做了数据交易系统,只要有数据都来,至于数据质量你自己来评价。我们不是,进来的人,它是对等的。第二个它是自治的,加入进来的机构互相之间非常了解,他知道谁加入了平台,如果不满足要求的机构加入不进来。第三个,所有的源代码是开放的,不存留数据,所有的实现逻辑在代码里都能看到。最后一个,在很多场景,我说区块链不太靠谱,不是说它的技术不好,是说它应用场景落地很难,在国内我没有看到特别靠谱的应用。

    我们这套技术是国内非常少的,规模化应用,区块链应用。我个人认为,区块链不是一个多么高深的技术,它是一个思想,里面涉及到最核心的就是非常简单的密码技术,这些技术是非常简单,也非常基础。但它的思想很重要,是一个分布式的记账系统,非常具有原创性,我非常尊重区块链的思想。我们用了这个思想,这个思想在我们这个事情上面的应用,我们觉得非常成功。

    这是关于盲交换系统BITs系统的简单定义。

    讲得挺炫的,到底怎么弄的?其实非常简单,每一个有效的数据有一个加密的索引,一会儿我会讲解一下,这里面需要一点点技术基础。简单来讲,它只有索引,没有任何有效的信息。我们参与的机构数据都在自己这里,每一个机构告诉别人,我这儿有数据,他可以参与交换,他不需要把数据拿出来,把数据索引拿出来就可以了。BITs系统维护的唯一的信息就是索引,而这个索引是加密的。

    举个例子,B机构看到上面有XX这样的一条索引,他知道这条索引的含义,我要获取这条索引对应的信息,他就会发起一个请求,由BITs维护了谁有这条索引对应的信息,他会把信息分配到对应的人。这个关节有密码运算,B机构对信息进行一次加密,再由BITs把信息返回给B。在整个的环节当中,我的平台是得不到任何信息的,得不到任何数据,基本的流程就是这样。

    大家可以看到,BITs里面维护的加密索引是我这边唯一有数据的地方,我们有必要讲一下我维护的BITs信息。实际上我维护的是下面这一段内容,比如张小明他的身份证号是这样的,我们做一个Hash值,这是非常简单的秘密运算,算法是公开的。我存的是Hash值,得到的这一串是唯一的,这是第一个特性。

    第二个特性,这有什么作用呢?机构要查询这个人的信息的时候,他得到了用户的身份证号和姓名,他能得到相同的字符串,他就知道我这边有这样一个人的信息。你得到了索引值之后,你是不能倒推回去的,这是基本原理。

    所以我们回过头来看上一个PPT,在我的系统里面,只维护了加密索引,这个加密索引不含任何信息。

    这个数据老了一点,这两天北京市网站协会会发布一个新的数据。在我们的BITs系统里面进行交换的数据有这么一些非常有意思的数据,第一个零值客户,有什么用?我一会儿再讲,现在是2680万用户。第二个是投资和有信贷表现的用户,700多万真实的投资和信贷表现的用户。我们还有更多的模块在建设,比如说被拒的,有人在我这儿申请贷款,别的机构说他曾经被拒绝过。

    这里有一个详细的例子,比如我要查询上面对应的索引,大家可以看到返回的结果,像有这样结果的所有的跟数据相关的,无论是大数据公司,大数据征信公司也好,有这样数据表现的,全中国是没有的,最多是一些所谓的设备指纹、用户的行为数据,像用户这样真实的信贷表现以及投资表现数据,在中国可能只有北京市网站协会的这套系统所支撑的会员才有这样深度的数据的交换。

    大家可能也会觉得数据交换了,有什么用呢?这是两个真实的案例,也是我们协会为会员提供的服务。第一个是今年8月份,有机构碰到了谣言,流动性不足,对于金融机构来说,流动性不足的传言是最致命的一个打击。首先是这些用户提了一些诉求,没有得到满足之后,就散布了这样一些谣言。我们把这些用户进行了分析,在我们的系统里面,我们可以比较明确的看出来,这些人实际上是游走在各个机构的羊毛党。

    第二个案例就更加严重一些,2万个用户,有13000多人在我们的BITs里面经过机构之间的用户交互和用户属性的比对,发现13000多人是羊毛党。其中大家可以看到,2万用户里面有176名用户有借贷行为,这些是投资用户,同时他有借贷行为。

    还有一点,值得我们关注的,我们有不少的用户被列入了高法的失信被执行人名单,我们也在考虑,这个现象是怎么出现的?有两点,第一点,说明类金融机构的风控能力,不一定是能力,可能是它的数据确实是非常稀疏,而且是非常贫乏的,非常贫瘠的。人家说有些机构在裸奔,其实从这些数据来看,一点不为过,你会让一些老赖到你的平台来借钱,你把钱放给了他。再简单的风控,这些人也是不能放钱给他们的。

    说明什么呢?我们连这么简单的数据源可能都没有,一些机构连这样的数据源都获取不到。这个数据源真的不是那么容易获取的,高法有这样的查询入口,但是他的身份证号是隐藏了,我们用爬虫去爬,身份证号是隐藏了,你会拒掉一些好人,身份证号四位重复的概率非常大。为了让这些好人通过,很多机构不去查。

    一方面,风控的能力、数据能力非常弱,所以才需要大家更多的数据交互基础。第二点,从这个现象可以看出来,可能这些老赖的信息,这些数据可能被滥用,高法把这些失信被执行数据放到网站上,可能有一些人把身份证号和姓名拉出来,做一些假的身份证,这些方法也是有的,值得进一步的探究。

    我们这个平台是在11月1日正式上线,实际上推了一年多,在北京市网站协会里面,80%以上的会员都已经加入了,加入的会员大概有40家左右。我们也欢迎其他地方的互联网金融机构,我们一起来利用这个平台,提升我们的能力。

    可能大家会有疑问,我在这里提前说,第一,你刚才说了,你的平台不保留任何数据,原因是什么呢?第一,确实密码技术做到了,第二,我们所有的实现都是开源的,你可以让技术人员来分析。

    第二个问题,信息、数据怎么通过平台共享?实际上我们把竞争对手放在一起共享技术,这个事情非常难,目前做到这一步的只有人民银行征信中心,只有央行做到了,民间机构很难很难,我们目前基本上做成了雏形。其中解决了一个非常重要的问题,我的数据是好的,别人的数据怎么能保证它是好的?以及我的数据被我的竞争对手拿走之后,怎么不会被滥用?甚至有一个非常重要的机制,就是刚才讲的,你要得到这个用户的索引,你首先要有这个用户的信息,这是第一步。

    今天我们跟监管机构交流的时候,监管机构也问到这个问题,我得到同事的身份证号姓名,我也能生成这样一条索引,我能获取这个用户的信息吗?第一,我们所有加入的机构都是对等的,作为的网站机构能够加进来,接下来我们会有互联网、保险,加进来的用户是开权限的,它有一个准入门槛。第二,如果是单一的一条一条的,可能对市场的影响不是那么大。最核心的是这样的,这套系统类似于人民银行征信中心,它最后起到的效果和人民银行征信中心一样,但是它的机制完全不同。

    我们以人民银行征信中心为例,大家经常看到某个银行罚款了,在管理这么严格的情况下,不是他的客户,他会去查询,某个机构违规的查询一条,这个事情我不能杜绝,但是这套机制我们可以不断的完善,让这些事情不发生。但是最重要的前提是,你的竞争对手能获取你的信息,完全是因为你的用户已经成为他的用户了,这就由我们我们这套机制来保证。

    这也是很重要的,我参与共享的数据,我参与交换的数据是真实的,别人参与的可能是假数据,这里面有两个机制,第一个机制,我们这套系统是面向个人开放的,面向最终用户开放的。通过四要素来验证,身份证、姓名、银行卡号、手机号,他可以查自己的信用记录、行为记录。面向终端用户开放之后,你的系统很难造假,机构的数据很难造假,这是第一点。

    第二点,因为它是一个相对封闭的环境,比如北京市网站协会会员单位很少,所有的会员加起来只有71家,从事金融业务的大概一半左右,是非常少的,保证了加入到这个平台的机构的纯洁性。动作这几点,目前来说,我们没有发现一起某个机构故意掺一些数据进来。

    最后一个问题经常会问到,你跟大机构说,我们一起来做这个事情,大机构说我的数据这么大,放出来会不会吃亏?小机构也会问,我进来会不会吃亏?这是非常合理的,大的担心吃亏,小的也担心吃亏,我们认为很合理。

    从我们的平台来解决这个问题,越大的机构风险越大,工行一旦发生挤兑风险,一定它的影响比我们农商行造成的影响大得多,大机构应该进来。小机构前期风控各种成本投入很大,如果接入这套系统,让你的风控提升,小机构会获利。我们的BITs都适用于它。

     

    上一篇

    视频丨 eWTP马来西亚物流枢纽首期项目试运行 中国黑科技走出国门

    下一篇

    北京市郊铁路城市副中心线首列CRH6A型城际动车组下线



    分享成功
    每日经济新闻客户端
    一款点开就不想离开的财经APP 免费下载体验