在数据搜集阶段,应对司机基于更完备的信用维度数据,来评估顺风车司机资质准入;数据分析阶段,应在关键指标与业务影响间,建立分析链
近期,滴滴和华住接连发生的两起全国数据危机,说明了行业领军企业在“用好大数据”上还有很长的路要走。
在滴滴顺风车司机杀人事件里,滴滴的困境是:这么多个人信用数据,滴滴却未能用好,以致未能识别高风险的司机。据报道,犯罪嫌疑人钟某案发前曾向51家机构借款,几乎借遍了所有能借款的机构,还发生过多起逾期。如果滴滴在审查顺风车司机资格时能将个人信用数据充分考量,本应将这种频频失信者拒之门外。
在华住原始数据泄露事件里,华住旗下酒店开房记录泄露数据,并被放到“暗网”出售,上亿人的隐私信息被曝光。华住的困境是:存储了海量的用户原始数据“不知道有何用”,且一旦泄露,公司形象受冲击,股价也面临大跌风险。大数据在这时却成了“烫手山芋”。
华住与滴滴,按数据规模标准,都是“亿级大数据公司”。但规模大不等于能用得好。
此类事件屡有发生,仅今年就有视频播放网站AcFun近千万条用户数据泄露,前程无忧195万条用户数据疑似泄露等。这为整个行业敲响警钟。
笔者认为,要用好数据,需要在数据搜集、数据对接、数据分析、数据预警等方面作更系统的安全设置。比如在数据搜集阶段,应对司机基于更完备的信用维度数据,来评估顺风车司机资质准入;数据分析阶段,应在关键指标与业务影响间,建立分析链。
这些日子,我们已经看到一些改变,比如滴滴在数据预警方面做出改进,基于位置偏离信息的异常数据情况进行诊断;根据指标异常,联系后台进行报警;一旦触发主动或自动报警,就能直接连到公安进行报警处理。
技术专家认为,如果能在以上数据处理的几个阶段中,加入区块链的安全多方计算,便能使问题得到更好的解决。比如在数据搜集环节,区块链可以提升信息真实性和数据分享的积极性。
区块链大数据信用分析公司PTS(Points)的创始人张佳辰告诉笔者:“少量关键数据进行链上存储外,大部分原始数据可以在链下存储。只要在区块链中设置校验机制,就可以保证信息的真实性,也就是说,当信息之间校验结果出现差异时,区块链可以根据自动判断并返回结果。同时,区块链校验机制激励正确信息提供者;并处罚提供虚假数据的人。这样就同时保证了分享的积极性与可信度。”
在美国,Uber正在积极与加州大学伯克利分校合作,将非对称隐私技术应用在用户个人数据共享中,从而既能将Uber体系的用户行为数据提炼出公共治理和商业上有用的洞察,又防范用户家庭住址和出行习惯等敏感信息泄露所导致的个人风险。
张佳辰表示,这种区块链安全多方计算适用于所有的共享经济平台,比如滴滴、美团、airbnb,因为这些平台都涉及用户隐私保护,对服务提供方(司机、骑手、房东等)信用及安全的事前评估,以及服务过程中的实时数据分析与预警。
未来,无论是像airbnb这样的O2O企业,还是像Facebook这样的纯线上服务互联网公司,或者是像工商银行这样的传统企业,基于区块链的安全多方数据计算机制下,它们都将受益。
以美团为例,在骑手招募阶段,可以在骑手的手机端对其生活、借贷状态做一个预判和分析,分析后对此人的风险进行评分,并把评分系统贡献在大的风控体系中。以airbnb为例,在房东评估阶段与房产租赁阶段,也可以进行同样的评估;这样的评估无需采集原始数据,所有的计算都可以在手机端、本地化地完成,最大限度保护各方隐私。