飞象网讯 “2017年世界电信和信息社会日大会”于5月17日在北京举办。飞象网作为直播媒体将对会议做全程报道。直播内容:

中国电信云计算分公司副总经理 吴章先
吴章先:尊敬的各位领导、各位来宾大家下午好,非常高兴在今天电信人的节日,跟大家一起来分享一下中国电信我们在大数据领域我们一些想法和我们实践的一些情况。
实际上面中国电信,我们在2014年专门在云公司成立大数据事业部,开始从全集团的角度做全集团各个领域数据的汇聚。对汇聚的数据进行相应的数据的清洗、分析,形成相应的产品能力。
从2015年开始,大家了解的话也会发现我们已经提供了10+1的产品体系,在大数据里。同时我们在去年10个行业,在大数据里做了相应行业的一些解决方案,共同来服务行业进行业务转型升级,进行新的跨界的发展。
在这里面我们发现了,整个大数据这个事情,刚才秘书长讲得非常好,数据生态对整个大数据非常重要,因为在很多情况下,尤其我们碰到很多行业客户,他在做新的业务创新的时候,他会发现除了他自有的数据,特对运营商的数据和其他行业伙伴的数据都有渴望的需求。
所以我们今天实际上来讲,借着这个机会,想跟大家在数据生态和后面依托于数据生态更好的业务发展,给大家做一个分享和介绍。
首先实际上讲是现在业态的变化,刚才秘书长给大家问了几个问题,我觉得非常有问题。从我个人来看我在通讯行业协调干了将近小20年,这个变化确实非常大。在这里面我们看到有两个非常重要发生变化的基础:
第一个:数字化。
第二个:网络化。
原来从传统的我们刚开始建GPRS到现在4G网络的发展,这个用户移动端上网带宽的改变非常快。下面马上有5G网络的到来。
另外本身来讲,由于传统在计算资源和存储资源成本下降大的行业背景下,各种各样的信息服务,尤其是个人和企业,更多习惯于使用我们新的移动设备,企业也慢慢的在企业里更多采用一些信息化的手段。这样我们看到会产生大量的数据,这可能在前两年我们看新浪一天的数据量都非常的巨大。
在大的环境背景下,基本上在应用上以人工智能、大数据、移动互联网、物联网和云计算纷纷在各行各业里都会出现一些非常好实际的案例。
所以智能信息服务的到来,给我们实际上来讲提了一个很大的挑战或者问题。海量的数据分布在不同的企业,比如有运营商是其中一个,BAT是其中一个,还有很多金融企业等等。
怎么能够把这些数据用好,为整个社会创造新的一些业务模式,能够创造效率的提升,这个来讲是我们面临很大的挑战。
所以从我们中国电信这两年的实践,我们协调发现,依托这些数据,我们确实能够在社会治理、垂直行业整合上,有一些新的创新的发展。一些像AI、趋势预测的模型算法,依托这些数据也能做很好的,给企业带来很好的帮助。
但是数据怎么能够更好的发挥价值,这是目前行业界面临非常大的挑战,这是我今天想跟大家一起看的。
第二页想跟大家讲一下转型升级和创新业务生态,这跟我们今天讲得话题稍微有一点关系。因为从我们运营商的角度来看,云网融合,我们在光宽在4G、5G,以及在运营商网络上海量的应用,像天翼高清、翼支付等等,我们通过创造5个生态圈,我们来实现我们整个网络的智能化、业务的生态化和运营的智慧化。在这个里面来讲,也是依托于我们运营商自有的数据和合作伙伴的数据共同实现。
在建数据生态,我们说最重要是整合多元的数据。在这里面,一个是说数据来了以后,你的平台能不能对这个数据进行处理。另外这个数据来了以后,我怎么保证数据的安全?在这个基础上,怎么能够让更多生态圈的合作伙伴一起做创新的应用,一起共同营造这个生态。
所以前面罗老师还有秘书长提到的都是非常关键的,生态不是一家两家的事情,是所有相关企业我们共同发展的事情。
从我们电信本身来讲,目前我们已经在云公司大数据节点上,我们已经汇聚了大概将近30P的数据,沉淀下来30P的数据。每天大概的日接入量大概400T左右,目前已经对我们的合作伙伴,对我们的客户开放了超过500个以上数据分析的API,也提供了超过100个以上的分析挖掘模型。那么上面刚才讲了,我们有4+1的产品体系和十大行业的解决方案。
同时我们生态上,也跟各个行业、各个不同能力的企业在进行合作。那么在基础设施层,我们依托电信的云网融合跟产业链的上下游一起,比如我们在GPU、超算、AI上等等都有一些合作。
另外在数据源上,目前我们除了乐观运营商自有的数据源,我们也跟像金融、地产、交通等等行业的合作伙伴,一起做行业数据的汇聚。中国电信我们也建立了大数据的联盟,也欢迎在座的有志于共同在生态里合作的企业加入,共同把数据源整合,在我们的平台上来实现。
在能力层我们协调有先进的一些技术能力,那么在能力层,我们也有先进的一些技术与服务能力。在5月份的大数据的峰会,目前我们已经在实践一个,通过一个AI技术的嵌入,在我们的能力平台上,我们来实现对现在已经有数据的数据切片,更好的针对上面的数据应用实现机器学习,更好降低整个原来传统的里面,依托专家系统专家建模的模式。
在这个平台上,我们为生态合作伙伴提供是智能信息的开放平台,在这里面,底下我们可以看到,我们的基础能力、云能力、网络通信能力,我们底下的云网中国电信我们专门构建了一个我们叫DCI数据中心互联的网络,使得我们的应用在应用迁移,在数据传输、数据分析上能够更高效的进行底层的分析。
所以我们是提供三项技术能力,四项运营系统能力和两项的运营体系。我们在里面对内和对外也有非常好的实践,对内可能在座都比较熟悉,对外来讲我从中国电信本身我们自己的角度来讲,我们协调在摸索和实践。目前来讲像金融、旅游、房产、政务已经有一些实际的案例和实践,一会在实际案例上再跟大家做一些分享。
从刚才讲的,其实数据、生态这里面来讲从我们现在跟行业里很多企业来看,尤其一些政府的数据来讲,数据很多、数据很乱、数据很杂。这些数据里怎么治理?实际上我们看到,在非专业、非IT里这些企业、数据的拥有方,他们面临很大的问题。
所以我们本身来讲,在这个生态里,中国电信我们也提供,经过这两年我们通过对电信体系类的治理,我们形成了相应的数据治理能力,跟我们的合作伙伴一起对数据进行相应的分析、清洗和融合。
我们在这里面数据汇聚和融合的平台,我们对欺诈应用场景有超过71个模型,我们已经建好一个大数据指数,在跟向国家旅游局、交通部做一些相关的指数系列。
另外我们在底层,我们有两大底层数据融合两个基础模型。一个是我们位置融合模型,大家都知道,在运营商数据里,很关键是用户的位置,用户在打电话的时候会有,发短信的时候会有,位置更新的时候会有,在做上网的时候会有。
这些数据怎么通过融合能够把一个群体性的模型和对外、对行业的解读出来,这是我们两个基础模型里一直做的。另外我们修改三大数据处理对象,涵盖超过21个模型,对外进行这个输出。
另外在平台,今天我可能不再花太多的时间给大家做详细的介绍,实际上这应该是我们运营商,包括跟我们的合作伙伴像中信这样的,基本上这样的能力平台大家可能都比较熟悉。从底层上来讲,我们实现的就是跨平台,资源弹性,对外提供安全保障和运营商级的运维服务。
在上面,实际上在大数据分析方面,我们目前在past,也提供了大数据的基础的,我们叫做大数据云。在上面我们的合作伙伴可以对合作完的数据,在开放的数据,包括我们中国电信开放的书记来进行建模,进行分析。最终形成相应的服务能力,对外进行开放,这是我们在平台上面,对生态圈提供的一个能力。
另外在安全上面,这个可能也是比较关注的,我们提供的是电信级的安全,从网络安全,组织安全,应用安全和数据安全,四大方向,通过五分一统。实际上我们对数据进行分类,分级,分权,分型和分布,把数据如何开放,哪些数据能开放,开放以后怎么进行审计形成了一个统一的服务标准。这样的话,我们在底层才能让我们生态圈的合作伙伴,数据的应用方能够有效的对数据安全进行自由的掌控。
也就是说我开放什么数据,哪些数据我拿出来跟其它的数据拥有方进行分析,进行融合,这些来讲,安全的这套措施,在我们的能力平台上进行保障。实际上我们在技术上也实现了一个,我们叫阅后集成,这个可能不是特别准确。但是实际上来说,我们在双方或者多方进行数据融合的时候,我们在平台上面具备临时分配一个弹性的分析资源。双方分析完了以后,分析结果可以由数据的输出方允许输出,在授权的情况下。一旦数据输出之后,原始分析的数据,我们在临时空间里面就焚毁掉,也就是说这个书记不存在对外泄漏的风险。解决了目前在大数据这个领域里面,确确实实大家一直在喊,怎么样进行数据共享,怎么样把数据开放出来。这是个非常关键的技术的保障。
刚才讲了第一步部分建数据生态,中国电信提供了一些基本的能力和我们的一些开放的态度。下面第二部分给大家分享一下,我们在行业里面的一些应用的案例。
行业一体化的解决方案,首先一个是是刚才讲的数据治理我们提供了咨询,提供了规划,提供了基础能力平台的保障。
在行业的其它方面,我们分别有相应的一些实践。
首先是金融风控的应用实践,这个其实来讲,可能大家一直以来,如果不了解的话可能会有一个疑惑,在风控领域里面,其实强关联的数据还是应当自己拥有数据,但是现在大部分银行,在做创新的金融业务的时候,他的客户不完全是自有的客户。
也就是说我发放一个新的贷款业务的时候,可能来的这个客户并没有在我这儿有存款,我没有这个用户的真实数据怎么办,除了央行的一些数据,央行征信的数据之外,尤其是在三四线城市,很多人可能没有存折。
这个时候怎么办?实际上运营商的数据在里面会起到非常关键的作用,帮助他们在风控里面尽量小的缩减风险的发生。
这个是我们目前已经发布的大数据的创新风控平台,利用我们运营商的数据,我们对用户的消费记录,他的行为特征,他的通讯圈的行为,我们做了风险评估的打分。
这个打分实际上也是代表了这个用户他的贷款的能力。通过用户的信用模型训练,包括我们用到了通话详单,过往的DPI的数据,还有我们合作方的,像学力信息的数据,合作方的银行刷卡的数据等等。我们整个的推动递归的模型训练,我们把以依托于我们数据怎么去评分,这套体系把它建立起来。
在我们实际的案例里面,我们讲实际帮顺丰在做金融的贷款,作为一个输出的时候,我们发现整个客户业务的风险识别率,用了我们的模型以后提高了15%,风险审批的效率提升了20%,逾期率降低了10%,我们业提供了,在整个风控查询的电信级的保障,数字规模也是超过千万级的。
第二个给大家分享的是在政府大数据应用的实践,实际上现在从国务院大数据刚要发布以后,很多政府都想我的大数据在做什么。从运营商的数据,我们现在实际上发现,其实我们的位置数据,尤其是在政府领域里,很多的环节都是非常有用的。
举个例子,我们说我们对空间,人口变化的评估,在去年我们在京津冀规划的领域里面,跟北京市教委,我们还有住建部的一些单位,我们进行了非常紧密的合作,实际上通过我们运营商群体位置变化,我们可以准确的对人口流动的情况,对人口的特征,包括他的消费潜力做一个很好的评估。这样帮助我们相应政府的规划部门,在做政府规划的时候更有的放矢,这个规划更能够得到数据的支撑。
包括还有一些区域的经济评估,我们说城市的竞争力跟城市的景气指数,怎么去判断,这个人口为什么是这样?大家都知道去深圳的人很多,是不是深圳是未来真真正正更有吸引力的城市呢?实际上我们去年有一个数据分析的结果,我可以给大家分析一下,我们发现大学生毕业,深圳并不是首选,并不是。其实这一点来讲,从某种程度来讲也是给深圳提个醒,如果新毕业的这群大学生他的流动方向都不是往你这个城市去转,实际上在未来这个城市的发展潜力还是受限的,这是我们在政府上应用的一些实践情况。
第三个是在旅游大数据平台,实际上这个东西可能大家比较好理解,我们通过对游客住宿的分析,游客旅行流入流出的分析,还有他的出行方式的分析等等,帮助我们的旅委,我们景区的管理部门,对游客的身份,游客从哪儿来到哪儿去,去哪儿玩儿,怎么玩儿,住哪儿。帮助政府有效的评估对当地GDP,对当地经济的拉动起了非常好的作用。
这个平台实际上讲,去年汪洋副总理也去国家旅游局研究中心看了,电信跟国家旅游局一起做的旅游大数据平台。
把用户分析,用户的消费潜力等等各方面都在这个平台里面做了一些实践。
另外一个是在交通领域,在交通领域里面,大家如果了解的话会知道,交通的调查,就是出行的规划,以前都是靠咨询报告,靠人去数,数车数人,这个方式来做的。现在实际上来讲,通过运营商位置数据,我们能够把用户的OD,刚才讲了我们两大基础数据模型,能够快速的对用户的出行数据进行规划,提高了他整个规划的效率。这个应用不仅是在交通规划上面,包括在路网监测,包括在人流分析等等,都在交通领域里面使用。
另外一个是医疗大数据,实际上来讲的话,医疗大数据我们目前通过几件事情,在跟卫计委相关的部门在合作。
一个是刚才讲的,我们怎么做数据的咨询和规划。因为医疗口的数据非常多,有医院的数据,社区的数据,有卫计委的数据,这些数据怎么组织,怎么清洗,怎么放平台,这个是我们一直在跟卫计委合作的。
另外,在这个领域里面,我们目前也在转化,比方我们跟各地医院做到的医疗影像云,通过我们刚才说的两大基础的模型,我们对它的两票制,医疗资源的评估,这些也都在做一些大数据的应用和实践。这个领域的发展,我们看到还是非常广阔的,但是同时确确实实我们呼吁一下,数据还是不后面,这个数据生态还是需要相关的各方一起把这个数据在生态里面做融合。这样才能更好的把数据的价值更好的发挥出来。
另外我们在地产大数据也有一些实践,一个是在选址上面,这个可能是大家比较好理解。地段是最重要的,什么地段最好,肯定是人最多的地段是最好的。这个地段来讲的话,我们不仅帮助大的,像银行这样的企业,还有餐饮的企业,包括像一些烟草公司,我们都在准确的帮他做数据的分析和规划,帮他们对商圈进行准确的判断,帮他对用户的价值做准确的分析。通过地产行业的五要素去构建相应的数据模型和数据挖掘的能力。目前已经在地产领域,在广告策略支持,潜客,还有在商圈等等各个,已经形成了相应的能力平台和输出。
除了咨询报告的方式,我们节提供Saas服务这种方式,跟多家的地产商和地产的咨询合作伙伴一起来给最终的客户提供服务。
最后还有一点,就是我们对内对外的,我们讲这个大数据,整个这个生态圈里面很重要的一个是智慧化运营的实践。
通过我们说的在技术层对数据的融合,数据的分析,通过平体的能力,通过建模,我们实际上实现了我们整个生产和经营的闭环,这个闭环体现在,我举个例子,实际上在今年刚过年的时候,我们整个这个闭环分析就会发现,某两个客户突然业务量下降了,没有恢复。
实际上从我们整个平台的能力,各个方面来看,是看不到任何问题的。通过这个分析我们再去做深层次挖掘的时候我们发现,这里面发现跟我们运营中的某一个小配置有一点点关联,通过运营的人员的及时发现,实际上对我们的经济,对我们的收入也是挽回了相当大的损失。
所以我们想在生态的平衡上面,我们也会把这个运营的能力进一步的嵌入,我们通过在运营层提供精准营销的服务,精准的管理和精一的网运,真正的实现运营的智慧化。
在生态圈里面,我们希望与中国电信,依托我们云网的能力,依托我们运营商以前传统的团队和我们对自有数据,对安全的能力以及对开放的运营的支撑,我们给生态圈参与的各方打造一个,能够让大家更容易,性价比更高,更好的能够帮助大家把大数据运营的价值,能够在生态圈里面一起做出来。
这个是我们在智慧化运营实践,刚才讲了在中国电信,我们的自有营业厅一个实践的情况。
实际上通过我们的分析,后端能够有效的反馈它的营销的一些情况。
最后还是感谢大家,有这个机会跟大家一起在这里。最后也希望在座的,不管也是企业还是政府机关,还是我们其它的做大数据的相关的各方,我们一起携手,一起共建数据生态,更好的把智能到来这个时代里面,能把数据的价值,能把新的跨界运营的,我们说的商机能够找到,谢谢大家。