新京报贝壳财经讯(记者 罗亦丹)对于大数据时代存在的数据孤岛问题,腾讯给出了自己在技术上的解答。418日,腾讯发布自研第四代数智融合计算平台腾讯大数据-天工。腾讯数据平台部总经理蒋杰在回答包括新京报贝壳财经在内的记者提问时表示, 需要通过隐私计算打破人为的顾虑,让数据孤岛现象慢慢消除。

 

据了解,大数据时代,由于竞争以及法律法规和政策等原因,数据孤岛现象明显。在中科院院士梅宏看来,不同系统,不同组织之间的数据共享开放程度普遍较低,海量的数据相互组合,难以进一步融合、碰撞、释放潜能。

 

为打破数据孤岛实现数据协同,数据安全是重中之重。蒋杰称,此次发布的第四代数智融合计算平台采用自研隐私计算技术,从机器学习到大数据分析为各个场景提供全方位保护,去中心化的架构则能避免单点隐私泄露风险。该平台将以安全的方式打通数据孤岛,桥接多方数据,以统一的数据处理引擎更高效地挖掘数据价值,以智能化的方式驱动整个数据处理闭环。

 

对于数据孤岛的成因有人为因素造成的孤岛,例如业务竞争等,大公司内部也有数据孤岛现象;有技术因素造成的孤岛,存储介质不一样,原数据定义不一样,非结构化数据(例如视频数据)的聚合分类很难等都是孤岛现象存在的原因;有跨行业之间产生的孤岛,比如我们和电信合作,两家公司有不同的账号体系和法务体系,推进数据合并和应用有难度。蒋杰表示。

 

在他看来,想要打通数据孤岛,更多需要定义本身的原数据以及原子级数据架构的统一,本身的数据分析加上数据统计和接入,还有AI挖掘的接口尽量标准化,这才是解决大数据孤岛技术的核心,人为的核心是另外一个方面,需要通过隐私计算打破人为的顾虑,才能让孤岛现象彻底消除,这是我们现在一起去努力的方向。

 

对此,腾讯数据平台部副总经理刘煜宏补充道,不同的平台都有自己的体系,如果没有隐私计算,不同平台上的数据就不可能融合,但未来有了隐私计算之后,就有了做到协同的可能性。

 

新京报贝壳财经记者了解到,隐私计算是一种由两个或多个参与方联合计算的技术和系统,参与方在不泄露各自数据的前提下,通过协作对他们的数据进行联合机器学习和联合分析。在隐私计算框架下,参与方的数据明文不出本地,在保护数据安全的同时实现多源数据跨域合作,可以破解数据保护与融合应用难题。常见的实现隐私计算的技术路径包括联邦学习、安全多方计算、可信计算等。

 

需要强调的是,隐私计算是解决特定领域的特定的问题,不是包罗万象能解决所有的问题,人为的问题根本解决不了。我认为技术不是一蹴而就的,技术是靠一件一件磨出来的,特别是大数据里面核心的技术。不是今天推出隐私计算,就什么都能解决,我希望能一步一步把我们该做的事情做好。蒋杰表示,我们的平台和技术来源于开源,我们接下来也会回馈开源,这也是我们隐私计算的目的。


新京报贝壳财经记者 罗亦丹 编辑 王进雨 校对 刘军