据伙伴产业研究院(PAISI)研究统计,截至 2020 年,全球数据总量将达到 30ZB。


数据“大爆炸”,也催生出大数据产业的蓬勃发展。预计2020年,我国大数据市场规模将超过8000亿元,预计未来中国将成为全球数据中心。


然而目前国内大数据服务市场提供的服务较单一,例如为企业提供外部数据作为决策参考依据。


提供此类数据服务的公司,通过采集多方数据加工成数据服务进行售卖,但在全球加紧对大数据使用监管的背景下,数据的获取方式和来源的合法性存在隐忧。同时,从业者往往忽视了企业自有数据的重要性,如不加以分析和利用,是对数据资产的浪费。


正是看到了这一痛点,2015年初时任阿里云数据创新工作室负责人的甘云锋决定从企业自有数据资产化入手,切入大数据服务领域,并在2016年创办了数澜科技。


发展至今,公司已经和万科地产、方太集团、雪松控股、白果园、中信云网、时尚集团、温州检察院一呼百应等达成项目合作。


万亿级大数据产业,企业自有数据分析是痛点


寻找中国创客:是什么让你下定决心在2016年开始创业?当时大数据产业的发展状况如何?


甘云锋:2016年,国家十三五规划纲要出台,提出将在2020年把大数据产业做到一万亿产值。加之云计算基础设施建设日趋成熟,带来了海量数据计算能力及存储能力的提升,为后续大数据应用提供了土壤。可以看出未来几年,整个大数据产业都会有很高的增长空间。


数据的基础设施解决之后,数据怎么用的边界问题也有了政策规范。随着近来几年大数据应用公司和云存储公司越来越多,云和大数据的应用越发普及,国家相关机构开始有意识地针对大数据应用、大数据服务公司立法。


在这样的背景之下,数据可不可用、可被用于什么样的应用场景,都将在立法后变得更加有法可依、有理可据。这对于大数据产业来说是一个好消息。


日渐增长的市场需求成为我出走创业的最大动力。越来越多的公司有意识地积累和沉淀数据资源,想通过大数据服务来提升业务效率,例如物流效率、供应链效率、上下游生产的效率甚至管理的效率等,只是现在还并不知道怎样去应用。


寻找中国创客:到目前为止,瞄准企业自有数据资产化的公司也不多,你当时看中了哪些痛点?


甘云锋:企业数据分为四类:第一类为经营类数据,像CRM、ERP等;第二类为社会类数据,例如企业运营、活动中产生的数据;第三类为日志类数据,比如用户的浏览足迹;第四类为企业外围数据,像是行业第三方数据等。


一般而言,主流大数据公司多采用购买和收集第三方数据公司的数据,然后进行计算、排列组合等得到一定的分析结果。我认为数据绝不是单点分析,打通后的全局数据才更有价值。以数澜科技为例,我们帮助企业分析的数据来自于企业本身提供的运营数据、管理数据和少部分外部数据。这些数据相结合,才能真正为业务服务。


企业在阿里云和华为云等云存储设施的数据在高速增长,不仅有关于“人”的数据,因为物联网的发展,还有大量关于“物”的信息。但目前企业并不知道如何将这些数据加以利用,也不会成立自己的大数据分析团队,因为后者成本很高,这就是数澜科技的机会。


与“行业主流分析应用”不同,数澜科技基于自主研发的大数据平台数栖,对接企业业务、管理、互联网平台应用等多种来源的数据,甚至包括公司内部文件中的非结构化信息,为企业用户提供自有数据收集、整合、挖掘的工具。


服务B端用户,为企业提供数据分析工具


寻找中国创客:具体来讲,数澜科技提供的产品是什么?


甘云锋:数澜是一家2B的大数据服务供应商,提供的大数据应用基础设施数栖应用套件(DW.DaaS),其定位是为企业数据中台建设提供基础的平台能力支撑,可以快速适配企业的多云(或多态)环境,对接原有的底层大数据,避免企业数据基础设施的重复建设。


产品主要模块覆盖各行业的企业数据能力建设的整个过程,包括数据交换、建模开发、数据治理、数据服务以及可视化分析展现。


举例来讲,数澜为著名房地产公司万科提供了专门分析房屋报修、投诉信息的数栖应用套件,通过这个分析工具,万科能够看到用户对于供应链上各供应商的满意度。


根据用户的体量不同,产品会进行调整,主要是数据存储路径不同。大型客户偏好进行私有化的部署,将云布局在其局域网内,这样做的客单价虽然偏高,但企业对整个工具享有绝对化掌控权。


而中小型企业,出于成本考虑,他们倾向于在数澜科技将云端布好系统后,使用公共云,用账号登录。无论是私有云还是公共云,数据安全性都较高。


寻找中国创客:目前公司估值多少?融资状况如何?


甘云锋:公司已完成A轮融资,目前估值约20亿。


数澜科技在2016年6月获得IDG资本、湖畔山南资本的1248万元天使轮融资,并在2016年12月底获得洪泰基金领投,顺融资本、元禾资本等跟投的4500万元Pre-A 轮融资。今年6月,公司完成1.45亿元A轮融资,由云锋基金领投,IDG资本、浙商产融及洪泰基金跟投。


标签化数据后整合分析,激活企业数据资源


寻找中国创客:数澜科技的核心优势在哪? 


甘云锋:首先我们提供先进的数据服务理念:挖掘企业自有数据。目前少有企业从事类似业务,我们已经和万科地产、方太集团、中信云网、时尚集团、温州检察院等政府机关、企业达成项目合作,在业内的认可度上具备先发优势。


其次,公司目前有40多个自有知识产权和专利,在数据处理、挖掘等技术上领先。例如,我们开发的数栖应用套件,能快速适配企业的多云(或多态)环境,包括腾讯云、阿里云、华为云等。


最后,数澜可以在不改变企业原有知识结构的条件下,对接原有的底层大数据。也就是说,不管用何种开发语言搭建的底层结构,都不需要企业重复建设数据的基础框架,就能使用数澜的产品,这两点能够大幅提升用户体验。


寻找中国创客:数澜科技未来的目标客户是哪些?对它们来说,激活企业数据的价值何在?


甘云锋:未来3-5年里,我们的目标客户一直是传统行业的公司。因为他们在行业内积累比较久,业务系统完善,积累了海量数据;同时,这些企业明白自己的业务短板,也尝试突破,因此更好合作。


以与万科物业的合作为例,来看企业激活自有数据的重要性:以前,工作人员只能知道客户反映的问题,比如马桶漏水、水管堵塞等,但物业无法了解哪些问题最终影响了住户满意度,甚至后期的采购。


这时,数据就可以发挥关键作用。于是,我们把数据相应的结构变成标签体系,比如工单标签、业主标签、商品标签。通过我们提供的数据服务可以将满意度、产品、施工等因素分析得更加透彻,从而选出更好的供应商。


目前现有的数据平台多是从单个需求出发,导致企业大数据的建设形成一个个孤岛,无法全局性支撑业务发展。所以,我们帮助企业进行数据的整合和连接,同时进行分析,提供营销、透视画像等体系。


记者 张姝欣 编辑 苏琦 校对 李铭