数据分很多种类,交易数据、位置数据、医疗数据、消费数据,哪种数据含金量更高?
第一,所有的数据都有价值,而且你发现了吗?这个分类其实是个挺有意思的事,它就跟乐高积木一样,就是这点材料,怎么组装,看上去是完全不同的形状。数据也是一样,你用不同的方式去分类,去拎出一个结构呢,都会得到完全不同的结果。
比如说你说到的交易数据、位置数据、医疗数据、消费数据,这几个分类其实就不是互相排斥的,对不对?里面是互相包含的。
比如消费数据和交易数据,你怎么区分?还有医疗消费数据就可能会既进入医疗数据,也会进入消费数据。而医院的位置可能算医疗数据,也算地理位置数据。所以,对分类要有一个动态的全面认识。
但是,我们不妨从数据的颗粒度和敏感度来想想什么数据最有用。
首先是颗粒度的数据,举个例子。一个国家的GDP是1万亿美金,和一个国家的人均GDP是1万美金,人口是1亿,哪个数据更好?显然是后者,对吧?后者可以反推前者,但只有前者推不出后者。所以,颗粒度越细的数据越有用。
当然了,数据量大,处理起来非常痛苦。所以,在数据处理和颗粒度之间,我们一定会有个平衡。
社会是个人组成的,所以一般来说我觉得,颗粒度具体到个人就已经挺完美的了。
那除了颗粒度,还有敏感度问题。社会文明的一个标志是对个人隐私的尊重。所以,在数据保护中,个人隐私是需要绝对尊重的,有些底线你是不能触碰的。这就决定了关于个人的很多状态是敏感的。
比如在西方礼仪里边,冒然地去问别人的年龄、身高、体重,都是挺不礼貌的行为。这就是对一种隐私的尊重。
所以,个人信息,包括你的身体状况、财务状况,这些都非常敏感,各国的数据保护也保护得比较严格。
我们再想下去,要更好地观察经济状况,什么数据最有用呢?经济是人的活动,所以,人的活动密度是个非常直接的指标,可以观察出很多经济的细节。人的地理位置是不需要和个人ID挂上钩的,你只要看整体就可以得到很多有趣的结论了。
所以,最近我们团队也在研究,怎么从数据里面挖掘经济活动的细节,这个感受特别深。从目前来看,我感觉地理位置的数据会很有应用前景,是一个含金量很高的数据。
我听过一场关于加密技术的讲座,让我想到,以后加密技术发展到一定规模以后,尤其是可以在本地来进行加密的话,个人数据的使用可能会变得非常地便利和快捷。什么数据含金量最高,这可能也是一个动态演化的过程。
区块链能不能在一些公众希望被公开的行业做一些试点,比如慈善、红十字会。
我给他一个非常肯定的回答,我觉得这是个特别好的方向。但是,不知道区块链行业的会怎么想。
欢迎你把你的前沿知识传播给你身边的朋友,让他们一块儿跟你走进新的数据时代