阿里巴巴:数据技术时代的未来.pdf
阿里巴巴:数据技术时代的未来
数据应用是数据技术时代的价值承载,数据技术时代和已有的信息技术时代
的区别在于是否将数据作为生产资料。信息技术时代解决的是“过程”智慧
的问题,从而提升效率,而数据技术时代解决的是“感知”和“协同”智慧
的问题,使效率大幅提升并能完成业务的创新。归纳了数据应用类产品的分
类,给出了一个通用的数据应用实现架构,同时对大数据的数据共享和交换
的本质和难点做了简要分析。
1引言
前段时间,杰克·马的CEBIT欧洲巡回演唱会非常成功。面对从总理到各大商
业巨头,杰克坚定无比地讲述了一个数据技术时代的梦想,不得不说,杰克
真的是神奇的外星人。杰克说过,他负责吹牛,然后他的团队负责把他吹过
的牛实现,从而打造了一个如此强大的阿里巴巴,让美国人甘心叫BABA的
公司。
这次杰克在欧洲巡回演唱会又吹了一个什么牛呢?这头牛不再是电子商务,
而是DT(datatechnology,数据技术)。DT和IT的区别是什么?为什么
DT就是利他,而IT(informationtechnology,信息技术)就是利己?笔
者一直很困惑,IT不是也让人们的生活更美好了吗?从经济学的角度来讲,
反而是人人利己创造了人类的进步。
2IT与DT
笔者查了好多资料,也跳出互联网圈子接触了传统行业的朋友,似乎有些理
解了。
IT这个词诞生于何时,笔者暂时没有查到,但是它的大规模商业化发端应该
是20世纪70年代,具体是指利用电脑和网络让企业的内外业务与流程更加
高效。换句话说,没有IT系统,业务也能运行,只是“慢、卡、丑、挫”而
已,当然当大家都用上IT系统后,就再也回不去了。
IT的引入让企业拥有了更强大的业务能力,使全球化、大规模、深层次的协
作变成可能,让大象也能跳舞,所以说IBM是通过输出IT能力,让别的大
象跳舞,从而让自己在资本市场也风姿绰约。
企业级IT市场的原有商业模型如图1所示。
图1企业级IT市场的原有商业模型
在旧有模型下,IT解决的是企业自有业务流程的信息化问题,比如OA系统、
CRM系统、ERP系统、绩效管理系统、BOSS等,这些系统依赖的架构就是
应用代码(BS或者CS)+数据库+PC服务器。
互联网企业的出现,成为了一个IT产业的异类,一家家什么都不生产却又市
值奇高的公司,当然是泡沫。只是互联网企业经历一个个大起大落后,越发
青春焕发,甚至都开始秀健硕的肱二头肌,开始讲颠覆了。背后的原因是什
么?互联网企业正因为没有实体生产,经历的过程正好契合了DIKW的知识
金字塔,如图2所示。要知道人类历史的推进就是知识的累积和进化,近100
年人类社会的高速发展,也是知识的超常规累积的结果。
图2DIKW金字塔
第一代的互联网企业完成的是实体到数据(data),把线下的东西数字化后
搬到线上来,比如以Yahoo公司为代表的Portal。
第二代互联网企业完成的是从数据到信息(information),Google公司把
全类目的数据聚合、整理、结构化后索引起来,变成了可供大家快速检索的
信息。
第三代互联网企业完成的是从信息到知识(knowledge),目前还在快速推
进,一种企业是通过人和人的连接,从而利用人机结合来填补信息到知识的
鸿沟,比如Twitter、Facebook;一种企业是通过大数据+机器学习+人工智
能来填补信息到知识的鸿沟,比如Google。然而,这两个方向随着后续的
推进和大数据的介入,正在融合为一。
可以看到这些互联网企业在“吹泡沫”的同时,也构建起了从实体到数据、
从数据到信息、从信息到知识的基础架构和设施,比如非结构化数据的处理、
分布式数据处理、人工智能与机器学习以及在专业领域的方法论(如精准营
销、搜索引擎、社交关系等)。
目前,传统的IT企业帮助传统企业仅仅完成了业务流程到部分数据化、数据
到部分信息化的过程。换句话说,传统IT与自动化解决的是“流程”智慧的
问题,“感知”与“协同”智慧是由人来完成的。比如传统汽车制造,流水
线就是“流程”智慧,大幅提升运行效率,而流水线上的熟练工人依靠他们
的“感知”与“协同”智慧保证了高品质汽车的生产。
传统企业中的CRM、ERP解决的也是过程智慧的问题,大幅提升客户管理和
生产管理的效率,而使用软件的业务人员依靠他们的“感知”与“协同”智
慧(领域经验与知识等),保证了业务的顺畅运行和优化。
互联网企业更是如此,所有的业务天生就是信息化的,处处是IT也就没有IT
了,互联网企业的价值由于轻资产的模式反