阿里首席战略官曾鸣:活数据、热数据才是大数据_最新动态_新闻资讯_程序员俱乐部

中国优秀的程序员网站程序员频道CXYCLUB技术地图
热搜:
更多>>
 
您所在的位置: 程序员俱乐部 > 新闻资讯 > 最新动态 > 阿里首席战略官曾鸣:活数据、热数据才是大数据

阿里首席战略官曾鸣:活数据、热数据才是大数据

 2014/11/24 18:34:53    程序员俱乐部  我要评论(0)
  • 摘要:导语“如果没有计算能力,我们谈不上大数据的时代,谈不上海量数据的高效应用”。“传统家电的互联网化,最终还是会输给互联网平台上全新产生的智能家居产品。”“我不同意机器人统治社会的那种理论的。机器代替不了的部分,是人类创造力要用力深挖的地方。”备注:本文是阿里巴巴首席战略官曾鸣先生在中欧商业园课堂上的讲座,感谢本刊特约作者胡侃侃整理。曾鸣一、互联网的“鱼骨头”三个词来说明白什么是互联网:互联网,大数据
  • 标签:数据

  导语

  “如果没有计算能力,我们谈不上大数据的时代,谈不上海量数据的高效应用”。“传统家电的互联网化,最终还是会输给互联网平台上全新产生的智能家居产品。”“我不同意机器人统治社会的那种理论的。机器代替不了的部分,是人类创造力要用力深挖的地方。”

  备注:本文是阿里巴巴首席战略官曾鸣先生在中欧商业园课堂上的讲座,感谢本刊特约作者胡侃侃整理。

曾鸣

曾鸣

  一、互联网的“鱼骨头”

  三个词来说明白什么是互联网:互联网,大数据,云计算。这中间,互联网的英文其实是两个词:web, internet。如果你把 internet 放在第四个“关键字”,那么,自上而下——互联网就包括了四层:

  • 大数据
  • 云计算
  • web
  • internet

  Internet——

  最底层:是 internet,传统的华为,思科,就是提供互联网的硬件基础。Internet 也经过了 1.0,2.0,3.0。1.0 是 PC 的互联网,2.0 是移动的互联网(起步于 iphone)。3.0 阶段就是物联网的概念——通过传感器,把越来越多的东西智能化。Internet 层面的这些努力,是为了让任何的人,任何的东西都可以被连接以及随时在线。所以,互联网,第一步是“连接”,第二步是“在线”,第三步是“互动”。

  Web——

  倒数第二层:web 的维度。也有 1.0、2.0、3.0 的概念。淘宝最早的形态、新浪等门户都是 web 1.0;web 2.0 的核心是搜索,3.0 的核心是社交 SNS——这些也就是互联网的三个基本形态。

  这些形态也决定了一个企业未来基本运作的方法。不管你是做一个传媒,还是做一个新型的电商,还是一个家电制造企业——你都要联网,要“在线”,然后是与你的用户有互动。只有做到这些核心的内容,才能说你与互联网发展是同步的。

  云计算——

  自下往上,第二层就到了云计算。它包括几个核心的概念。它本质上就是 IT 服务的在线化。最早的云计算,就是你有一个帐号,就能登陆 amazon 或者阿里,完成所有的服务。这是对传统软件产业的颠覆。

  云计算的价值包括三个方面:

  1)移动+云计算=实现了 IT 服务的“在线化”,让技术的门槛大幅降低了,成本大幅降低。

  2)云计算是一个公共服务,它是可变成本,而不再是固定资产投入,它是“按需使用”。创业公司的资本压力由此大幅下降。也因此产生 whatsapp 这样的创业传奇,几十口人,产品吸引了上亿的用户,它的产品就是架构在 amazon 的云平台之上。

  3)云计算对于未来数据时代的价值:从“电”的发明以来,推动工业生产的“二次革命”。原来企业要用电,你要自己购买发电设备,买煤来自己发电。但后来,美国建立超级电站和国家电网,这样一种公共事业的方式,提供了全国用电的 70%,这是美国工业化的基础。福特最早就是通用电器的电器工程师,他想到了电对于制造业的普遍意义。福特的第一条T型流水线,开启了现代制造业,是从电的国网化开始的。而云计算,也是真正要解决一个“大计算”的问题,而且是足够的低成本、商业化的模式来解决大计算的问题。以前大家只会想到超级计算机,它的运营成本高,而反应速度还是很慢,当这些大的互联网应用真正发展时,比如淘宝,数亿商家提出的购买需要,实时信息匹配的背后,就是大数据的计算。所以,云计算,就是分布式的方法,解决了海量数据大计算的一种解决方案。如果没有计算能力,我们谈不上大数据的时代,谈不上海量数据的高效应用。

  综上三点,当你没有用一个云计算的方式,你根本就没有达到真正的互联网运营,你也没法实现真正的高效运营。21 世纪医药是中国政府指定的数据服务商,甲骨文是它的数据服务提供商,但后来甲骨文已经解决不了 21 的巨大数据量。

  云计算的特征:分布式,去中心化。用尽可能多的通用服务器联网在一起,来提供一个足够好的运算服务。通用服务器的成本非常低,还有一个优势就是容错率。任何一台服务器都有宕机的概率,但机群可以对这个宕机进行控制,工程师不需要时时刻刻忙着去解决硬件故障,而只用定期去更换损坏的服务器就好了。

  传统产业转型,最简单的标准,就是你有多少业务已经放在网上,你有多少运营已经架构在云上,让你的数据,成为一个热数据,而不是你把数据存在某个地方,用的时候你再去现找冷数据。

  大数据——

  互联网的最高一层,是大数据。现在我们讲的不是数据的“大”,而是“活”数据:数据是否被活用,是大数据能否产生价值的标准。

  而这个“活”,大数据的第一个特点是“在线”——活数据肯定是在线的。现在很少有数据是可能实时被使用的。阿里有一个“奔月”计划,就是把所有的数据都搬到云上,实现“实时处理”。

  第二个要理解的点,我们今天的数据,跟以前不一样的地方,未来的商业数据是自然被记录下来的,而不再是一种收集的概念。这是一个根本的思路差别。

  传统的市场调查,是一个数据收集的过程,而且是样本数据,因为你不可能收集所有的数据。而互联网时代的数据,是全本的自然记录。比如淘宝,有所有用户任何时间在淘宝上浏览和购物的记录,这是用户行为在淘宝自然沉淀的数据。任何商业都很关心成本,因为随着云计算的发展,存储和运算的成本会越来越低。只有用这种接近零成本的方式存储下的数据,才能够创造价值——这是一个沙里淘金的过程,沙要足够多,最后淘出的金也相对会更多。

  大数据第三个特点:数据和业务是一个有机的闭环,它会是一个正反馈的作用。以搜索为例,我们有一个全网数据库,最主要的考核目标是“实时性”,搜索依据,就是要做出一个全网实时数据的 index,同时要做出一个 ranking:对所有网页内容,根据搜索要求,进行一个排序匹配。Google 最有名的研发成果就是 page rank。但这个相关性是由什么决定——它是由用户每次的点击(CTR)来决定——这个是 google 每次计算的活数据的来源,google 没有数据收集的过程,任何一个数据的点击,就成为下一个搜索实时的信息,这就是一个活数据的概念。你搜一个关键字,原则上,一个小时前后,得到的结果是不一样的,因为一个小时之后,数据动态更新,已经形成了一个新的结果。这是一个实时的在线系统,一个完整的业务闭环:对于传统企业来说——你的业务在多大程度是由你的数据流决定了你的用户体验。

  云+端,获得更好的用户体验,从云的层面说,最重要的大数据处理能力,是大数据本身的质量,数据与用户的互动——这些都会影响用户的体验;而端的层面,比如微信,是点对点的体验,不需要背后云的支持。

  数据量的大少,并不是关键,关键是怎么要实现“活”数据。我以出版业为例,出版社这个业务,我想要的就是一个活数据的闭环。又如家电企业,他们有哪些业务是在线的?电商版块是在线的,在线存货和其他的存货,未必都是一盘货。

  阿里不是一个纯互联网公司,我们是用互联网技术,提升商业的效率。很多互联网公司,是一个互联网技术,做出一个互联网产品。而阿里关心的,是怎么样用互联网产品,去解决传统商业的问题。这个解决的过程,必须用到这三个互联网产品形态来支撑它的业务体系——internet 硬件,云计算社会化的计算公用服务,大数据作为这个平台流动的最重要的资产,web1.0-3.0 作为核心的产品形态——云+端

  ===问答环节===

  提问:所有的环节都是可以实现“数据在线”吗?比如大量的非结构数据?

  回答:我认为未来都可以实现“数据在线”。这是一个解构和重构的过程。

  提问:未来互联网产品的特征是去中心化吗?

  回答:淘宝目前还是中心化流量的平台。我们在促进用户和商家的联系还远远不够。三年前,我们就说过我们想把淘宝做没了,因为我们想让淘宝无处不在。三年来,大数据,云计算以及移动化发展,我们都想努力实现卖家和买家去中心化的交流。换句话说,这是淘宝从 web.2.0 向 3.0 过渡。08 年-13 年,我们完成了最好的购物垂直搜索(这也是商业价值最大的搜索)。但 12 年开始,淘宝讲小而美和开放平台,已经希望在构筑用 SNS 的生态来建立大的商业生态系统。

  微信的这个大生态,本身是一个社交需求。到目前为止,所有的人,都没有做到用 SNS 的一个产品理念来支撑出商业的最大化:让买家和卖家的网,可以更加丰富——这其实是商业生态的“毛细血管”部分。这是一个非常难的方向,也是一个巨大的商业机会。我也相信,会有越来越多的创业者,会试图用这个方式来寻找商业机会。

  淘宝做的就是 web2.0 时代的商业引擎。就算 3.0 时代,我们这样 2.0 的一个中心化的平台,还是有它的商业价值。后浪推前浪,前浪并不一定会死在沙滩上。它可能会成为新时代一个小的元素。

  提问:怎么看互联网每个“结点”的价值?

  回答:互联网不断扩张和渗透,这张网会越来越密,会有越来越多的点,而未来可能每个点的价值也会越来越大。你最需要关心的,其实是你这个点,在网上还有没有存在的价值。如果你不能够成一个点,你就会消失了,你与这个网无关了。你要关心的第二点,就是你这个点,在网上是不是有足够的枢纽,所以你要让你这个点,可以对外越来越多地连出去,让你成为一个重要的局部、重要的网络——web 4.0 有可能是一个部落的生活方式,或者是一个局部网络的生活方式。你不必关心整个太阳系发生了什么,你只要关心你局部的范围。

  告别了大工业时代,进入互联网时代,又回到了一个人的时代,人跟人的协同和合作,变得更加重要。

  从人这个维度,我有几个观点:一是数据的活性,很重要。第二个是算法很重要。算法是武器,就像以前工业时代人们会看你的流水线的处理能力是不是很高。算法的核心是一个可以实现闭环的可重复使用的产品;第三个,就是人的创造力,它是把数据和算法结合在一起的最重要的成功元素。因为,成本再怎么便宜,大数据都是要收敛的,人类给它预设一个什么样的规则,也就决定了大数据演化的方向。

  工业时代,要求人的标准化,而未来新的工业文明中,对人的创造性,要求是更高的。商学院本身是 30 年代才开始的,它的目的,就是用流水线的方式,批量生产标准化的管理人才。当这个需要不存在的时候,商学院也就不存在了。投行和咨询公司,也同样面对这样的大势。

  =======

  二、关于互联网思维:

  周鸿祎的那本书(《周鸿祎自述:我的互联网方法论》),从“术”的角度,讲得不错。互联网思维,第一个是“用户第一”的理念。

  我觉得互联网思维有如下三个特点:

  首先,以前这只是个口号,是个哲学思想,但现在,用户第一对于互联网企业却是“生死线”——因为在互联网时代,你第一次知道了:谁是你的用户,他长成什么样,他的习惯,他住在哪里。然后,由于有了“互动”和“在线”,你第一时间就能得到用户的反馈:他在你的产品停留了多久,他对什么感兴趣,同时用户有了话语权和主导权,而且互联网上,转移成本是非常低的,就是一个 click away,所以用户体验是互联网时代生存的基本线。

  第二个,大家讲的比较多的,是“免费模式+增值服务”——这是一个信息的经济学所决定的。信息和物质不一样,信息的使用过程中不具备排他性,同时,信息的使用过程,本身就是信息的增值过程。所以互联网强调你的“参与”。互联网信息产生的边界成本几乎为零——信息抵达海量用户的成本,几乎为零。信息的定价,很难判断。这是一个悖论。买方无法事先判断这个信息的价值。综上几点,以信息为基础的服务,都倾向于免费。用免费来激励参与,利用参与来找到额外价值,再从额外价值中找到商业模式,然后完成一个商业模式的闭环。

  第三个,“迭代”。第一时间把一个产品的原型放在网上,充分利用正反馈的效应,来完成产品的试错迭代。这是互联网产品最经典的打法。这是一个演进的思路。

  小结:

  如果用五个关键词来总结我们今天讨论的问题:

  第一个是“在线”,要考虑有多少关键环节可以实现“在线”。很多传统企业面对互联网大潮时,你只建一个官网,这是你的传播环节;你开了一个天猫店,这只是你的渠道上线了,但你的供应链呢?事实上,这些互联网化的过程,与做一个真正的互联网产品之间,是有本质区别的。

  第二个关键词:互动。你是不是做到了双向互动,而不是单向的 broadcasting。

  第三个关键词:体验。互联网时代,最好的体验,是通过社区来实现,而社区也是通过体验来形成。你有没有能力,来形成一个相对比较大的部落和社区,这个社区对你提供体验又是非常关键的环节。

  第四个关键词,联网。你要考虑你这个社区与更广域的互联网的联网的程度:你的结点的广度和深度。

  最后,就是要考虑你在线的程度——它的实时性。

  =================

  三、传统企业转型的问题:

  首先是媒体转型的案例:从产品角度去做报道。不能只享受自我认可的报道方式。一种新思路,合伙人制——读者和作者的互动,员工与员工的互动。

  第一次对媒体的认知,是 07 年我到雅虎中国做总裁。当时就有一种产业人士的回馈,说内容挣不到钱。当时雅虎还有全网搜索,其实有一块就是联盟的业务:小网站通过雅虎的流量广告获得分成。当年我发给联盟网站的分成是一个多亿。这与那些高大上的内容平台抱怨内容挣不到钱的情况,形成一种反差:这边是纯草根的网站平台,每年获得三五十万的广告分成。可以看到,其实当时一大部分内容创作者——那些中国的小网站,就已经存在了,他们已经就把内容的收入给分掉了。

  曾经,我给了我同事一个问题:我们能不能在互联网上做出中国好声音。后来我们给虾米提这个需求,他们报了一个方案,提出音乐人的收入,我们的 CEO 问这是一天的收入吗?回答居然是一年。但与此同时,谁挣到钱了呢?YY。

  其实,媒体作为一个产业,也在面临一个根本性的变化。这中间的差别,在于互联网化和互联网平台之间的差别。

  很多企业都在努力作互联网化,但这个不解决问题,在他们做互联网化的同时,有很多草根网站在做基于互联网平台的纯互联网业务开发和针对全产业链创新。所以我常讲 C2B 模式——它是一个协同共创的过程——是靠大家一起往里面填东西,这就是社区。一个共建共享的过程,你分不清谁是创造者,谁是享用者。所以,找到一种怎么样的协同方法,来共同创造,来最后形成一种网状的协同机制——这可能就是未来任何一个产品的供应链模式。

  所谓的传媒也分了好几类:1)偏公共服务的;2)信息类电商——大综商品贸易的行情信息;财经类的咨询和深度分析。3)现在,还有很大的一团,转型出路是不太清楚的,其中一类是偏生活类的资讯,另外一类是跟传统企业的营销相匹配的内容。这两大块内容,也是多数传统媒体赖以生存的主要内容来源。

  阿里深入传媒业的思路,以动漫为例,我们做云计算的时候,当时因为有一个大学的动漫研究教授,坚持用云计算来推动漫产业。在这个行业,服务器的数量,决定了你用多大的投资在多短的时间内完成多高质量的产品——动漫渲染(rending)的过程。我们就参加进这个事,让很多小公司不用再担心渲染的部分,而专注于创意环节。这就可以帮助小公司降低创业的门槛。

  媒体社区共创的案例:一个网上做普洱茶的。纯做内容的自媒体,商业上是否成功,我还没找到一个成功的案例。但这个普洱茶切入的自媒体,很快演化成一个社区,同时给他们提供普洱茶,然后再演化为线下沙龙。这是一个立体的垂直的社区——包括了文化的创造,产品的售卖,服务的体现——不断深化社区。

  未来没有独立的媒体,媒体都会依附于一个商业社区。这是一个精准实时的过程:人已经在这里了,我怎么把内容和传播做好。未来,媒体从业者依然是有一个懂传播的人,但用的方式,不再是过去的模拟模式。每一个点,都可能会演化为一个哺乳动物——打了很多标签的复杂动物体的存在。这个可能是未来大部分媒体的方向。

  这个方向跟我们观察到的,电子商务,以及整个经济的演变,是同构性的——基本的思路是一致的。

  传统媒体的一个误区,是把互联网当成分销渠道,而互联网对媒体的价值,其实是低成本创造内容。另外,近年来大部分媒体没法解决用户的“在线”和“互动”。目前媒体的互动功能,对于支撑媒体,还是做不到。如果没有盒子,电视连谁是你的用户你都不知道。盒子第一次让你可以感到你的用户是“在线”的,在此基础上,才会有互联网化的应用。

  传统家电行业,我也纠结了好几年。我以前也困惑,互联网这么牛,为什么救不了家电产业。

  2008 年,淘宝在家电领域做了 1000 亿,国美苏宁百联的收入都在我们之前,也在 1000 亿多一点的水平。但这五六年下来,你可以看到这两个平台的差剧在拉开。家电行业再细分,是有两个生态:1)家电企业,2)家电卖场,国美苏宁以及升级的京东这样的网上卖场。

  过去几年,他们走的是非常互联网化的过程,但他们仍是工业时代最成熟的产业,工业化逻辑是深入骨髓的,过去几年,他们并没有开始在互联网平台,创造一种新的体验的过程——这个过程,其实是由智能家电开始的。

  新的灵感来自于智能家居产品。比如,最近上市的一个做摄像机的公司 GOPRO。它生产专业的数码摄像机——但不同的是,这一次,它第一天就是一个在线互动产品。在一个传统领域里面,第一天开始,从互联网服务切入,它上传摄像机拍摄内容最容易,它的社区也是最活跃的(youtube 里最活跃的频道)。GOPRO 的 CEO 说,视频分享看似是一个体验最差的领域,但它是用软硬件结合的方式,真正做到一个互联网体验的产品:一个非常简单的 APP+ 照像机,七天的视频内容免费,再长的存储就收费——内容云存储。先把体验搬到网上,再做到社区的环节。

  总之我认为,传统家电的互联网化,最终还是会输给互联网平台上全新产生的智能家居产品。

  在线广告体系,也是这样的例子——广告变成一个可变成本,它的转化价值是可以评估的。

  Marketing 这件事,包括1)品牌 branding,2)sales marketing(销售导向的,这部分的 ROI 是非常清楚的,甚至是可以剔除流量水份的。)

  那么,现在要讨论的是,如何能够实现 branding 和 sales markting 的双重效率。一条路是 SNS;另外一条路,也是阿里正在研讨的一种方式,就是尝试用大数据的方式,来找到美誉度的 ROI:从几百个用户行为的指标,来推出品牌滞后的一个受影响程度。这是我们在研究的一个方向,如果实现了,这可能会为高端传媒寻找一种出路。

  小结:

  互联网对传统产业的五个冲击:对广告模式、零售渠道、物流行业、柔性化生产、以及对整个供应链的再造。

  ============

  四、关于 C2B 模式:

  C2B——用户提出需要,调度整个供应链各个环节的快速应对。

  电商第一个阶段,淘宝在最前端,形成了商家跟用户非常好的互动。第二个阶段,就是要实现怎么样给用户提供产品设计的建议。

  传统服装企业,新品发布的提前运作周期,要三个月。但淘品牌,两三年前就能做到一周上新。淘品牌的做法:小批量生产、快速上新——收集用户的认可度——决定哪个新品可以进行更大批量的生产。

  为传统企业配套的供应链周转都特别长,此外传统的生产线都是大批量和小品种——开工一次,基本的订量必须有保证的。所以这一批创新的淘品牌,最大的困难是没有大厂家为他们服务,他们只能找手工作坊,数量和质量都是问题。所以淘宝在过去三年,真正努力的,是上游的厂家跟淘宝品牌商之间的合作。现在已经出现了一批可以提供柔性生产服务的制造企业:小成本,多批次,小批量的生产。帮助卖家实现“多款少量”——100 款,每单 50 件。接下来,根据用户反馈,确定最受欢迎的产品,再进入大批量的生产——这时候的需要,是快速补单,比如 1 单补 5 万件。你补单的速度要足够快,才能抓住市场。

  形成足够的正循环之后,未来,越来越多的供应链合作伙伴被拉进来,这个过程,其实是 C2B 的压力会一步步地往上游传递,最终没准会上升到棉花种植。

  这不再是一个厂家说了算,也不再是一个厂家通过控制供应链来压缩成本、提升效率,而是更强调和依靠上下游快速协同。

  提问:用户有时候不知道自己想要什么。C2B 怎么做?用户反馈真的可以有效指导产品的走向吗?

  回答:首先,社区的种子用户非常重要。以小米为例,发烧友是意见领袖,他们的意见先反馈至产品,然后用这款产品再去影响更多的用户。C2B 的模式,也可以采用到所有的数字娱乐和传媒产品——用户体验先行,反馈需求,然后形成立体的社区。

  其次,为什么这个时代大家也非常讲“设计师”,这其实是指——非常讲究对社会的洞察力,我把它叫做“体感”。一个成功的产品,往往有一个有洞察力的设计师。与此同时,这个公司的 CEO 有可能是首席产品体验官(或者回到社区,CEO 必须是这个部落的精神领袖)。这两方面的 DNA 都要好,要匹配好。洞察力在这个时代,也变成了非常稀缺的商品:在最佳的时间打中最大的那个需求点。

  阿里的数据,还有很长的路要走。我觉得大数据未来会沉淀成为平台的一部分,但人的创造力同样也很重要,所以我不同意机器人统治社会的那种理论的。机器代替不了的部分,是人类创造力要用力深挖的地方,我们不要只停留在一种“知识积累”的阶段。

  平台的机会都会很大,社区和社区的交换(协同),变得很重要的,能够把足够多的点链接起来,谁就是一个平台级的服务商。平台跟多元物种是一个共生关系。平台连接多元物种——后者活得越好,平台也更有魅力。

  移动互联网,大家好像都很困惑,好像都没出什么新的东西,但我个人感觉,可能下一步,就是无时无刻基于云计算和大数据的平台,用协同的方式来工作。过去的二十年,只是延用以前的工业时代的惯性在提升。这里面,到底哪一点可以激发出更大的经济效益,这里需要有很多基因的碰撞。

  最大的变革来临的时候,你可能就是拼了命往前跑,最后还是被人替代掉了。

发表评论
用户名: 匿名