联通沈可:未来大数据将朝人工智能方向发展

12月16日,以“Free Style”为主题的第四届蓝鲸TMT记者年会在北京隆重召开,上海联通副总经理沈可出席了本次年会,并针对大数据发表主题演讲。

12月16日,以“Free Style”为主题的第四届蓝鲸TMT记者年会在北京隆重召开,这是国内一年一度最大的财经媒体盛宴,有超过500家媒体、自媒体齐聚现场参与互动和直播刷屏。上海联通副总经理沈可出席了本次年会,并针对大数据发表主题演讲。

沈可表示,从2001年有人提出“大数据”这个概念起,大数据这个词已有十余年历史。通过短短几年的发展壮大,现在大数据已成为人们生活中必不可少的科技。TMT板块中有很多高科技的东西,其中有很大一部分就是关于大数据。

对于大数据的应用,沈可指出,大数据最开始是通过统计分析进行精准的推荐,这个是比较低的层次。另外还可以通过关联分析找到大数据的连接价值,最高层次的大数据应用是通过时空分析预测未来的情况。

“我们现在按照这三层路径从一般性的精准服务到关联分析再到预测未来。事实上现在大数据在市场上的实际应用基本上都是沿着这条道路在前进。”沈可称,目前,大数据在广告界、教育界、金融界有广泛地运用,此外,大数据在政务、安全、民生、产业、生态等方面也发挥着重要的作用。

谈及大数据的发展趋势,沈可认为,未来大数据发展的趋势一定是朝着人工智能这个方向发展,做好大数据是为人工智能的发展打下坚实基础。

附沈可演讲实录:

各位来宾大家下午好,在我演讲之前,必须先透露一个我跟毛老师不得不说的故事。在一周前毛老师第一次打电话的时候,说我们要开一个大会,邀请你过来一起参加。一开始我问他,要我去干吗呢?毛老师说你可以发表一次演讲,然后我问他你要我讲什么,毛老师说出了两个最让我痛恨的词就是随便。然后我当场就挂了手机不理毛老师,但是毛老师在过后的一周时间里面,翻看了我过去所有微博和微信的记录,他又给我打来电话,说我还是邀请你来参加蓝鲸的年会,我说这次让我讲什么呢?他说讲大数据,他讲到我的心坎里面,说明对我有了了解。但当时我还是特别犹豫,我说因为我是在上海工作,到北京去挺麻烦的,毛老师又说了三个字“好玩的!”,于是我就来了。

所以说在这个过程当中,在我们每个人的身后,你不知不觉中,有很多的数据和信息已经留在这个世界上,你的个性、习惯、偏好已经留在这个时空当中,这是大数据的威力。所以在这个场合里,我和大家分享一下我自己最喜欢的一个领域,就是关于大数据的。

这里面我们有几个案例,第一个大数据能够做什么?现在最流行的一个词:“大数据可能比你自己还要了解自己”,所以在亚马逊上面讲,现在人生活当中有35%的销售是与系统推荐有关的。我们每个人上新浪微博也好、上淘宝也好,都会看到一个栏目叫做“猜你喜欢”,其实这是系统根据你之前的行为做出一种预测。但如果光是预测这样简单的事情,不能叫做大数据很大的威力,它还能做更有意义的事情。

我们再来看一下巨大的“阴谋论”。有人说:你只要给我68个你在facebook上的痕迹,我就能把这个人的肤色、性向、政治倾向、智力水平、宗教偏好等一切信息都预测出来。大数据可以做的事情显然超出了人们的想象。

什么是大数据?大数据可以干什么?大数据的发展趋势是什么样?

大数据这个词已经有很多年的历史了,从2001年开始就有人提出大数据这个概念,到现在2017年底大概已经过了十几年,大家觉得这个技术发展十几年能到这个程度,是不是觉得太漫长?其实不是,像我们现在所使用的CDMA这个技术在上个世纪四十年代的时候就已经被人提出,直到21世纪才被广泛应用,所以大数据发展已经很快了。通过短短几年的发展壮大,现在已经成为我们生活中必不可少的科技。现在国家又在积极推动实施国家大数据战略,层次很高。刚才讲了TMT这个板块里面有很多高科技的东西,其中有很大一部分就是关于大数据。

我们讲大数据现在是无所不知的大数据,对于我们在座任何人来讲,也许了解你比较困难,但对于大数据分析来讲我们只要知道四个维度就可以了,分类、分群、分域、分时。数据可以记录或者知道对象是谁,喜欢什么,在哪里和如何安排自己的时间。通过四分的方法可以把一个人在虚拟世界和现实世界中忽略的部分还原出来,我们叫做打标签、建模型,还原一个真实的自己。

关于大数据还是有很多误区,因为大数据讲了很多,很多人讲什么是大数据,它能做什么?大数据有一个核心基础,这个核心基础就像开场的主任类似于快板一样的,叫做简单的模型加上海量的数据比精巧的模型加上少量的数据更有效。我希望主任下一次一定把这句话念顺溜了。大数据有这样的特点,并不是指的多,而是指的全面,不需要抽样,它不追求因果关系而是追求关联关系。目前大数据主要强调高效率,另外大数据的数据本身的价值要超过数据分析的价值。

在这个基础上我们来看一下:大数据实际在很多科学家眼里是一种技术,但对于企业或者从事大数据工作的人来讲,更愿意把大数据定义成资产,就是我们现在讲的信息资产。通过某种技术手段可以让呆板的数据发挥出很大的作用,产生数据的效果。我们来看一下几个简单应用,大数据最开始就是通过统计分析进行精准的推荐,这个是比较低的层次。另外还可以通过关联分析找到大数据的连接价值,最高层次的大数据应用是通过时空分析预测未来的情况。我们现在按照这三层路径从一般性的精准服务到相互关联再到预测未来。事实上现在大数据在市场上的应用大都是沿着这条道路在前进。

我们可以看到现在有几个重要的应用,一个是在广告界,主要是精准推荐。第二个是在教育界,我们叫因人施教。还有就是健康领域和交通物流领域。此外,我们还可以看到大数据在政务、安全、民生、产业、生态方面发挥更大的作用,包括交通控制、防通信诈骗和环境治理。

这里我分享一个小小的案例,在座的各位可能最痛恨的就是打骚扰电话,接到不明短信。通过机器学习我们可以还原一个骚扰或者诈骗电话的模型,通过机器学习会发现骚扰的人喜欢给陌生人打大量电话,每次通话时间非常短,但呼入频率非常低。机器按照这种方式进行学习,制定了一个模型。当我们第一次运行的时候,有一批人不幸地中枪,但并不是实施骚扰或者诈骗的人,这部分人是快餐送递人员。为此,必须加以人工干预,人和机器产生交互,提高准确性。这也说明数据并非万能,还需要人的介入。

最后,大数据发展的趋势一定是朝着人工智能这个方向发展,大数据一定会成为人工智能的基础。我们可以看到大数据还面临很多挑战,包括隐私的问题、信息高度集中的问题,产生的垄断以及信息权利分配的问题。这些问题的出现正说明大数据越来越渗透到我们生活的每个方方面面,我们不断地在实践中加以探索来解决这个问题。

最后做一个简短的回顾,就是我们讲的大数据的概念,讲了它应用的方法,讲了它所面临的困难,不管怎么样,大数据时代已经到来,如果要用数据就使用大数据,如果要有数据的梦想,就把这个数据梦想做得大一点,谢谢。