腾讯云王龙：在产业互联网中，AI仍处于不成熟阶段-蓝鲸财经

图片1.png

蓝鲸TMT频道12月15日讯，在首届“腾讯云+社区开发者大会”上，腾讯云副总裁王龙先生在接受媒体群访时表示，在互联网上半场，人工智能的算法相对比较成熟，在产业互联网很多应用场景中，人工智能仍处于非常不成熟的阶段，有极大的提高空间。

王龙解释称：“产业互联网对图像识别的使用还处在非常不成熟的阶段，比如说优图实验室已经开发出来的算法模型能够识别一个图片中将近2000种不同的物体，但是还不够，产业互联网的要求可能要远远超出这个数字。”

人工智能在2017年是十大流行语之一，不仅受科技圈关注，也是受资本追捧的对象。作为人工智能龙头股，科大讯飞股价曾一度飙升成为A股中名副其实的“妖股”，人工智能在2017年成了“风口上的猪”。但到了2018年，多种因素的影响使得资本对AI的热情逐渐回落。

王龙在群访中表示，在过去三年里，人工智能获取了大量资金的涌入，包括投资、创业公司，不计成本的在开发模型、获取客户。如今感知到“冬天”的来临并不是一件坏事，对技术或产品来说有真正的商业价值才能“永葆青春”。

“未来，数据中台会逐步成为整个AI非常重要的数据来源。”王龙称，人工智能已经进入深水区，将数据糅合以进行更加深度的结合来训练模型是当前的一个挑战。比如，直播当中有很多非法信息的鉴定。现在利用NLP、利用机器学习去识别内容有没有比较露骨的言辞，或者是传销；用图像识别来判断是否有黄色、暴力血腥的非法信息等也比较多，如果数据和AI两者结合，识别的准确率会更高，这也是腾讯正在做的一件事。

在推动AI能力应用方面，腾讯云既是内部技术能力的出口，也是外部合作的连接器。借助云智天枢平台在标准化接口、模块化设计以及“云边端”一体化方面的持续深入，打通算法、设备、数据与应用的连接，推动AI应用生态的发展，帮助各行各业拥抱产业互联网时代。

“小程序爆发符合产业发展趋势”

提问：小程序是腾讯云在企业服务上的一个爆款吗？

王龙：小程序本身有很多游戏，它不是企业服务的一个助手。小程序本身确实也会提供大量的企业服务，我理解的张小龙的理念是希望在微信的平台上大家用了就走，小程序的目的也是希望有一个轻量级的，让线下的用户和线上的企业、线上的服务能够去进行沟通的这么一个连接器，他希望提供这样的连接器，这也符合腾讯“连接一切”的使命。

大家可能已经深刻的感知到了，比如说你们去店里，要放到以前，我在你这里吃个饭，还要下载一个应用，很多人不会下载，如果是一个小程序就会。比如说去一个超市购物，你肯定不会下载一个APP，如果不下载，用户体验升不上去，商家的经营效率也提升不了。通过小程序，我们可以有这样一个办法连接线上和线下。

所以你看到这样一个设计理念，再结合我们前面说的互联网下半场，叫产业互联网，你就会可以看到小程序的爆发其实是一个符合历史趋势，或符合技术发展趋势、符合产业发展趋势的一个东西，它的定位和传统企业的数字化转型，和传统企业的互联网化是密切相关的，我觉得这其实是更加重要的一个原因。

“5G带来了机遇和挑战”

提问：5G给腾讯云带来了哪些机遇？腾讯云在面临5G来临之时，做了哪些准备？

王龙：5G的几个特性：高带宽，低延时，这其实不是给腾讯云带来的机遇，是给在座的各位、给我们所有的行业合作伙伴、给所有的开发者带来的机遇。我在今天的主旨演讲当中也说了应用在哪里、开发者在哪里，云就在哪里，所以我们希望和合作伙伴、开发者一起迎接这样的挑战，或者发动这样的机遇。

这里面其实有大量跟云非常深度结合的一些技术。比如说因为5G传输的带宽提高，所以它需要有很强的数据处理能力和分层能力，因为所有5G数据如果全部传到云端的话，大家也在媒体上看到过，基本上到云这边一定会到瓶颈，或者说你的数据都过去，你会发现你的数据过多，真正在里面提取有效信息会变的非常困难。我刚才也说人工智能服务平台，它的目标是实现云边端一体化人工智能应用服务的整个体系，它能够在端和边缘就能对数据进行预处理，把一些更好更有效的数据传到云端，然后云端也能够把更有效更好的算法和模型再反哺给边缘和端，然后云边端一起配合起来对数据进行处理，这是一个非常大的挑战，同时也是非常大的机遇，因为只有这样，我们才能充分享受5G带来的价值，不管是用户体验也好，还是商业价值也好，这是非常重要的。

还有另外一种挑战，我们都知道5G带宽这么大，延时那么低，它一定会带来另外一个挑战，大家可能会担心自己的手机电池，大家也会担心很多传感器的寿命，因为带宽大，耗电量肯定会上去。怎么办呢？如何让低功耗的物联网和广域的物联网5G做一个配合，针对不同的设备，不管是什么设备，是天天连着电源的设备，还是连着电池的设备，它都能找到机会和边缘、和云端进行数据的配合，进行各种模型算法的配合，从而更好的去发觉5G和物联网的价值。这也是我们目前正在努力奋斗的一个方向。

“超级大脑更像是一个工具”

提问：超级大脑这件事，腾讯云自己在这方面战略上是怎么想的？有什么样的优势？

王龙：我们叫超级大脑，当然友商也有不同的叫法，它的一个比较大的区别或者我们的优势。首先超级大脑这个理念和其他的厂商有一些差异。我们自己的超级大脑平台本身是一个工具，这个工具的设计理念就和之前有一点不一样，也取决于我们提出的比较晚。之前的超级大脑更多是说所有的数据都在云端、所有的决策都在云端，像大脑一样在云端去思考、去做一些决策，我们的超级大脑提出的相对比较晚，而且我们又赶上了物联网，包括5G，包括深度学习的一个浪潮。所以我们的超级大脑在诞生的时候就考虑到了这种趋势，就是云边端一体化，同时在云边端都要做图像和语音感知和交互的能力，所以我们的超级大脑这个平台的工具定位是叫连接云边端的智能操作系统，这是第一个，就是它已经考虑了未来5-10年的技术趋势和应用发展的趋势。

第二个很大的区别是贯彻我们董事会主席CEO马化腾先生说的，我们希望做各行各业数字转型助手，提供我们的工具，希望我们的平台做的越薄越好，把更多的空间留给合作伙伴，就是把半条命交到合作伙伴，甚至交到开发者手里，让他们与我们一起服务企业用户。所以超级大脑的设计理念也体现了这一点，我们提供了连接云边端的能力，我们提供了算法、设备配合以及调度的能力。但是再往上，比如说数据层、应用层或者说逻辑层，我们希望合作伙伴跟我们一起来打造。简单来说，这个超级大脑的决策中枢是由我们的合作伙伴和客户跟我们一起共建的，而不是我们在云端直接拿一堆数据告诉别人怎么做，这是我们整个设计的第二个不太一样的地方。

“在隐私方面，数据使用是一把‘双刃剑’。”

提问：云+社区毕竟是一个开放的平台，关于安全和隐私方面都做了哪些努力？

王龙：其实这个我今天在演讲当中也说了，我们腾讯云作为腾讯技术能力的出口，我们背后其实不仅是腾讯云的各种能力，也是整个腾讯公司在过去20年的技术积累，我们的技术安全实验室有大量的数据、模型，后面也有大量的专家，他们会分析各种不同的云或者各种不同号码的异常型位，然后从中做出一些风险预警，做出一些打击。这其实是腾讯一直希望做的，就是把自己的技术能力提供出来帮助到社会。

隐私方面，其实我们都知道数据的使用是一把“双刃剑”。使用得好，它能够给我们社会带来很多的价值，给每个人带来很多的便利；如果使用不好，可能会造成一些比较严重的问题。在隐私方面，我们也看到腾讯非常重视。我们的董事会主席马化腾先生以及我们的总裁已经多次表达了我们在数据中台这个理念上的一些看法。我们认为用户隐私是第一位的，而不只是商业利益。我们都知道，其实数据中台打通的话，比如说对做广告营销都会大量的便利，但即使在有这种商业利益诱惑的情况下，我们依然决定在这块采用用户利益、用户隐私优先的策略，这也表明了腾讯公司在对待数据使用上的态度。

“在中国，图像识别技术更加广泛”

提问：腾讯云在AI方面的服务目前有哪些？

王龙：我觉得是这样，就是说中国的AI市场发展的阶段或者是整个市场的特性和美国并不完全一样。所以在友商，比如说做了很多动作。举个最简单的例子，比如说在美国人工智能技术应用最广的还是语音、IOT、智能客服等方面的技术，他们的图像识别、技术识别才刚刚起步，在中国其实我们看到图像识别技术更加广，因为中国的人口规模大，简单来说就是中国的快递、中国的外卖为什么能比美国强？就是在规模到了一定程度之后，他做应用的时候会有不同的优先级。其实腾讯云，因为我们还是我们国内的客户，国内的开发者还是我们的第一优先级，我们可能在做AI应用服务的时候，也会围绕这些方面去做一些重点投入。比如说我们的AI包括几个部分，纵向包括AI算法模型输出，这种算法模型输出可以有腾讯的算法模型，也有我今天谈到的Ai.qq.com（音），还有很多合作伙伴的算法输出。我们同时都有比较大的投入，比如说图像识别相关的，说用图像识别来做实人实名，我们现在银行的很多APP都可以使用图像识别来做各种各样的业务，这在中国应用非常广，我们在这块也花了大力气来协助银行在风险可控的情况下，大大提升用户的体验，大大降低他们柜台的压力。还有包括我们国内非常看重的，比如说内容的审核，比如说我们都知道不管是直播也好，还是游戏也好，有大量复杂的要求，就是希望能够听到一个健康的，不管是网上的视频、直播、内容，还是游戏的环境，这些也可以通过人工智能来辅助，能够大大的节省人力，能够提高效率，这块我们也重点投入了很多。

还有第三块，我们都知道中国现在在做数字化转型，数字化转型很重要的是如何把线下的信息搬到线上去，我们可以看见在OCR识别，传统证照识别这一块，其实有大量的需求，我们也帮助金融机构、帮助我们的保险金融，帮助我们的政府把传统的文本性的数据，纸张上的数据能变成电子化的数据存储起来。在语音和NLP上，我们都知道，包括智能客户、包括对话机器人，包括语音助手，我们也在做大力的投入，我们已经明显的看到这些应用场景不断的扩张。

反过来说，我们在某些方面也做了很多投入，可能不像前面说的那么多，比如类似说深度学习、机器学习的框架，我们也有一些自己的发展。比如说我们的开源框架，我们内部的机器学习平台，包括TI One等等这些平台，这块我们也有一些输出，但是这块更重要的是针对数据科学家做模型训练和推断使用的，我们这个用户群比前面说的要少很多，以及我们AI的人才还没有到那一步。在每一层的服务上，其实我们针对不同的用户群都在不停地优化体验，去提升我们的应用度和可用性，降低我们的成本，让我们的开发者能够以更低的成本、更快的速度来享受AI各层的服务，这是腾讯AI的一个布局。

“人工智能在产业互联网还有极大提升空间”

提问：腾讯云AI所具备的差异化特征有哪些？

王龙：其实我可能要稍微纠正一下，或者说我有些不同的看法。就是说我们在传统的互联网，比如说刚才说的金融的实人实名，比如说我们乘高铁、乘飞机去验证身份的这种场景，图像识别、包括印刷体、手写体的识别其实都已经相对比较成熟，这块腾讯是有很强的差异性的。因为过去20年，比如说我们的微信人工智能实验室和优图人工智能实验室成立了七八年，在过去七八年的过程中，我们都说人工智能4个要素，要有好的数据、好的框架和计算资源，要有好的算法，最后要有落地场景。

先说落地场景。我们腾讯有6个事业群，同时我们有7个事业群，有各种各样的业务，这些业务让我们有机会不停地去试探人工智能的人能，不停地加强人工智能的能力。反过来，我们几个实验室的算法框架，在算例上、在数据上都有自己的优势，有些是互联网的，尤其是腾讯覆盖度比较高的一些地方。所以这块我们非常有优势，不管是实人实名的准确度、还是语音识别的准确度，语音合成的能力，其实一直都是行业领先的。

但是有一个有一点不同，就是人工智能围绕上半场互联网的算法相对比较成熟，尤其是一些应用场景，当然也在不停拓展。其实产业互联网对图像识别的使用还处于一个非常不成熟的阶段。比如说我们优图实验室已经开发出来的算法模型能够识别一个图片当中我们可以想象一下，我们2000种物体，但是我们产业互联网要求的可能要远远超出。比如说我们已经能识别保安在上班时间是否在非吸烟区吸烟，但是它可能要求的远比这更高，我们真正在线下协作的时候，要求比这更高。比如说我们的人工智能已经能够协助做液晶面板的质量检测，但是你会发觉这只是其中一个环节，你要把全环节打通，你要投入的人力、你要投入的算法专家、你要获取的数据还是非常多的。可以这么说，互联网的下半场，就是产业互联网刚刚开始，人工智能在这块还有极大提高的空间。

“算法、数据和算例都非常重要”

提问：人工智能有三要素，算例、算法和数据哪个更重要？

王龙：我先说一下第一个问题，就是算法和数据哪个更重要。其实我认为算法、数据和算例这三个都非常重要，举个简单的例子，过去这三年，我们都知道人工智能获取了大量资金的涌入，包括投资、创业公司。我们先说过去这几年，因为他们很多时候是不计算成本的在开发模型，不计成本的在获取客户，在做经济的投入，以深度学习为代表的人工智能到了期望值非常高的高度，但是我都知道有一个技术成熟度曲线，我相信大家也会感知到“冬天”的来临，但我觉得这并不是一件坏事，我们都知道任何一个技术也好，产品也好，它一定要有真正的商业价值才能“永葆青春”，大家不可能永远往里砸钱，你砸进去10元钱，最后发现只获得了1元钱的收益，这是不可持续的。现在怎么样让你砸进去10元钱能够获得20元钱的收益？不管是算例上的成本，还是算法的成本，投入的成本和数据的成本都要降低，我们可以看到其实整个行业趋势都在往这个方向发展，但发展的也有一些不同的方向，比如说有的是说把三者结合起来降低人工智能训练的门槛，比如说10元钱赚不到1元钱，但是可以把成本降到5毛钱，或者我训练出来的模型能够更好的适应多种场景，比如说我能赚到11元钱。最近比较新奇的强化学习和一些新的框架、一些新的算法都在围绕着这个目标前进。

还有一种方向，就是说我们瞄着某一个方向全力优化。比如说无监督学习，想办法在无监督学习、在对抗式学习这一块，我们可能研究的是说，我没有办法真正削减这个数量，我就没办法让我这个模型更加精确，能够利用在更多场景上。还有一些牵引学习，他说我实在找不到怎么样才能让我更好的精确，但是我最大的困难是我的数据就只有这么多，我没有那么多的数据，或者我的模型就这样，怎么办？他就用迁移学习的方式来减少对数据的依赖，减少对数据规模、数据质量的依赖。还有一些，比如说在硬件上的一些创新企业，你们这两个，我也帮不上什么忙，能不能在硬件的可定义化上做的更加出色，让你的模型、让你的算法，不管是什么样的模型和什么样的算法，不管什么样的数据，在我这个硬件基础设施上进行推断的时候，效率都能够得到提升，能够节约更多的成本，这也是产业正在努力的一个方向。

我们现在讲人工智能AI，其实大家传统上认为就是图像识别、语音识别，因为跟深度学习结合特别紧。我们以前的大数据终台，不管是做用户画像、做营销、做关联分析，其实都是机器学习的。其实在深度学习这个算法不停优化之前，大家都认为机器学习这个性价比最高，我没有必要进入深度学习。甚至在在2015年、2016年之前，大家也试图去用深度学习解决传统大数据的问题，但发现没有机器学习好，所以导致大家现在有一个潜在的认知，如果传统大数据就机器学习了，当然现在已经有一些深度学习了，如果是图像和语言就是深度学习，在这种情况下，大家把这个数据浅意识分成了几类，这是我结构化的传统大数据、这是媒体化的视频或者语音数据，然后有不同的框架和算法来处理。

我们可以看到，现在我们进入人工智能的一些深水区，我刚才说的遇到了一些挑战，其实行业已经在研究有什么办法能够把这些数据揉和起来进行更加深度的结合来训练模型。举个简单的例子，比如说我们都知道直播当中有很多非法信息的鉴定，现在利用这是很明确的。