文|松果智能 一颗菠菜
2023年上半年,在AIGC的相关投资中,多模态与跨模态项目出现明显的结构性热潮,无非都是看到了数字人的发展潜力和应用场景。作为互联网、人工智能巨头微软,自然不能放弃这块希望的田野。
7月24日,微软与小冰联合宣布,将为亚洲企业客户推出全新的AI数字员工解决方案,旨在进一步提高企业的工作效率和生产力。不过,这到底是世纪联手的科技大创新,还是依然在做换汤不换药的人工智能客服?
01、大模型下一波落地数字人,微软抢占数字员工市场
艾瑞咨询《2023年中国AIGC产业全景报告》的数据显示,2021年至2023年7月期间,AIGC赛道共发生280笔投融资,展现了高热度与高成长性。从产业细分维度来看,模型层创业受到ChatGPT影响,在2023年集中涌现。在获投的应用与模型层创业项目中,相比单一模态,多模态和跨模态的应用前景更加为资本所看好,而跨模态与多模态的投资相比,又明显胜出许多,报告显示,跨模态热度分布比例达到42.4%。所以目前,数字人为主的跨模态投资在模型层是最受追捧的存在。
(2021-2023年AIGC产业链各环节各模态融资热度情况)
基于市场需求火热,微软抢占数字员工市场并非偶然。同时,小冰的提前布局和技术优势大有超越市场平均水平的势头。
从投融资轮次维度分析,当前国内70%左右的项目仍处于A轮及以前阶段,同时有高达14.6%的比例属于股权、战略融资。这说明,虽然赛道的战略价值已被公认,但实则还处于起步期。而在获投的170家公司中,获投3次及以上公司约占17%。同一标的的高频融资,从企业需求侧反应了AIGC前期创业所需的大量资金支持,从资方供给侧也表明优质创业项目仍旧非常稀缺的现状。
(2021-2023年AIGC产业总体及各公司融资轮次分布情况)
这样的市场背景之下,小冰已有的研究和实践基础就显得较为超前。2014年,小冰团队率先在中国市场推出虚拟人业务,之后于2015年推出日本小冰。而如今,小冰历经数字人技术创新的几乎全过程,已经更新到了第九代,并且有了很多代表性的作品,比如被称为“虚拟人技术天花板”的财经AI主播N小黑、参与2022北京冬奥会的人工智能裁判与教练系统“观君”等等。小冰引以为傲的自研深度神经网络渲染技术也让其暂时领先行业。
由此来看,微软联合亲女儿小冰,有突破“傻瓜客服”的希望和潜质。
但微软“小冰”经历了孵化、被分拆、再合作、独立发展的几个阶段,已经积累了独特的能力和基础,成为了数字人孵化领域的独角兽。那么为什么又再次合作微软?让我们回顾以下微软的官宣文案:
“小冰将面向亚洲地区企业客户,推出基于微软国际版Azure新一代AI数字员工解决方案,双方将共同推进解决方案的市场普及。基于微软国际版Azure与小冰公司的X-CoTA技术,该解决方案可为客户实现拟人的对话式人工智能交互、广泛的逻辑思维能力、多模态生成能力与领城专业知识,有助于进一步提高AI数字员工效能。”
可以看出,此次合作事实上是微软智能服务平台与小冰数字人技术的合作,国际版Azure提供全球基础结构、端到端定制支持和SaaS平台的各种工具,服务企业在定制小冰数字人之后的应用环节,以微软拥有的各类强大资源为数字员工的销售背书。
(国际版Azure官网披露解决方案)
除平台和服务的支持保障稳定性外,小冰加微软的组合在技术上也很有优势。小冰最新推出的小冰链(X-CoTA)技术,创新了一种根本区别于大模型的小模型链式结构,不同的小模型可以负责不同的任务,如语音识别、自然语言理解、情感分析、知识图谱等,通过联合,可以实现更加复杂和细致的对话生成,根本提升了智能系统的“情商”。这也是传统人工智能客服和AI数字员工的根本差别。
相对于曾经只拥有少量固定知识储备的“傻瓜客服”,X-CoTA技术加Azure平台的组合使数字员工具有了自主思考和开放式搜集信息的能力,这就使得数字人在拥有逼真外形的基础上,可以独立解决问题。
总体来看,微软与小冰的携手可以称得上是强强联合,但相关技术和产品真正应用到市场端,能否达到预期效果,还尚未可知,这主要是因为推广方面面临诸多挑战。
02、小冰数字人造出来容易,推广起来难
此次和微软再合作,等待小冰突破的不仅是技术层面的问题,更有AI技术和AI员工不断融入发展和应用中必然会带来的伦理、法律、经济、社会等一系列问题。
从长远来看,数字员工必然会带来人力资源结构的变化,推广过程中也将遭受多方力量的博弈,前途如何,还未可知。人机协同对于生产力来说,到底是解放还是取代,还有待现实的检验。
小冰CEO李笛就曾经表示,“大模型(及其他模型)的安全性和伦理仍是至关重要的考量因素”。因此,尽管国内市场非常火爆,但小冰团队不会为了“秀肌肉”而贸然放出各种不安全的产品,这次的小冰链可以说是唯一的例外。所以,即使技术有了新的突破,安全性和社会影响也会继续制约数字员工的发展和普及。
微软表示,AI员工是人而非工具,数字人回归人性,必定会推动新组织关系的形成。目前来看,亚洲人力资源市场上对于AI代替人类岗位的惶恐还未扩散,但数字员工的潜力总有一天会爆发,没有准备的个人或企业都将以很快的速度被市场淘汰。再加上,新的就业岗位并没有被提供,新的蓝海也没有被广泛开发,数字员工的普及或被即将到来的失业焦虑与可能的社会动荡强力制衡。除此之外,企业数字化转型还涉及到相关组织架构的重建,对所引发的问题也需要思考和解决。
此外,内容能力仍是虚拟数字人发展的核心驱动力。市场对于数字人的期待绝不仅仅是精准的形象克隆,做一个漂亮的皮套人,而是期待它有着更加自主的内容创新能力,小冰在此还有待提升。
而对于数字人实际应用价值,应该结合整个AIGC大背景来看待。
一方面,AIGC将革新数字内容产业的发展范式,提升内容生产的价值和影响力。另一方面,AIGC将极大地激活数据要素潜能,促进数字经济与实体经济的深度融合,数字产业化和产业数字化的范围将持续扩大交融。AIGC对生产力的革新,将一定程度引领产业涌进从IT化、互联网化到智能化的第三阶段数实融合浪潮。
不过,尽管数字员工的前景光明、变革广大,但也必然要以技术成熟度和内容的生成、创新为基础。虽然小冰以创作诗歌和作曲吸引了众多用户的认可,但事实上,它的训练数据集还相对较小,这使得语言理解和内容生成能力受到了严重的限制。具体来说,由于没有足够的数据来进行学习和训练,微软小冰的语言模型目前很难识别和理解一些复杂的语言结构和表达方式。此外,小冰的对话生成算法仍是传统的规则和模板匹配方法,不能和更加先进的transformer神经网络模型相媲美。
多模态技术是文本、图像、语音等模态之间的转换与融合,技术难度最大,当前成熟度水平较低,仅在文-图,文-语音等领域有达到商用水平的表现。但目前来看,多模态技术是AIGC领域未来预期影响力最大的技术。
(AIGC技术成熟度示意图,数据来源:艾瑞咨询)
小冰生于C端,走向B端,现在又重回C端,是内容创作赋能个体用户的必然趋势也是交互能力、内容生成能力的必然考验。可以预见,AIGC进一步下放内容创作权,极大激发用户创作热情,加速内容裂变,并带来一系列AI-Native的新生机会。但国内用户在SaaS服务上仍表现出较低的付费意愿和购买力,如何聚集流量、让用户从尝鲜行为转为深入重复使用且满足强监管要求仍然是目前C端运营的重点、难点。
而且要注意的是,微软此次合作小冰要拿下的是亚洲市场,产品推广难度甚至将大过产品开发。
如上文所述,AIGC将首先从内容生产与交互方式的层面改变企业数字化产品服务。数字员工在B端应用推广与企业自身的数据基础、上云进程、数字化进度等基础条件都息息相关。而目前,亚洲大部分企业的数字化程度还需进一步提升,远未达到能够与虚拟数字人相辅相成的程度。整体来说,数字员工目前更像是基础设施,数字化程度较高的试点企业率先运营,距离普及推广还需要等待各B端企业数字化、智能化素质的提升。
其次,亚洲国家目前对数字员工的监管、法规还需要进一步完善。近期,欧盟《数字服务法》(DSA)正式生效。法案旨在确保用户的在线安全,阻止非法或违反平台服务条款的有害内容传播。作为欧盟委员会数字化战略的核心组成部分,法案将为欧洲单一市场的数字服务活动指定一个统一监管标准。相对于欧美国家逐渐完善的数字服务法案,亚洲国家的相关政策法规却又着很大的缺失,如前文所述,在缺乏规范的背景下,安全性和社会影响会继续制约数字服务、数字员工的发展和普及。
最后,数字员工的需求动力在于降本增效,但目前数字人的使用成本和维护成本并不低廉。随着大面积普及,对于数字人应用成本、效率问题的测算仍有待观察。
总之,构建技术研发与技术实践的良性循环才能促进数字员工真正融入行业,第一批参与使用的企业至关重要,甚至能够决定产品的未来走向。因此,小冰除了需专注技术研发和革新,也可以多观察第一批应用数字员工企业的使用情况,结合实际对产品进行持续改进,以打造出真正具备实用价值的数字人。