文|略大参考 尹凯
编辑|原野
ChatGPT 会成为AI大模型的“iPhone 时刻”吗?
在这款改变了全球AI行业进展的大模型上线一周年之后,答案显然更加明确。GPT数次进化迭代,大模型浪潮席卷全球,AGI俨然有引导第四次工业革命之势,也验证了OpenAI首席科学家伊利亚的那句话:这是倾盆大雨前的一场雨,是一个分水岭。
更深入更细微的变化还在继续。
“在未来两三年内,我们的工作方式、生活方式会有天翻地覆的变化。”百川智能创始人、CEO王小川在12月1日的2023腾讯ConTech大会中谈到。大会上,他与长江商学院教授、数字化转型中心主任孙天澍,以及复旦大学计算机学院教授、Moss系统负责人邱锡鹏,探讨了AI将在接下来的20年里如何重塑各个行业,其中,互联网大厂与创业公司又各自扮演什么角色。
01 变化
从只能处理文字信息的网页端应用,到可以同时处理文字、语音和图像信息的超级应用,ChatGPT只用了一年。期间,出于对其进化过快的担忧,包括马斯克在内的科技界大佬曾经联名呼吁,要缓一缓。
但大模型的热潮已经势不可挡。OpenAI已经从最初的非盈利机构,变成估值900亿美元的超级独角兽。全球几乎所有的大科技公司都发布了自己的大语言模型,从谷歌、Meta到国内的腾讯、阿里、百度、华为等。
于是,关于大模型的产业机会、技术突破和未来展望,就成为上述三位嘉宾在2023腾讯ConTech大会探讨的重点。
比如,大模型浪潮究竟是互联网大厂的机会,还是新一代创业公司的机会?
王小川没有作出“二选一”的回答。在他看来,大模型行业里,大创新靠小厂,小创新靠大厂。因为大厂本身会拥有自己的大模型,只要增加1%就会带来巨大收益。创业公司死亡率更高,也更可能带来更大的创新。
回到问题本身就是,当大模型推动大的时代变迁,人类从信息时代走向智能时代,会有很多新的公司诞生,空间很大。
具体落到大模型在消费互联网C端的应用,王小川比较看好它在智能助理和娱乐游戏内容方面的前景。比如,成为人类的私人老师、医生和律师等,或者在娱乐游戏中搭建更加高级的“太虚幻境”,因为大模型采用的是底层语言引擎,能构造出世界观和真实世界中的物理逻辑、社会文化逻辑等。
在技术层面,不管是OpenAI正在筹备的GPT商店,还是Facebook或者百川这类技术公司陆续推出的开源模型,开放,都在成为更加明朗的趋势。
由此可能带来的改变是大模型的平民化。邱锡鹏提到技术栈方面的体现,即,围绕某个大模型形成比较大的生态圈,提供好的个性化、定制化服务。不过,这需要解决计算成本的问题——这也是大模型变成人类助手的巨大阻碍。
因此,在他看来,进一步压缩大模型,甚至创造出新的架构,降低计算成本,让所有人都能用得起。大模型“平民化”的过程,也蕴含着大量机会。
不过,很显然,不是所有人和公司都能在合适的时机、抓住对的机会。
根据王小川的观察,大模型目前处于泡沫期,一些拥有技术力量的公司倾向于训练自己的大模型,因此导致了百模大战、千模大战。数据显示,到2023年7月时,国内大模型数量达到130个,已经超过美国的114个。到年底,前者又更新到了238个。
但本质上,这是一种焦虑:个人怕失业,企业怕掉队。在王小川看来,现在很多算力是浪费的。当行业进入成熟期,少量企业会拥有自己的数据与场景,甚至训练出自己的模型去赋能行业,但多数企业通过调用就足够了。
在现阶段,他的建议是:克制欲望,不要着急训练自己的模型,而是先把市面上已有的模型用好,通过产品和市场,先验证自己的判断,把第一步走好。
不过,区别于AI技术在过去几十年里的任何一次爆发,人类对于AGI的态度更加热烈,也更加谨慎。根据OpenAI首席科学家伊利亚的说法,这是因为AGI区别于人类迄今为止创造的所有东西,它具有自己的目标,完全自主。
AGI自身,以及人类围绕AI技术的研究的飞速迭代,决定了AI行业的这场狂飙,也决定了,身处其中之人,必须时刻进行自我迭代。
王小川在ConTech大会中谈到了自己的观念变化。
他原本有个观点:理想上慢半步,落地上快一步。相比技术科研,中国的优势可能在应用层面。但今年6月去美国与大模型同行们交流后,他改变了,想要:理想上慢一步,落地上快三步。
一方面,拥有7年积累的OpenAI在技术层面已经领先太多。比如OpenAI现在正在进行的研究是,尝试把1000万颗GPU连在一起训练一个大规模的模型,而国内现在还在4000颗GPU对标GPT-3.5的阶段。不过,在应用层面,中国互联网的产品体验远强于美国,移动互联网时代也培养了大量优秀的产品经理,这些都是优势。
一句话就是:更加彻底地扬长避短。
02 狂飙
王小川的观点,或许也是多数大模型创业者的心态缩影:在月亮与六便士之间,优先选择后者。
毕竟,先活下来,才有机会参与到后面的故事。
苹果公司在移动互联网时代建立起来的供应链与生态王国,成为很多还在路上的大模型中国创业者的“灯塔”。仅仅在A股,苹果产业链上市公司就有118家,“苹果吃肉,供应商喝汤”的说法广为人知。更不用说,那些通过做一款APP而改变人生轨迹的海量创业者们。
目前来看,Open AI很可能成为新时代里的苹果公司——就连创始人被驱逐出董事会再回归的桥段,都如此相似。就算它无法复制苹果的成功,微软和谷歌也足够有野心。
在中国创业圈,AI狂飙的剧情正在上演。
今年以来,多家大模型初创公司拿到融资,企名片数据显示,今年中国AI领域融资214亿元,百川智能、Minimax和智谱AI三家公司在资本市场尤为受欢迎,融资额占比超过30%,基本形成第一梯队。
图:人工智能领域该周内融资6起,融资金额21.73亿元。其中,在10月17日,百川智能完成3亿美元的A1轮战略融资。
以成立于今年3月的百川智能为例,它在天使轮拿到5000万美元,AI轮拿到3亿美元,参与方包括阿里、腾讯、小米和多家头部投资机构。
陆奇创办的奇绩论坛,成为这波AI浪潮的缩影。根据《中国企业家》报道,在今年的秋季路演日上,67家创业公司参与,其中51家为人工智能领域。更早些时候的春季路演日,人工智能和大模型相关创业项目为82个,超过总项目的一半。
更多明星人物在AI大潮中变得炙手可热。比如创立光年之外的王慧文、创立百川智能的王小川。他们此前在互联网和移动互联网时代的履历已经足够光鲜,唯一的缺憾就是,尚未独自站在舞台中央。
如今,AI让一切成为可能。
王慧文曾经在接受采访时提到美国投资人埃拉德.吉尔的观点:在部分科技浪潮中,所有的价值都可以由初创企业捕获,而在另外的浪潮中,大部分价值会归成熟企业所有,或者会在初创企业和成熟企业之间分配。在王慧文看来,AGI浪潮属于后者。因为大模型的技术跟过去差异极大,市场具有不可预测性,创业公司就有了发展空间。
不过,类似这样的观点,还有待时间去验证。
创业者纷涌入局,实力更雄厚的大公司们,自然也不会缺席。
场景、数据、模型和算力,共同构成了大模型的四要素,这也意味着门槛——创业公司或许能擅长其中的一项或者几项,但想把它们尽可能多地集齐,显然还是大公司更有优势。根本上,这是关于科技的硬较量,需要大量资金与高端人才的投入。
整体来看,大模型在国内经历了三个阶段:今年3月起,百度、阿里、华为、腾讯、360等大厂陆续发布大模型;5月起,包括商汤在内的AI 1.0公司,以及知乎等中小互联网公司跟进;10月起,一批大模型进行迭代,部分国产大模型宣布开源。
至少到现在,大厂与创业公司们还没有形成泾渭分明的敌对阵营。狩猎、绞杀和反抗的戏码,还没有拿到出场的指令。更多时候,以及接下来的很长时间里,他们都需要彼此借力,争取在国内形成健康繁荣、且能持续相当时间的AI生态。
不过,人们在现实中感受到大模型赛道狂飙的影响,或许不需要等待太久。
在2023腾讯ConTech大会中,王小川给出的答案是“未来两三年”。他借用了孙正义的观点,“会用AI和不会用AI的人就像人和猴子的区别一样”,他相信,人们的工作和生活方式很快会因为AI而发生巨变。
变化带来机遇,也带来希望。
财经作家吴晓波在《激荡三十年》中写道:“这是最好的时代,这是最坏的时代。这是史诗,幸而你我活在其中,幸而未完。”对于AI时代,史诗的序曲或许刚刚奏起。
以下是2023腾讯ConTech大会相关访谈实录:
孙天澍:我们讨论的第一个议题是大模型的产业机会,AI正在以什么样的方式重塑产业,里面的机会在哪?接下来大模型在消费互联网C端的产品形态和商业机会有哪些?到底是互联网大厂的机会,还是新一代创业公司的机会?
王小川:大模型来了以后,无论是大厂还是创业公司、投资人都已经很疯狂开始发展这样的技术。我的看法是,大厂至少在现有的产品迭代升级里面有挺多空间,人员密集型的地方可以用大模型来做替代,也能够升级自己的产品。但是对创业公司而言,死亡率会更高。
行业之前做大模型,有一个概念叫做大创新靠小厂、小创新靠大厂。大厂的体量也会有大模型,只要增加1%就是巨大的受益。但是最大的创新可能来自于创业公司。新的一波机会,我们的看法是从信息时代走向智能时代,会有新的公司起来。
至于C端怎么用?大模型不是一个工具,它掌握了语言、世界知识等,起到了陪伴人类的伙伴角色。它也能成为各种各样的助手,比如写作助手、问答助手、私人老师、私人医生、私人律师等。
娱乐行业对于大模型同样有着巨大的需求。人类除了工作创造,也需要休闲,大模型在情感陪伴领域不仅可以拟人,甚至可以拟出一个虚拟世界。这将会给娱乐行业、游戏行业带来很大的变化。因此,大模型在C端里的两个重大方向分别是娱乐行业和助手。
孙天澍:小厂做大创新,大厂做小创新,但是大厂有自己的阵地,可以在已有的电商娱乐等方向、APP上进行升级。小厂可能会探索出一些全新的产品,全新的结构,这里面有非常多有意思的新一代的产业机会。想问一下邱老师,大模型在开放态度中的产业机会。整个大模型在开放生态发展非常迅速。第一,未来开源模型在海外,在中国会不会收敛到一到两个模型?第二,为开放生态进一步发展,大模型公司还需要做哪些准备?国内大模型公司需要在能力上做什么准备,能够达到像OpenAI和Agent智能体未来开放生态布局?
邱锡鹏:大模型生态变得非常开放,这里有非常多的参与者,涉及到平民化的问题。平民化可能分成两个:一方面,因为大家都在围绕着某个开源,围绕着比较大的生态圈,如果提供非常好的个性化、定制化能力的话,就是技术战,因为参与者众多,确实会降低很多研发成本。
现在,非常蓬勃的互联网生态发展包括GPT个性化、各种工具的使用、任务规划等,这些都需要比较大的模型。但由于大模型的算力成本和计算成本很高,存在一定阻碍。
目前来讲,由于成本的原因,国内还不能将大模型广泛地应用到每个人身上,让它变成每个人的助手。未来,如何去一步提升大模型的效率,把大模型进一步压缩,来降低它真正的计算成本,让每个人都能用得起,这才能达到真正的平民化。
孙天澍:请小川来分享一下,从大模型在企业服务未来的判断,对于企业家来说,想使用大模型能力,是应该思考用公有云上调、智能体结构,还是用自己的开源模型融合到企业知识库等,做更加私有化的部署?
王小川:开闭源场景里特别突出的矛盾问题是心态问题,大模型来了之后,全球人民都怕失业、企业怕自己掉队。这种情况下,有技术力量的公司,通常愿意训练一个模型出来,但这件事情并不够客观理性。现在正处于泡沫期,很多公司会愿意投资训练自己的模型。所以使得百模大战、千模大战,其实都是大家的焦感带来的。
事实上,到成熟期的时候,少量企业能够有自己的数据、场景,能训练出自己的模型给行业赋能,但是更多的企业通过调用方法就够了,挤掉泡沫后,才能沉淀出来大家的共识或者价值。
我给出的建议是,很多企业不妨克制一下欲望:不是先训练一个模型,而是先用起来,通过微软云、接口调用国内模型,将模型和业务链路融合起来。之后从产品、市场等方面验证可行性。
孙天澍:接下来问一下邱老师,您从研究者的视角,觉得整个大模型产业发展中,高校和研究者主要的角色和贡献在哪些方面?他们与大厂,与创业公司有什么不同?
邱锡鹏:我个人会更关注基础研究,现在大模型非常成功,它的推进速度比我们想象的更快,我和很多公司接触,发现他们底层已经都用大模型了,用大模型确实可以降低研发成本、标注数据等,它的广泛性确实非常好,可能比我们想象中还要更快。
但是做大模型和应用大模型,还是可以分开而谈。大模型还存在一些不足,包括如何做更高效果的架构、推理加速,训练加速等。如果面向未来智能体的发展,大模型仍然有很多模块欠缺,比如记忆能力、推理能力、规划能力等,包括现在大模型背后的一些机理,都不足以支撑未来更进一步推动智能化的发展。
作为学术界的人,我们更关注大模型的安全可信、诚实性等,争取让它更好地符合人类的价值观。
孙天澍:大模型时代来临后,人工智能要求人才的结构都很不一样,高校里有哪些培养机制?
邱锡鹏:以我们的经验来说,大模型需要全栈式的人才。应该是从底层的系统结构到模型如何训练,再到AI算法,甚至包括数据如何清洗都要懂。否则的话,中间会断,大模型研究上会比较低效。
孙天澍:中国大模型未来整个技术突破和核心竞争力会在哪些方面?在产品应用领域,中国的公司基于自己上一代的互联网经验,产品经验,以及基于中国大的消费市场,能不能做到全球领先?
王小川:我6月份去了一趟美国,跟OpenAI和其他做大模型的同行做了很多交流,发现我们要接受一个现实。OpenAI已经发展了7年,在这样的技术积累和场景布局里面,我们是有巨大的差距。
但是我们的产品体验是远远优于美国的,这里包括大家对于运营导向、贴近市场的方式等。我们要在这方面培养大量的产品经理,在这种情况下,我们有巨大的经验和优势。这里有两个难点需要解决,第一,要有模型,我们要将模型公司与应用公司结合,甚至用开来源和端到端的模式解决,争取用较弱的模型做出好的应用。
第二,产品经理也面临转型和提升。对产品经理而言,他们懂得什么样的产品适用于今天的技术,甚至还能引领技术的发展。产品经理要对技术有判断和评价,争取让算法工程师跟上这个步伐,解决这两个问题,中国的应用就能走在美国的前面。
孙天澍:想问一下邱老师,从基础研究的角度来看,第一,AI大模型的基础研究,怎么往更有效率的方式走?第二,计算机的研究、人工智能的研究,大模型对于整个自然科学领域的研究等,大模型可能会在哪些维度为技术突破、技术研究带来冲击和变化?
邱锡鹏:我们与OpenAI算力的差距太大,保持紧密的跟随。一方面能够锻炼我们的技术,另一方面保持不掉队,培养人才,能够达到非常好的效果。但是在赶超方面,还是要结合当前我国具体的实际情况,比如靠产业的带动,从中产生的需求,再把它转化到技术研究上。我们技术研究的问题,要由真实的需求凝练出来,所以产研合作在下一步变得非常重要。
现在的大模型或者以大语言模型为中心的新一代通用AI技术,是用语言来打底,构造一个非常完整的系列知识体系。很容易把人的各种经验通过语言作为载体附加到模型中,在做科学研究应用上的话,它的模式和形态可能跟以前不一样。它会更加侧重科研发现,类似于科研探索,或者主动让他得到一些新的结论。
孙天澍:关于技术突破还有两个很重要的话题,大模型四个要素场景、数据、模型、算力,想问大家对于中文语料进一步采集、整理和使用有没有什么建议?这个可以从你们自身企业发展的角度,或者模型发展角度,也可以从公共政策、产业政策的角度,谈一谈中文语料怎么样能进一步去采集优化?
王小川:主要分两部分,第一是训练大模型所需要的公有数据。第二是企业为了自己的竞争力需要的私有数据。我的逻辑就是不要迷恋于纯中文语料,需要高质量的语料都兼顾。至于企业自身数据,更多解决的问题是技术开放性怎么耦合到大模型里的问题。大模型核心靠的是预训练和最后的微调,企业语料怎么进去,需要技术实践,很多技术问题还在攻克当中,如何更好地把大模型跟自然语言、知识库之间对应上,需要工业界和学术界共同解决。
邱锡鹏:对学术界来讲,数据一直不擅长,我们这方面投入的人力不是很多,基本上以公开数据为主。但是这些公开数据经过一些粗加工,主要以英文居多,中文开放的还不够。我们需要提出数据的衡量标准,来评判什么样的数据是有价值的,包括知识量、知识推理等。
王小川:学术界还有特别被动的地方,因为学术界要通过发论文来证明自己的创新性,论文很多发在英文刊物里,如果学术界要努力做好中文数据,不代表可以在这个评价体系里获胜。所以我们的数据和评价体系,跟西方走了很多,这是特别被动的地方。
孙天澍:再提出一个方向的问题,在国内算力依然非常稀缺的情况下,如何在有限的算力下更好地用好这些算力资源或配置资源,对大模型的基础底座研究做出一些突破?大家能否从产业视角和学术视角做一个分享?
王小川:我认为企业有动力把算力做好,每个行业一旦被扶持,能有百家、千家公司做模型,这是一种很大的消耗,所以还是希望大模型对头部创新有更多帮助。
邱锡鹏:训练这块要适当集中,训练一个比较好的推理端,比如模型训练好之后,我们可以提升很多工作的效率,包括做一些优化、平民化的工作,这些都需要技术支撑。
孙天澍:最近一到两个月,你们有没有看到特别激动人心的大模型,赋能下一代的产品生态?或者是产品应用?
王小川:今年是元年,刚刚开始,在情感陪伴里面大家看到一些成绩。我们公司既做模型,也做应用,内部的医疗模型确实能够更好地做问诊,医疗能力还是蛮惊喜的。
邱锡鹏:我这方面了解的少一点,我觉得ChatGPT本身,还是比较惊艳的。因为他们个性化的速度非常快。
孙天澍:我觉得智能体是特别值得关注的一个方向,大家怎么看?
王小川:因为ChatGPT—4到了一定高度之后,智能体就变得非常可行了。国内还是有距离的,国内现在更大的基础工作一方面是追赶ChatGPT4的水平,这样才能做智能体。另一方面,追赶过程中,我们开始要做落地的应用。这样的视角会有些不一样。
孙天澍:大模型时代来临后,两位老师对年轻人有哪些建议?
王小川:时代变革的时候,年轻人更有机会。大家只需要用好大模型,就可以一个人变成一个团队,一个人做一个公司,这个机会是属于年轻人的。
邱锡鹏:生成式AI给我们提供了非常好的工具,能够使得我们做更多的事。只要你能积极拥抱AI技术以及它带来的变化,就非常好了。
孙天澍:最后一个问题,请二位回答一下,大家觉得大模型对我们社会生活的改变,像当年移动互联网智能手机对我们生活的改变,这个时间会来的多快?
王小川:用孙正义的话讲,会用AI和不会用AI的人就是像人和猴子区别一样,我自己是把ChatGPT放在我手机的最底下,每天都会使用。在未来两三年内,我们工作方式、生活方式会有天翻地覆的变化,AI速度已经到来了,智能体到来之后,跟你工作的可能不只是人,也有机器。
邱锡鹏:我也比较乐观,我觉得三到五年吧。以前电影的类似于AI的形象会来到我们真正的现实生活中。
孙天澍:非常感谢二位,在新科技讨论中,我们讨论了AI大模型的产业机会、技术突破和未来展望。新一代的AI汹涌澎湃,也希望未来大家能够持续关注,能够向小川和邱老师一样,将 AI融入自己的生活中,持续学习,把科技的未来和自己的未来联系到一起,谢谢大家。