文|数智前线 赵艳秋 周享玥
编辑|牛慧
今年开年以来,大模型落地越来越火热。云计算大厂有关AI业务的数据在不断刷新。就在这样的时间节点上,5月9日,阿里云在北京举办AI峰会,除了发布阶段性的进展之外,还重点向与会者介绍了阿里云的大模型生态和落地平台,为大模型落地竞争再添一把火。
而在经历一年多的探索后,国内四大云计算厂商,虽然在某些地方的打法在殊途同归,但也逐渐形成了各自的章法和节奏,出现了路径上的分野。
01 阿里云强调用开源发动生态
阿里云AI峰会上,一些阶段性数据受到关注。阿里云首席技术官周靖人介绍,在过去几个月,大模型除了在技术能力上经历了一个关键阶段外,也已经快速进入各行业。阿里云大模型API日调用量已经过亿;除了日常2C应用外,也服务了9万家企业客户;尤其在开源场景中,通义开源模型下载量已超过700万。
伴随应用的深入,阿里云看到,大模型推理算力最近几个月正在起来。这令不少阿里云人士感到兴奋。
针对最近在业界引发争论的有关大模型开源和闭源的问题,周靖人称,开源是阿里云的战略。但同时,阿里云形成的是一个开源和闭源的整体体系。
他解释开源的重要性称:“今天我们希望把大模型的能力释放出来。无论是PC端、还是手机端,将各种场景识别出来,快速搭建更加复杂的业务AI系统,其实都需要一个非常开放、开源的生态,这也是为什么全球开发者和企业都一致在拥抱这样一个体系。”周靖人说,开源的作用毋庸置疑。为此,阿里云将持续做开源。
通义已经开源了参数规模从5亿到1100亿的8款大语言模型。其中,小尺寸模型如0.5B、1.8B、4B、7B、14B,针对手机、PC等端侧设备;大尺寸模型如72B、110B能,目标是企业级和科研级应用;中等尺寸如32B,期望在性能、效率和内存占用之间找到最具性价比的平衡点。此外,通义还开源了视觉、音频、代码、混合专家模型。周靖人强调要高质量地开源,通义72B、110B开源模型,都曾登顶开源榜单Open LLM Leaderboard榜首。
业界看到,今天企业的应用上,往往因为不同需求,在不同场景下选择不同的模型。在阿里云魔搭社区,已提供4500个开源或闭源模型。
除了阶段性成果以及开源问题,在大模型火热落地的态势下,周靖人花了很大篇幅讲模型落地。在AI峰会上,阿里云推出了百炼平台2.0。此前在2023年10月,阿里云首次发布了百炼大模型平台。
周靖人告诉数智前线,这为了解决企业的快速定制问题。“真正到了业务应用场景,不是一个简简单单的场合,每一个企业都有自己特殊的需求,如果不做任何修整,让基础模型直接去对接,业务的需求是很难满足的。”
周靖人重点介绍了百炼平台的Prompt、RAG、微调能力,以及Asistant API,它能结合Prompt和各种工具,实现智能应用的智能编排。
小米、微博、众安保险、完美世界游戏,分享了与通义大模型的合作。其中小米的人工智能助手“小爱同学”,在当下火热的小米汽车su7等多类设备落地,接入了通义千问,提供图片生成、图片理解等方面的多模态 AI 生成能力。
阿里云资深副总裁、公共云事业部总裁刘伟光在峰会上称,云和AI必然是电和电机、鱼和水的关系。业界观察,阿里云的大模型商业策略,是通过开源、投资等多种动作,发动生态,来加速人工智能应用落地。这样,这家云计算大厂可以实现云和人工智能业务的螺旋上升。
02 百度华为腾讯各有侧重点
在几家云计算大厂中,百度云的规模最小,但由于在大模型上出拳最早,去年3月推出文心一言,其后在大模型、大模型工具平台、大模型对自身应用重构、大模型生态等方面,都较早开展体系化打法,也给其带来一定先发优势,上到了重要的“牌桌”上。
比如在今年开年国资委召开的“中央企业人工智能专题推进会”上,百度与华为一起,作为人工智能企业参会。最新的报道是,李彦宏在5月6日拜访了中石油董事长戴厚良,期望在“数智中国石油”建设中深化合作。
百度文心一言采用了闭源模式。百度称,一方面尝试通过自研大模型,闭源打法,在AI上能有所收益;另一方面则通过千帆大模型平台,提供多种开源大模型和工具,形成云上的商业闭环。不过,由于其规模和业务积累,百度在当下的大模型落地争夺战中也面临不小挑战。
百度云于今年春季召开首届生态大会,宣布面向三类市场——头部市场、价值市场和高潜市场,厘清与伙伴之间的分工协作边界,实现协同作战,目标是加速大模型落地。
华为大模型战略是一开始就奔着行业落地去的。2023年7月,华为云盘古大模型3.0发布,提出“不作诗只做事”的口号,陆续推出了矿山、药物分子、电力、气象、政务、金融、制造等行业大模型,在各行业展开战略合作,打造标杆。
尽管业界对盘古大模型是否算大模型,存在争议。但有业界认为,华为的打法可能是可以更快变现、且不烧钱的一条商业路径。这在当下一个基础大模型的训练,动辄几百万到大几千万、且大模型商业变现模式还没有形成业界共识的情况下,这是一种选择。
当然,与其他互联网云大厂还有一个巨大的不同是,华为提供昇腾和昇腾AI云服务,要“在新的淘金时代卖铲子”。
华为与互联网云计算大厂,或许也将在一些方面“殊途同归”。今年6月,华为将在东莞松山湖举办年度开发者大会,与往届不同的是,盘古、鸿蒙将首次联袂亮相。鸿蒙是华为的万物互联操作系统,有业界人士认为,这或许意味着,此前只做to B市场的盘古大模型,将通过鸿蒙操作系统,延伸到C端,形成与其他主流大模型厂商一样的B、C两端双布局。
而腾讯在众多投入基础大模型研发的厂商中,一直是比较低调的存在,打法也有很大不同。
作为一家有着产品基因的公司,腾讯在大模型上的打法,有着明显的“产品化”特征。自去年9月混元大模型上线以来,腾讯的重点之一是围绕自身庞大的产品矩阵,将大模型的能力直接赋能给旗下的各类SaaS产品后,对外提供服务。
这是一种“大模型全家桶”策略,其内部目前已有超400个业务在接入腾讯混元。尤其是在一些有着大量C端用户和流量的场景,如企业微信、腾讯会议、腾讯文档三个SaaS产品,都已全面接入腾讯混元大模型。腾讯乐享、腾讯电子签、腾讯问卷、腾讯云AI代码助手等协作SaaS产品也在今年4月实现了智能化升级,对外服务。
此外,除了在自家的基础大模型上折腾,腾讯也和阿里一样,是多家大模型创业公司背后的“金主”。国内目前中国估值前五的生成式AI独角兽中,阿里的参投率为100%,腾讯则是60%,分别为百川智能、智谱 AI 、MiniMax 3家。深言科技、无问芯穹等大模型公司也曾进入腾讯投资列表。
大模型的竞争,还远未到终局。而四家云计算厂商,已经逐步形成分野。