大厂赶超ChatGPT-蓝鲸财经

文｜新摘商业评论洛枳辛夷

ChatGPT上线的两百天里，国内大模型发展开启“狂飙”模式。

据称，中国10亿参数规模以上的大模型已发布79个。

大模型进化场，讲究一个百模混战：百度文心大模型已进化至3.5形态；阿里通义千问构建家族模式；京东言犀大模型则是为自己“量身定做”的产业大模型；美团牵手清华系，领投AI公司智谱华章；360智脑将接入“360全家桶”……

大厂大模型进化论，残酷又现实，要么赶超，要么被淘汰。物竞天择，适者生存，大厂大模型纷纷赶超ChatGPT。

可以看出，大厂大模式，拼研发的时刻到了。

大厂大模型哪家强？

今年上半年正式公开宣布做大模型的企业就有近百家，各家大模型正陷入酣战。其中，有阿里、百度、腾讯、京东、字节跳动等互联网大厂玩家，也有科大讯飞、商汤科技等AI公司，还有其他“杂牌军”也混入其中。

半年时间，大模型赛道完成了从概念到落地的进程，这放在任何赛道都很炸裂。

但是，到目前为止，都没有明确的指标或者准则去验证谁家的大模型更优质，一个接着一个发布会，“王婆卖瓜自卖自夸”式的自我评价，令人眼花缭乱之余，并没有太多客观性。

那么，百模大战，究竟谁更胜一筹？

在IDC最新发布的《AI大模型技术能力评估报告，2023》中，首次提出AI大模型技术能力评估框架。

评估大模型共有三大维度：产品技术、服务生态、行业应用。

具体细分指标可达12个：算法模型、服务能力、通用能力、创新能力、平台能力、安全可解释、生态合作、行业覆盖、金融、工业、医疗、能源。

其中，算法模型和行业覆盖，是衡量大模型能力最重要的2个指标，特别是，二者可以形成持续迭代提升的飞轮。

产品技术能力中，“算法模型”维度是大模型能力最为核心的要素，也是决定大模型应用效果的根本所在。

原因在于，只有通过算法模型技术的突破，实现具有通用效果优势的大模型底座，才能支撑更广泛的行业覆盖，使各行各业充分享受技术突破带来的红利，破解AI落地门槛高的困境。

行业应用能力中，应用覆盖的广度是当下大模型厂商最为关注的指标，是大模型效果通用领先性、行业结合能力的综合体现。

所以，“行业覆盖”通过企业级客户数量和落地行业数，体现了大模型在产业落地上的实力。

国内主流大模型，包括百度、阿里、腾讯、华为、科大讯飞、360、商汤、第四范式等14家厂商参与了本次评估。

大厂大模型的竞争咬合度很高，百度特点具有“芯片-框架-模型-应用”四层技术栈完整布局的独特优势：芯片层-昆仑芯、框架层-飞桨、模型层-文心大模型，以及各种AI的落地应用。

阿里云，也很亮眼，12项指标获得6项满分，且是唯一获得“服务能力”满分的厂商。作为基础模型提供方，大模型厂商的平台能力、服务能力和生态合作水平对行业发展至为重要。阿里云在这三个指标上都获得了满分。

目前，阿里云的通义大模型家族现已具备处理或生成文本、语音和图片等多种模态的能力。过去3个月，阿里云先后推出了基础模型“通义千问”、音视频大模型产品“通义听悟”、 AI绘画创作大模型“通义万相”，通义大模型家族仍在不断迭代和进化中。

同为互联网大厂的腾讯云和京东云，都选择根据自身特色，深耕产业侧，发布行业大模型。

腾讯云在构建行业大模型的基础上，用自身数据进行微调，打造出数据精准性更高、隐私安全性更强的专属模型。

对于深耕数年供应链的京东来说，长期扎根于电商业务和物流业务，选择奔向产业大模型，专注于供应链是更好的选择。正如京东在言犀大模型发布会上所言，“只有将供应链做实，才能将大模型做实”。

科大讯飞等AI厂家在垂直赛道也拿到了满分，这些玩家在做透垂直行业上有机会，在厂商竞争中，垂直领域优势明显企业将领先。

以科大讯飞为例，科大讯飞专注人工智能领域20多年，多项核心技术均处于国际领先水平，星火大模型将大模型的语言理解能力、概括表达能力结合类搜索插件，有效解决了新知识难以更新、事实类问答容易“张冠李戴”等行业难题，实现了知识问答能力相比原来24%的提升。

由于训练大模型的成本极高，普通开发者和中小企业无从下手，这从报告结果也能看出：其他厂也很努力，但前途漫漫，说得更残酷些，可能连上桌吃饭的机会都少有。

大模型未来通往何方？

在前不久的WAIC大会上，入场大模型的玩家们其实已经划出了重点：首先解决技术问题，再是场景落地，最后实现商业与规模化。

目前，我们看到大模型已经开始与场景、行业进行深度融合，例如，代码生成、蛋白质结构预测等领域的大模型，验证了大模型已不仅在科技企业中应用，也迈出了走向各行各业的步伐。

国内大模型飞快跃过大模型概念股阶段，AI大模型已经从拼参数发展到拼应用。

比如，华为盘古大模型已经在气象、医药研发、电力、语种等领域落地，并交付了多个千亿参数大模型。腾讯云行业大模型能力将应用到金融风控、交互翻译、数智人客服等场景中，提升了智能应用效率，一站式MaaS服务为企业减负。

具体到应用场景，以金融领域为例，行业大模型可以加持金融风控解决方案，相比之前有了10倍效率提升。

大模型结合过往积累的多年黑灰产对抗经验和上千个真实业务场景，整体反欺诈效果相较于传统模式，提升了20%左右。企业则可以基于prompt模式，迭代风控能力，从样本收集、模型训练到部署上线，实现全流程零人工参与，建模时间也从2周减少到仅需2天。

即便样本积累有限的情况下，也可以完成快速搭建，跳过“冷启动”过程。

如何落地及商业化，正在成为厂商追求的重点。

这意味着，AI进入大规模可复制的产业落地阶段，仅利用下游的小样本或者零样本学习就可以达到很好的效果，从而降低AI开发成本。百度文心大模型在升级后，就成功将成本降至过去的10%。

任何行业，最终都会形成寡头态势，大模型也不例外。

过去短短几个月，大量新的大模型涌现，是疯狂想抓住风口，害怕掉队，还是长远布局赛道，潜心钻研，每位玩家只有自己心知肚明。

百模混战只会是一个阶段性的现象，终局仍然集中在少量的几个大模型。原因不外乎以下几点：

一是，在演变过程中，各企业和机构逐渐找到了自己的定位，逐渐走向细分方向，最终被更完善的大模型收入麾下。

二是，需要多年积累。真正从底层做起来的大模型，成本非常高，需要非常综合的能力，在心态上也必须抱有绝对的长期主义，这就意味着没有绝对经济实力的玩家，会被甩在半路或者“死”在通往光明的路上。

三是，大模型在应用层面未来想象空间非常大。假设每一个行业都有巨大的发展空间，可以通过新AI技术提效，应用层面的价值一定会分流，依托几个头部大模型会有非常广泛的应用生态。

不可否认的是，未来所有的企业都会强依赖大模型，所有的产品都会基于大模型来开发。

而行业渗透率和市场份额，俨然成为企业大模型走向寡头最重要的挑战元素。

声明：本文内容仅代表该投稿文章作者观点，不代表蓝鲸号立场。 未经授权不得随意转载，蓝鲸号保留追究相应责任的权利