生成式AI正在以迅雷之势席卷全球,吸引无数科技巨头、初创企业投身其中,而那些反应迟缓或战略短视的公司或许将错失良机。在众多AI企业中,商汤科技正凭借其稳健又具有前瞻性的发展策略,成为中国生成式AI的领军者。成立十周年之际,获得AI加持的商汤再次交出一份亮眼的财报成绩。
8月27日,商汤集团公布截至2024年6月30日的中期业绩。财报显示,2024年上半年,商汤总收入录得17.4亿元,同比增长21%。其中,生成式AI业务延续了2023年以来高速增长的势头,收入近11亿元,再次突破10亿元关口,飚涨256%,亏损同比收窄21%。
生成式AI首次成为商汤的主导性业务,在集团收入贡献占比超6成,传统AI业务主动做收缩调整。商汤在财报中指出,受惠于中国市场对大模型和智算服务的强劲需求、“日日新SenseNova”大模型能力的飞跃式提升以及推理成本的快速下降,带动模型调用量增长迅速。
报告期内,“绝影”智能汽车业务的表现也极为亮眼。其业务收入达1.7亿元,同比增长100%。上半年新增交付70.5万辆车,在中国车企出海项目中发挥着重要的影响力。
商汤集团董事长兼CEO徐立表示,“生成式AI迎来黄金发展时期,我们正处于下一波增长的有利位置。商汤核心优势在于‘大装置+大模型’深度协同,具备打造对标一流的大模型能力,在原生多模态、视频流自然交互,以及低成本模型推理架构上构建独特的优势,从而在激烈的市场竞争中脱颖而出。”
“大装置+大模型”双轮驱动,投建AI算力集群5.4万块GPU
经历了过去一年多的“百模大战”后,涌入AI基础大模型领域的狂潮开始显现出退却的趋势。企业们逐渐意识到,只有尽快让AI技术实现商业化变现,才能找到可持续的盈利路径。而商汤已走在许多同行的前列,探索出“大装置+大模型”深度协同的商业模式,现阶段已被验证具备变现能力和可持续发展能力,为商汤确立了重要的市场竞争优势。
商汤大装置管理的算力实现了全国联网的统一调度,在上海、深圳、广州、福州、济南、重庆等地都拓展了新的计算节点,截止2024年7月,总算力规模高达20,000 petaFLOPS ,已有超5.4万块GPU,其中上海临港AIDC已达到14,000 petaFLOPS,远远超出立项规划的3,740 petaFLOPS算力总量。在支持商汤自身大模型研发的同时,也支持外部客户训练大模型和应用部署。强大算力可支撑超过20多个千亿超大模型同时训练,并支持万亿参数大模型的全生命周期生成。
之后随着ChatGPT掀起全球AI热潮,算力很快成为稀缺资源。英伟达的GPU芯片“一卡难求”,困住了不少AI企业。凭借事先的布局,商汤却依然能保持前进的势头。据商汤最新财报披露,其AIDC服务实现了较好的规模化效应,上半年生成式AI的训练和推理需求持续呈现强劲增长态势,进一步扩大了AIDC规模,并增强了服务能力。
国际数据公司IDC在8月发布的一份报告中指出,受益于对大模型的专注投入,以及所建设的上海AIDC能够为客户提供一体化的大模型计算与应用解决方案,商汤已在中国大模型市场取得领先。据其2023年数据,商汤以16%的份额位居中国大模型平台市场第二,同时还在短短数年时间内,一跃成为智算云服务领域的领头羊。
目前,日日新大模型和大装置AI云服务已全面投产。依靠从千卡集群到万卡集群的建设、灵活调度运营的成熟能力,商汤能够有效支持万亿参数多模态模型的训练以及大规模AI推理。
聚焦垂直领域的AI时代蓝图,旨在真正为客户创造价值
商汤科技董事长兼CEO徐立在今年的WAIC上发言时指出,“要推动人工智能超级时刻的到来,大模型需要具备更卓越的思维能力、更自然的交互能力以及更可控的生成能力。同时,唯有不断深入垂直行业,大模型才能创造出全新应用格局,最终助力‘人工智能+’步入黄金时代。”
随着AI浪潮的蔓延,大模型的性能与参数不再是唯一的关注焦点,行业开始探索不同的落地场景,今年也被普遍视为AI应用落地元年。基于日日新5.5版本,商汤提炼出不同参数规模的模型,提供全面的企业级生成式AI解决方案,覆盖云端、本地数据中心和终端设备。
商汤的企业客户覆盖各行各业,其中既有京东、小米、金山办公等互联网公司,也包括三大运营商、吉利等车企、以清华为代表的高校、头部大模型创业公司等等。目前共有3000多家行业头部企业使用商汤大模型及智算服务,商汤财报指出,日日新整体调用量实现了400%的增长,用户数和用户平均调用规模均大幅增长。
商汤瞄准了金融、医疗、办公、智能硬件、电动汽车等垂类领域。基于“大装置+大模型”的先发优势,商汤已具备为各行各业的客户提供全面的生成式AI解决方案的能力。商汤正处于下一波增长的有利位置,未来的重要发力点就是找准客户需求,开拓丰富的落地场景。
今年4月,商汤与海通证券联合发布了首个面向金融行业的多模态全栈式大模型。通过双方的合作,商汤探索到金融行业中AI技术的落地场景,包括智能问答、合规风控、代码辅助、办公助手等业务领域,并打造了大模型驱动的智能问答助手及智能研发助手。
这款智能问答助手能够基于日日新5.0的强大语言理解和交互能力,叠加金融行业相关知识、法规条例及搜索引擎,为内部员工提供及时且高质的回答,极大地提升了工作效率。而智能研发助手则主要应用于辅助金融企业研发人员进行代码编程,在提高开发效率的同时,也能提升软件交付质量。
在与中国银行、宁波银行、上海银行等机构的合作中,商汤洞察到AI技术能够用于连接前端业务的用户,从而提升服务质量,甚至帮助跨越“数字鸿沟”。作为上海地区最大的养老金代发机构,上海银行发现许多60岁以上的老年用户在使用手机银行时会面临较高的门槛。为解决这一痛点,商汤通过“商汤如影SenseAvatar”AI数字人生成平台和商汤“商量”语言大模型,联合上海银行推出了“海小智”和“海小慧”两位AI数字员工。
在商汤“大装置+大模型”的加持下,这些AI数字员工经过了2000条问答数据和10万条语料数据的知识库训练。不仅拥有媲美真人的姿态和语气语调,还能够灵活应对各种知识互动和寒暄交流。在他们的帮助下,当老年人想要查询养老金时,现在只需向数字人询问即可得到名下相应账户选项,并通过其引导完成操作。
对于智能终端这一热门的AI落地场景,行业亟须的是推理速度与效率的提升,因此商汤采取了主推端侧小模型的打法。其日日新端侧大语言模型的推理速度达到了业内最快,可达每秒100字。在中端平台上,该模型能够实现18.3字/秒的平均生成速度,旗舰平台上可达78.3字/秒,而人眼最快的阅读速度为20字/秒。目前商汤端侧模型已落地手机、汽车、个人计算机、智能音箱等终端,服务小米、荣耀等企业在内的客户。
在AI 2.0时代下,商汤为赋能个体生产力,商汤基于其大语言模型打造了AI Native生产力系列工具小浣熊家族,包括代码助手和办公助手两款产品。这些Copilot助手类产品覆盖了软件开发、数据分析、编程教育诸多场景,旨在通过先进人工智能技术优化和提升工作效率。其用户群体既包括中国电信、金山办公等大型企业用户,也涵盖了数十万的个人用户和开发者。
徐立表示,“公司下一步产品和业务目标是:用得上,用得好,用得起。用得上,需要真正为客户创造价值。用得好,需要进入客户生产和流程中去。用得起,需要大幅降低训练、推理和部署成本。”
展望未来,在以实用为目标的价值导向下,商汤势必将会深入更多垂直行业,进一步拓展应用场景,释放AI技术的最大潜力。除了加大对前沿技术的研发投入,不断突破技术瓶颈,再辅以配套的大装置,商汤有望不断优化其AI解决方案,为企业创造更多价值,加速推动全行业向智能化时代迈进。