AI智能助理从营销战卷到价格战,腾讯终于要下场了

腾讯将在5月30日发布基于混元大模型、面向C端的App“腾讯元宝”。

图片来源:视觉中国

中国市值最高的互联网公司腾讯,在AI赛道向来显得有些不紧不慢。腾讯CEO马化腾去年曾说,AI是百年不遇的机遇,腾讯不急于早早展示半成品。

但过去一周,国内外AI大模型的战场越来越激烈。先是OpenAI和谷歌前后脚推出旗下产品的更新,字节跳动又于周三发布豆包大模型,率先打响国内大模型行业价格战。

腾讯也被卷入这一队列。在5月17日举办的腾讯云生成式AI产业应用峰会上,腾讯公布了一系列关于混元大模型的进展,在大模型落地方面进一步提速。

大模型若只提供API无法满足客户需求

据腾讯集团副总裁蒋杰在活动上介绍,升级后的混元大模型采用混合专家模型 (MoE) 结构,目前整体性能居国内第一梯队,部分中文能力已追平GPT-4。相比于上一代,其总体性能提升了50%,在回答“时新”问题的表现、数学及推理等能力上均有较大提升。

腾讯表示,混元大模型文生图模型采用DiT架构,与OpenAI旗下Sora的架构一致。在生视频领域,混元能够实现文生视频、图生视频、图文生视频、视频生视频等多种方式,支持生成16秒的视频,预计到今年Q3推出的下一代文生视频模型能够突破30秒的时长。腾讯还布局了文/图生3D领域,单图仅需30秒即可生成3D模型。

近来国内外科技巨头动作频频,多模态能力成为AI之战的焦点。上周,OpenAI宣称新发布的GPT-4o是其第一个结合文本、视觉和音频模式的模型,增加了语音功能,能够实现更自然实时的交互。而谷歌紧接着公布了仍在开发中的AI助手Project Astra,据称是具有“高级视觉和说话响应的智能体”,甚至拥有视觉记忆能力。

腾讯云副总裁、腾讯云智能负责人吴运声在会后采访中表示,将视觉、音频及文本三种模态相互融合、直接实现端到端的输入输出是未来技术发展的趋势,会带来商业化的跨越式增长,具有广阔的前景。腾讯也在进行类似的研究,但三种模态的特征形态存在差异,还需要解决算法和技术上的难点。

在活动上,腾讯还宣布将在第三季度开源最核心的文生文模型。5月14日,混元文生图模型宣布对外开源,在AI开源平台Hugging Face及代码托管平台Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。腾讯透露,文生图模型开源仅3天时间,在Github上就获得了超千位开发者关注。

自今年2月马斯克起诉OpenAI公司及其高管,要求OpenAI恢复开源后,AI大模型开闭源之争日渐白热化。在国外,OpenAI坚定地站在闭源的阵营里,Facebook母公司Meta则刚刚发布了被称为史上最强开源AI模型的Llama 3。

而在国内,百度CEO李彦宏曾在不久前断言“开源模型会越来越落后”,举起闭源的大旗。与腾讯类似,阿里巴巴也在积极推动开源,本月初还开源了通义千问1100亿参数模型。更多的公司采取部分开源的策略,将更高参数量的模型闭源。

腾讯最终加入了开源的行列。混元模型应用负责人张锋在会后采访时称,在与客户接触的过程中,腾讯发现很多场景需要私有化部署,只提供API的方式无法满足客户需求。他还表示,“有好东西,要贡献给中国企业和个人开发者。”

腾讯的C端大模型产品终于来了

在推出混元大模型应用时,腾讯通常会先聚焦于内部业务,再考虑对外部开放。据腾讯的数据,目前混元大模型已在600多个内部业务和场景中落地测试,包括腾讯会议、腾讯文档、企业微信等。

但今年,腾讯在对外输出大模型能力上动作更为密集,已在金融、医疗、教育、汽车、能源等20多个行业落地。

“与很多大模型厂商不同,腾讯始终以‘产业实用’,作为我们发展大模型的核心战略。”腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生在活动上表示,“大模型的打造只是起点,把技术落地到产业场景、创造价值才是目标。”

腾讯云在大会上推出了三款PaaS产品:大模型知识引擎、图像创作引擎和视频创作引擎,旨在解决企业对大模型多模态能力、简易高效的需求。

在ToC方面,除了上线AI智能体平台外,腾讯还宣布将在5月30日发布基于混元大模型、面向C端的App“腾讯元宝”。混元模型应用负责人张锋介绍称,过去混元只有PC和小程序,计划推出的元宝具备翻译、口语陪练等能力,能够更好地满足AI搜索、提炼及获取信息等日常生活需求。

而腾讯在移动互联网时代的老对手字节跳动大有复现“App工厂”的野心,在C端产品上的发力不容小觑。基于自研的豆包大模型,字节打造了产品矩阵,推出了AI对话助手“豆包”、AI应用开发平台“扣子”、互动娱乐应用“猫箱”,以及星绘、即梦等AI创作工具。

字节也盯上了B端用户,5月15日正式发布豆包大模型,希望以行业最低价吸引企业用户。据字节旗下火山引擎介绍,主力模型的市场定价为0.0008元/千Tokens,比行业便宜99.3%。相较而言,OpenAI的GPT-4为0.42元/千Tokens,百度文心一言和阿里通义千问为0.12元/千Tokens。

对于AI大模型行业是否将卷起新一轮价格战的说法,腾讯云副总裁、腾讯云智能负责人吴运声回应称,腾讯将大量的精力集中在提高底层的大模型能力和在生产环境中的实际应用上。目前一切都处于快速迭代的过程中,腾讯的关注重心仍会放在产品和技术能力的发展上。

除了字节、百度、阿里等大厂之外,智谱AI、月之暗面、Minimax等中国明星AI公司也早已推出了基于各自大模型的智能助手产品,正在大打营销战。

目前的C端AI市场一日千里。如果说一年前腾讯还能慢慢地打磨技术,想要拿出完美的产品来一鸣惊人,那么到了今天,市场形势变化莫测,留给腾讯的时间已经不多了。