文|独角兽挖掘机
编辑|角叔
如果哪个大厂还没做大模型,应该都不好意思跟别人打招呼了。
年初ChatGPT横空出世,引爆了国内大模型的热情,各路资金蜂拥而入。其中以百度、阿里、华为、京东等为代表的互联网大厂更是重金押注、无一缺席。
“我最初以为AI是互联网10年不遇的机会,但现在,我觉得这是几百年不遇的,类似发明电的工业革命一样的机遇。”向来低调的马化腾也给了AI极高的评价。《中国人工智能大模型地图研究报告》显示,我国10亿参数规模以上的大模型已发布79个,“百模大战”一触即发。
世人皆知大模型香,但也知世上不需要这么多大模型。
在这场未来科技高地的攀岩中,最终能登顶,笑到最后的必然是寥寥无几,而大厂凭借着先天的资本、算力、大数据等优势,无疑是百模大战中的“种子队”。
本文盘点百度、华为、阿里、腾讯、京东、美团、字节、科大讯飞八家大厂的大模型特点,未来翘楚,应该有他们的一席之地。
01 百度文心一言:最硬核
国内大厂里,百度是最先交大模型作业的。
3月16日,百度发布了生成式AI产品文心一言,发布首日就有超60万人申请测试。
百度能成为第一个吃螃蟹的大厂,有赖于近些年在人工智能领域的深耕和积累。
早在2019年,百度就推出了知识增强的语义理解框架文心大模型,并广泛应用于阅读理解、情感分析等领域。人工智能已成为这家以搜索起家的科技企业的新标签。在大模型之前,百度在人工智能领域就在自动驾驶、智能云等多个领域进行了前瞻布局,拥有先发优势。
百度创始人李彦宏更是亲自下场,成为大模型的坚强拥趸:“科技创新驱动了大的增长。沿着这个思路,如果让我来判断第四次科技革命的标志,我认为是深度学习算法。”
当然,第一个关注度最高,被吐槽也不少,比如,文心一言刚上线,作为新生,在面对车水马龙、夫妻肺片这些内涵词时,理解能力还停留在字面意思,像车水马龙出现了“汽车+龙”的元素叠加图片。
不过在用户的反馈下,文心一言很快就学习到正确的理解和绘制方式,能绘制出车马成群结队、繁华热闹的“车水马龙”街景。
在IDC最新发布的《AI大模型技术能力评估报告,2023》中,百度文心大模型拿下12项指标的7个满分,综合评分第一,尤其是算法模型、通用能力等基础技术领跑全行业,算法模型获得唯一一个满分。
如果说,大模型对其他大厂来说多是副业,对All in人工智能的百度来说,是一号工程,这也让它拥有了最硬核的实力。
02 华为盘古:最被寄予厚望
作为在国际市场上最能扛的科技企业,华为在5g的强大让美国不得不穷尽各种手段来打压,在AI这个国际角逐的新战场,华为理所当然也被寄予厚望。
7月7日,在华为开发者大会2023上,华为云正式发布盘古大模型3.0。盘古大模型3.0是一个完全面向行业提供服务,以行业需求为基础设计的大模型体系,包括5+N+X三层架构。
华为盘古大模型早在2020年就启动研发,华为云CEO张平安表示希望用盘古大模型帮助各行各业,例如在金融、政务、矿山、气象等行业,在产品研发、生产供应链、市场营销以及数字运作领域,让盘古大模型为他们赋能。
从华为的策略来看,虽然国内外C端的大模型声量大,但华为还是做自己擅长的B端市场,并且已经进入实操阶段。7月18日,华为联合山东能源集团举行发布会,宣布华为盘古大模型在矿山领域实现首次商用。
从通信网络设备到5G手机、智能驾驶,华为都展现了其强大的科技底蕴和技术实力,在AI领域,华为自然也承担着更高的期望。
03 京东灵犀:最懂产业
7月13日,在2023京东全球科技探索者大会暨京东云峰会上,京东正式推出灵犀大模型。
与其他通用大模型相比,京东灵犀可谓是“从产业中来,到服务产业中去”,融合了70%通用数据与30%数智供应链原生数据,具有“更高产业属性、更强泛化能力、更多安全保障”的优势,深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景,解决真实产业问题。
对于大模型价值的思考,京东也提出了自己的独到见解:大模型的价值=算法×算力×数据×产业厚度的平方。
京东CEO许冉认为,前三个指标固然重要,但技术在产业场景落地应用,创造实际价值才是关键。当产业效率和产业的边界拓展得到质的提升以后,大模型才有了更重要的实际价值和意义,这将不亚于又一次工业革命。
从京东的发展史来看,产业早已融入京东的基因和血脉中,从产业场景切入做大模型,做的也是京东非常擅长的领域,训练出的大模型天然具备“产业基因”。
04 阿里通义千问:最强算力
4月11日,阿里云宣布推出大语言模型“通义千问”,并表示包括天猫、钉钉、高德地图、淘宝、优酷、盒马等阿里巴巴所有产品,未来都将接入“通义千问”大模型全面改造。
阿里云总裁张勇谈到阿里云战略的核心,表示未来要做好两件事情——让算力更普惠、让AI更普及。其中的算力是阿里做大模型的核心竞争力。
大模型背后的海量数据,需要有强大的算力作为支持。某种程度上,大模型之争说到底也是云服务之争、是算力之争。
在数字基础设施,阿里云拥有国内最强的智能算力储备,阿里云的智算集群可支持最大十万卡GPU规模,承载多个万亿参数大模型同时在线训练,为大规模AI集群提供无拥塞通讯的自研RDMA网络架构和低成本高可靠的高性能存储CPFS。
在国际权威机构Gartner榜单中,阿里云是亚洲第一、全球第三的云计算服务商。在2021年底Gartner对云厂商整体能力评估中,阿里云IaaS基础设施能力拿下全球第一,在计算、存储、网络、安全四项核心评比中均斩获最高分。
05 腾讯混元助手:最擅社交
作为初代互联网BAT三巨头之一,腾讯在大模型领域上表现得比较内敛。
去年 4 月,腾讯首次对外披露了混元 AI 大模型的研发进展,这是一个包含 CV(计算机视觉)、NLP(自然语言处理)、多模态内容理解、文案生成、文生视频等方向的超大规模 AI 智能模型。
今年 2 月底,在 ChatGPT热潮下,腾讯也被曝出成立了混元助手项目组,这个项目组将联合腾讯内部多方团队构建大参数语言模型。
千呼万唤始出来,6月19日,在行业大模型及智能应用技术峰会上,腾讯第一次公布了腾讯云行业大模型的研发进展,围绕B端需求,腾讯反复强调大模型是为“具体场景设计的具体应用”。
没有哪家大厂比腾讯更懂社交,凭借着庞大的用户基数和强大的技术实力,腾讯在大语言模型AI的布局,尤其是类ChatGPT聊天机器人,有着别人无法比拟的优势。
对于腾讯的聊天机器人是集成到QQ、微信,还是通过腾讯云向B端用户服务,腾讯云与智慧产业事业群CEO汤道生表示:“都会有。”
06 美团光年之外:最命运多舛
光年之外由美团联合创始人王慧文在今年2月创立,彼时王慧文已经处于“退休”状态,大模型让他重燃了创业激情。肩负起打造“中国OpenAI”的使命。
在短短两个月时间里,光年之外吸引了众多人工智能领域顶级专家和创业者的加入,完成了以产品和技术人才为主的团队搭建。
王慧文自带的创业成功者光环,还有王兴以个人身份投资的加持,光年之外从成立第一天起,就站在了聚光灯下,成为大模型赛道里的初创企业的明星。然而,出师未捷身先伤,雄心勃勃的王慧文出现个人健康原因,不得不离岗就医。
群龙无首之时,王兴出手了。6月29日,美团的一纸公告宣布完成光年之外境内外主体100%股权的收购,收购价约为20.65亿人民币。
从这笔收购来看,既帮助了兄弟,又增强了美团的大模型实力。
王兴与王慧文是清华上下铺的室友,从携手创办校内网到美团,两人从同窗到创业伙伴,成就了彼此。另外,美团自身也有做大模型的需求,通过这次收购,美团获得领先的AGI技术及人才,可以加强其于快速增长的人工智能行业中的竞争力。
虽然有些命运多舛,但最后的归宿还是很不错。
07 科大讯飞讯飞星火:最有学问
4月24日,科大讯飞星火认知大模型官网正式上线。
作为AI语音龙头,讯飞星火认知大模型围绕“知识问答、代码编程、数理推算、创意联想、语言翻译”等场景布局。
上线一个月后,讯飞星火认知大模型各项能力持续提升,且在综合能力上实现三大升级:开放式知识问答取得突破,多轮对话、逻辑和数学能力再升级。拥有如此强大的学习能力,也让讯飞星火的“学问”越来越大。
在应用落地上,科大讯飞重点是推动星火认知在教育、医疗、工业、办公等领域落地。比如,在教育领域,科大讯飞已经在学习机上尝到甜头,在星火大模型与教育垂直场景的深度融合下,有望广泛应用于教师备授课、作文批阅、学生语言学习、心理健康监测等常见场景。
凭借着AI语音和知识问答上的优势,讯飞星火在定位上,可能是与ChatGPT最接近的大模型。
08 字节火山方舟:最低调
当其他大厂一把手挂帅亲自站台,对大模型不吝赞美之词时,已与BAT平起平坐的字节却相对低调得多。
直到6月28日,字节跳动公布了大模型业务最新进展,在火山引擎主办、英伟达合作举办的“V-Tech体验创新科技峰会”上,火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务。
集成多个大模型,供客户直接对比,火山方舟避开烽火连天的大模型大战,选择做大模型服务平台,以卖水者身份杀入大模型赛道。
选择这条路,字节也有自己的考量,与其他大厂布局多年对比,字节虽然在算力、算法等AI基础设置上不逊色,但还是慢了一拍,字节语言大模型团队今年初才成立。
在没有先发优势的情况下,又不想缺席大模型盛宴,选择为大模型客户提供算力AI基础设施,帮助做好大模型开发,这样的另辟蹊径也不失为理智的选择。