三年前,张霁从华中科技大学博士毕业,以“天才少年”计划身份加入华为,引起全网瞩目。人们惊叹其年纪轻轻就取得如此亮眼的成绩,也被其从普通三本到华科博士,再到突破一系列前沿科研成果的经历所振奋。
加入华为后,张霁扎根AI存储架构研究,发表多篇顶级论文与专利,并已在华为数据存储产品中落地。如今,大模型变得火爆,作为华为苏黎世研究所存储首席科学家,张霁带领他的团队站在AI浪潮的前沿,又一次成为新科技时代的弄潮儿。
近日,华为发布两款大模型时代的AI存储新产品,旨在为基础模型训练、行业模型训练、细分场景模型训练推理提供存储最优解,释放AI新动能。
“存储系统是关键基础设施,我们希望客户借此能够高效快捷地把AI大模型用起来,从而在不同行业里发挥价值。”张霁告诉记者。
大模型时代凸显四大挑战
今年1、2月,ChatGPT全球火爆,面对这一新智能时代的到来,身在国外的张霁思考的课题是,如何进一步优化数据存储,“存储系统作为IT基础设施,要面向各种各样的应用,包括高性能计算(HPC)、科学计算、人工智能等,我们希望提供更高效的存储,让上层应用的并发、带宽以及数据的读取能够更快。同时也希望我们的存储系统变得更加智能,更好地支撑一些AI应用。”
这种研发方向和十年前存储系统扮演的角色有所不同。张霁介绍称,以前大家对存储系统的理解只关心其能不能把数据存储好。但是现阶段和以后,还应更关注应用和数据的价值。
为了抢抓新科技时代机遇,上半年国内头部厂商纷纷投入建设大模型,行业内出现“百模大战”的势头。张霁也带领团队做了很多相关的事情,比如把大模型内部运转原理完全打开,一步一步去分析其生产过程当中与存储系统之间的交互。
在张霁看来,产业机会更多还是针对不同垂直领域的大模型,“因为无法直接用通用大模型去造福千行百业。”同时,行业内现在更多考虑大模型如何训练地更快,而如何保证数据安全以及降低中小企业使用门槛也成了亟待解决的问题。他还提到,当前大模型主要是单一数据方式即文本,长期来看,如何纳入更多包括图片、视频等在内的非结构化数据,让其真正变成一个“万物皆可做预测”的大模型,也是需要不断创新和研究的方向。
华为公司副总裁、数据存储产品线总裁周跃峰博士介绍称,以存力和算力为中心的大模型时代凸显四大挑战,包括数据归集慢,数据预处理周期长,训练集加载慢;训练易中断,数据恢复时间长,以及企业实施门槛高。
面向大模型的AI存储新品
面对上述挑战,华为针对不同行业、不同场景的大模型应用,在本次发布会上推出OceanStor A310深度学习数据湖存储与FusionCube A3000训/推超融合一体机。
据介绍,OceanStor A310深度学习数据湖存储,面向基础/行业大模型数据湖场景,实现从数据归集、预处理到模型训练、推理应用的AI全流程海量数据管理。FusionCube A3000训/推超融合一体机,面向行业大模型训练/推理场景,针对百亿级模型应用,集成OceanStor A300高性能存储节点、训/推节点、交换设备、AI平台软件与管理运维软件,为大模型伙伴提供拎包入住式的部署体验,实现一站式交付。
张霁也在发布会现场分享了团队在大模型方面一些最新的研究成果。他提到,AI大模型与前些年非常火爆的深度学习相比,除了模型本身发生一些变化以外,最大的特点就是数据量变得更大,因此高质量数据非常重要。
同时在模型训练过程中很多企业也非常关注数据安全问题。“数据存储恰恰是数据安全的最后一道防线。AI大模型的第一个阶段就是数据归集,企业如何能够安全地把这些数据从不同地点、不同节点归集到一个地方,具有非常大的挑战。我们正在研究一种“数据方舱”技术。原理就是在数据流转过程中把相关凭证、隐私、权限等信息跟数据放在一起进行流转。当这些数据到达了数据归集地之后,都在这个方舱当中安全地执行和保护,从而做到数据的极致安全。”
此外,对于企业接入AI的难度问题,张霁介绍称,企业快速接入AI大模型现在一般有两种方式,第一种方式是在基础大模型上做二次训练,但是这种方式对GPU的消耗非常高,因此带来的成本就会非常高。而且最关键的是需要有专人去维护所在垂直专业领域的知识,非常耗时耗力。第二种方式得益于“万物皆向量”的理念,他和团队也在面向AI大模型研究向量存储技术。“向量存储技术类似于AI大模型外挂一个存储,我们可以把企业最新垂直化的数据向量化进行存储和检索,从而大幅度去降低企业接入和使用AI大模型的难度。”
存储已经不仅是简单的存和取
三年前张霁入选华为“天才少年”计划时,当时也有国外企业给他开出更高的年薪,但是张霁最终还是选择了华为。他曾表示,想通过这一平台帮助国产相关技术提升国际竞争力。
在华为工作期间,张霁致力于围绕数据存储产品和技术的攻关。去年10月,他去往海外,开始在瑞士苏黎世研究所工作,通过和当地团队以及欧洲高校的协同,研究如何围绕新的应用场景牵引整个存储体系结构的创新和变革。
(图注:张霁及其团队与苏黎世联邦理工大学Onur Mutlu教授等顶尖科学家们开展研究与合作)
持续接触和学习新知,和各个领域的前沿专家学者打交道,在头部平台上努力科研攻关,张霁的生活颇为充实,适应了现在的工作节奏,个人技术和能力也在不断提高。“这和我当初选择华为的意愿还是比较高度匹配的。”在张霁看来,“华为是一家以技术为中心的公司,有自己的技术追求。”比起当初求学阶段的知识钻研,现在的工作也让他更加深刻理解了技术的应用和商业化前景。
在研发新技术产品过程中,张霁和团队也申请了很多国内外专利,发表多篇顶级论文,并在产品中商用落地,这也正符合他当初加入华为的初心。
谈及对未来存储前沿技术方向的思考,张霁表示,在冯·诺依曼的体系结构中,核心理念是以CPU为中心,存储则作为一种外置的设备存在,在那种架构下,用户更多需要存储能支持更高的IO读写。但面向未来,存储可能已经不仅仅是简单的存和取,如何用好数据发挥其真正的价值非常关键。“假设能够在存储这一侧做一些简单的计算、搜索和聚类工作,就能够极大降低CPU的消耗。”而这也会成为张霁和团队接下来持续攻关努力的方向。