文|半导体产业纵横
近日,清华大学集成电路学院院长吴华强教授,对于Chiplet技术发展趋势进行展望。他表示Chiplet技术发展现状暗流涌动,机遇丛生。Chiplet不是单一技术,而是一系列关键先进技术的有机融合。这是一个战略赛道,我们需要凝聚共识,抓住重大创新机遇。
在演讲中我们拿到了很多的信息:
Chiplet技术是通向高算力芯片的必经之路,国际领先的高算力芯片都采用了芯粒技术;
AI时代Chiplet市场规模加速扩张;
Chiplet技术发展将在六大方面持续创新;
Chiplet是战略赛道;
算力是数字经济时代的新质生产力。ChatGPT等AI大模型的爆发刺激了对算力的需求,对算力的需求每两个月增加一倍。2023年3月15日,OpenAl发布ChatGPT-4、具备1.8万亿的模型参数,训练需要上万张Nvidia H100显卡,计算量约为2.15e25FLOPS。
传统单片集成算力芯片面临面积墙、存储墙、成本墙、功耗墙等瓶颈,难以持续。吴华强说到:“Chiplet不是未来时而是现在时。Chiplet技术是通向高算力芯片的必经之路。”
国际领先的高算力芯片都采用了芯粒技术。如英伟达发布B200 GPU,在算力上实现巨大的代际飞跃基于台积电的N4P制程工艺,晶体管数量达到了2080亿个,配备192GB HBM3e内存。
AI时代Chiplet市场规模正在加速扩张。全球已经安装了价值约1万亿美元的数据中心,而这个上万亿美元的数据中心市场正在从通用计算向加速计算和生成式人工智能转型,一个新的计算时代已经开启。
与此同时,Chiplet技术的应用领域也在逐渐扩大。Chiplet技术继GPU等云端高算力芯片之后,在桌面市场的AIPC(CPU+AI)领域显示出其价值。AMD 在Computex2024大会上发布了当时世界上最快的桌面CPU芯片HR9 9950X采用了Chiplet技术;英特尔公布下一代面向AI PC的移动处理器Lunar Lake,将会混合封装台积电 N3B 工艺和自家Intel18A 工艺的芯粒。
吴华强表示,Chiplet不是单一技术,而是一系列关键先进技术的有机融合,形成了涵盖从顶层架构到底层器件的全新技术体系。从上图中可以看到,包括了接口标准与生态、互联技术、电源技术、计算体系架构、存储技术、先进封装集成等技术。
01 Chiplet关键技术发展趋势:先进封装集成
Chiplet关键技术发展趋势之一是先进封装集成。
多种封装技术组合,集成密度持续提升,提供更高的IO密度(IO/mm)和更好的能效(pJ/bit)。比如铜铜键合将Bump间距从50um降低到5um;硅转接板技术将基板线间距从15um降低到1um,密度大幅度提升。先进封装集成技术发展路线图显示,到2030年能够达到:亚微米pitch、10+层RDL、D2D键合。因此这个领域将来对于设备材料都有很多创新,孕育了许多新机会。
从封装技术来看,扇出型封装,无TSV结构的工艺,制造成本低封装体厚度小。硅桥技术非常重要,英特尔的封装基板硅桥和台积电的扇出型硅桥,使用小尺寸硅桥替代大面积硅转接板实现芯片间高密度、高带宽互连,总制造成本降低、硅工艺复杂性降低,集成复杂性增大。
02 Chiplet关键技术发展趋势:存储技术
存储在Chiplet发展中绕不开的话题。吴华强表示,Chiplet关键技术发展另一趋势是存储技术(HBM)。先进封装集成技术带来更高的存储密度、带宽和更高的能效。
以前双列直插内存模块,传输能效是12pJ/bit,到了HBM3可以达到3.5pJ/bit,未来正在规划中的HBM4能效更是能够达到0.2pJ/bit,再降一个数量级。今年9月,台积电与三星宣布合作研发新一代无缓存HBM4内存技术,用于高算力AI芯片无缓存HBM4技术将会在现有HBM4内存上提升40%的能效,降低10%的延时。
同时,存储技术方面存算一体也孕育而生。存内计算(Processing-in-memory,PIM)PIM-HBM架构,将处理单元嵌入HBM的逻辑库中,以减少互连的能耗和延迟,可以实现较低的DRAM访问成本。
03 Chiplet关键技术发展趋势:互联技术
互联技术的趋势是短距、长距、串口、并口、电口、光口等多种互联技术体制融合,满足全场景芯粒互联的带宽、密度和能效要求。
今年,台积电用于芯粒互连的高速并行接口,使用5nm FinFET工艺,基于9um pitch的3D封装,实现了0.296pJ/bit能效,17.9Tb/s/mm2的带宽密度;博通交付了业界首个51.2-Tbps的Co-Packaged Optics以太网开关,使用光互连技术,相比传统光模块功耗降低了70%,芯片面积效率提升了8倍。
04 Chiplet关键技术发展趋势:电源技术
电源技术的趋势则是,传统功率转换架构无法应对高性能计算芯粒的严峻挑战,“功率即性能”。功率是性能,电压不稳定会对计算产生很大影响。分布式功率器件集群创新架构、分布式多场管理技术、快速电源响应技术具备巨大潜力。Chiplet开辟了许多技术创新之路。
05 Chiplet关键技术发展趋势:计算体系架构
计算架构的发展趋势是可扩展的异构架构、标准化接口,朝适应于Chiplet技术的计算体系架构演进。而且计算体系架构的分析需要专门的仿真模拟工具,没有这样的工具很难分析整个系统的性能。
英特尔的异构芯粒处理器,采用一种“新型柔性拼接架构”,由四个异构芯粒(GPU块,SoC块、IO块和CPU块)通过一个basedie连接而成。实现了可扩展的异构处理器系统框架,标准化的接口,但是仅能做到对固定功能单元的参数化扩展。
AMD的混合封装高算力AI芯片,按照:4个lO die+8个计算 die+HBM3,3D混合键合+2.5D 硅转接板的封装,实现了可扩展的多芯粒(同构)集成方案,以IOD为枢纽和扩展接口。吴华强说到:“英特尔和AMD的架构体系与英伟达有所不同,这非常有意思。大型玩家开始采用不同的技术路线。”
06 Chiplet关键技术发展趋势:接口标准与生态
这方面的趋势在于,芯粒标准再进化,UCle各级成员不断推出基于其标准的产品,生态建设进展迅速。
标准方面,8月6日,UCle联盟发布 2.0规范,包含以下亮点:全面支持具有多个芯片的任何系统级封装 (SiP)结构的可管理性、调试和测试;支持3D封装,显著提升带宽密度和功率效率;改进的系统级解决方案,其可管理性被定义为芯片堆栈的一部分;针对互操作性和合规性测试优化的封装设计;完全向后兼容 UCle 1.1 和 UCle 1.0。近日,AMD、博通、思科等八家公司宣布为人工智能数据中心的网络制定新的互联技术开放标准UALink(UltAccelerator Link)以打破Nvidia的垄断。
产品方面,去年9月,英特尔展示了全球首款基于UCle 连接的Chiplet处理器测试芯片Pike Creek;今年7月,Alphawave Semi最新研发出业界首款3nm Ucle芯粒,该芯粒组面向超大规模数据中心、HPC和AI等高需求领域;是德科技推出的Chiplet PHY Designer是EDA行业首款针对UCle标准的仿真解决方案。
展望未来,Chiplet技术将持续创新,不断自我迭代。先进封装技术不断升级,从uBump→TSV→W2W bonding→D2D bonding;存储不断创新,从HBM2→HBM2E→HBM3 →HBM3E →HBM4。
多个国家和地区在Chiplet技术上的竞争将愈演愈烈。美国国家半导体技术中心(NSTC)发布《战略蓝图》,建立Chiplet计划,以实现开放创新的Chiplet市场英特尔牵头成立UCle联盟,推动Chiplet技术标准化、生态化。
韩国三星提出高级代工生态系统(SAFE),与合作伙伴建立合作生态系统,实现“一站式 Chiplet 封装”,开发2.5D/3D先进封参考设计流程。
中国台湾台积电发起3D Fabric 联盟,联合产业上下游企业提供全流程的服务,定义PDK和接口标准、参考设计流程。
总而言之,Chiplet技术发展现状是暗流涌动,机遇丛生。Chiplet技术将在先进封装集成、互联接口、存储技术、电源技术、计算体系架构、接口标准与生态等方面持续创新,不断自我迭代,推动芯片算力持续提升。
吴华强说到:“Chiplet是一个战略赛道,我们需要凝聚共识,抓住重大创新机遇。”