更多精彩 >

蒋晓维:从数据中心网络与存储硬件加速发展,看DPU发展的必然性

2022-09-09 12:10:07   来源:投资家网专栏  作者:大禹智芯 

摘要:目前,业界盛行“摩尔定律终结”的说法。

目前,业界盛行“摩尔定律终结”的说法。那么,“摩尔定律终结”对 CPU到底意味着什么?大禹智芯首席科学家、IEEE国际顶会HPCA名人堂成员蒋晓维博士在2022年8月25日于南京举办的首届全国博士后青年科技人才扬子江论坛上做了《数据中心的网络与存储硬件加速》的报告分享,探讨了数据中心在后摩尔定律下的网络性能提升与加速方案等话题,以下为演讲报告观点整理:

摩尔定律趋近极限

网络性能提升“捉襟见肘”

回顾过去CPU的发展历程可以看到,主流CPU的晶体管数量印证了摩尔定律的发展。在CPU发展的初期,芯片频率的增长以及 CPU 的微架构技术创新主导了CPU单线程性能的逐代提升。每18个月翻一番的晶体管在过去30年当中一直被CPU的各种技术所运用,从而提供了CPU持续不断的性能增长。

然而,CPU单位面积上可集成的元器件数量总会达到极限,更高级的工艺制程,则意味着物理和投入产出比的双重挑战。2002 年之后,CPU芯片频率逐代提升的趋势基本截止;2004年之后,单核心很难再有每代大幅度的提升,对CPU性能的评判指标也逐渐从单线程性能向CPU的核数量转变;到2012年后,多核的增长趋势也逐渐放缓;而从2016年开始,摩尔定律终结的各种声音此起彼落,摩尔定律趋近极限,而大型互联网公司应用场景却日趋纷繁复杂,CPU显得不堪重负,专用计算芯片接二连三出现,专用计算芯片与CPU的数据交互越发频繁,数据中心的网络I/O带宽也因此需要不断提高。

事实上,数据中心的网络I/O带宽也确实在近十年里经历着大幅度的增长。目前,大型互联网公司数据中心的内部网络流量已经达到了10kTb/s 的量级;服务器的主机网络接入口速率也在不断增长,从早年的1Gbps到2012年的10Gbps,再到2016年的25Gbps或40Gbps,至目前主流大型互联网公司内部网络接口达100Gbps,并向200Gbps迈进。同时,伴随数据中心网络的增长,数据中心网络自身转发的延时也在不断下降,从原来的毫秒级到如今的微秒级,未来甚至向近纳秒级迈进,这对CPU处理网络数据的时效性提出更高要求。

走向可编程的硬件卸载

DPU呼之欲出

在后摩尔时代,数据中心I/O带宽不断增长,同时多样的应用也对数据中心网络延迟提出越来越严苛的要求,因此需要一套标准进行衡量以保证数据中心的网络质量。

蒋晓维博士认为,衡量数据中心的网络质量有四个维度:高性能、稳定性、可编程性和安全性。随后,他分别阐述了四个维度的衡量标准及可行的技术实现方式。在高性能方面,由于数据中心主机侧所面临的网络处理压力不断增长,延迟方面则是由毫秒级逐渐走向微秒级别,单个报文留给主机软件代码来处理的时间越来越短,这导致主机网络的软件栈从内核态走向内核旁路再走向硬件卸载;稳定性方面,即包含对网络故障的处理、转发的稳定性及本身软硬件的稳定;可编程性方面,指的是在各种硬件加速之后,因硬件芯片无法像软件一样进行全面编程,而数据中心主机网络所需要支持的业务场景多样且多变,核心技术就在于要周全考虑如何让硬件能够很好地去支撑业务所需要的不断迭代;而安全性方面,全面实现东西向流量防护是极为有效的手段。

以CPU为中心的传统云计算体系架构在某些情况下,可能60%以上的CPU 资源都会完全分给网络层面的处理,使得应用层能分配的CPU 资源反而捉襟见肘。为了保证数据中心的网络质量,使网络延迟进一步下降,用来释放CPU资源的更硬核的硬件卸载出现。蒋晓维博士以国内外大型云计算公司为例,阐述了各公司在不同时期采用的不同卸载方式。最后,蒋晓维博士指出,软件定义的、可编程的硬件卸载是真正意义上的卸载,指的是客户基于自身软件业务而实现相对应的硬件卸载方案。DPU不仅能够实现数据面的卸载,同时能够运行控制面程序,对转发面和控制面均有极强的可编程能力,能够实现定制化功能。从这个意义上,蒋晓维博士认为,DPU在实际的部署中已经成为与CPU并列的同等节点。

DPU:从公有云业务而来,

向更广泛场景拓展

在谈及一颗完备的DPU芯片定义时,蒋晓维博士介绍,DPU首先包含一个服务器级CPU子系统,能为数据中心的基础软件来提供卸载;同时,DPU也提供与网络存储相关的硬件加速引擎及一些计算业务调度功能,并全面实现网络、存储和计算解耦。目前,DPU的功能已逐渐稳定,其关键功能包括网络、存储、安全、高性能 IO 以及inline 加速等方面。

DPU 的设计实际上是一种典型软硬一体化的设计思路。首先,DPU上承载的各种卸载以及硬件加速,本身就是由现有的数据中心中的底层软件而来,而硬件部分的加速也需要经过软硬一体化的设计来进行拆分;其次,涉及DPU业务的公司除了生产硬件产品外,也重兵投入来打造用以适配上层的软件系统以及底层DPU硬件的一体化的SDK。

作为最早涉足DPU领域技术钻研和产品打磨的业界先行者,蒋晓维博士对DPU的发展阶段进行了回顾和展望。DPU的发展有三个阶段:第一个阶段即云厂商对DPU支持功能的探索,并逐渐完成在大型互联网公司的成功部署。第二个阶段即随着DPU在大型互联网公司的成功部署,DPU的功能逐渐趋向稳定,外部DPU公司根据自身理解对DPU产品进行定制化设计和探索。第三阶段,DPU将全面通过硬件可编程能力来适配数据中心底层软件的迭代,DPU将不再局限于大型互联网公司,而将更多由外部的DPU芯片公司来承担,所承载的用户也会向更多并不具备芯片设计能力的企业级用户扩展,同时将从数据中心走向其他更多应用场景,如边缘计算、5G、网络安全等。


潮玩撬动资本新局!投资大师岳彬与影石刘靖康泡泡玛特互赠,点燃投资圈破界狂潮

上市公司影石创新

当科创板的钟声激荡起创新的号角,一场足以载入商业史册的跨界互动,正以颠覆性的姿态重新定义投资圈的交流...

1天前

一战封神!神秘大佬命中暴涨30倍牛股泡泡玛特反哺公益献爱心!

上市公司泡泡玛特

在投资界,有一位神秘大佬如传奇般存在,他就是“全球第一策略”的开创者,国岳集团董事长岳彬。

1天前

中国移动联合乐聚发布业界首款5G-A人形机器人

创新创业中国移动

6 月 18 日, 被誉为「全球移动通信行业发展风向标」的 2025 世界移动通信大会在上海举行。

1天前

新财富金牌董秘荣耀加冕!第23届“新财富最佳分析师”评选启动

创新创业新财富

6月18日,由新财富主办的“新质引领 芙蓉绽放”新财富上市公司可持续发展年会暨第二十一届新财富金牌董...

1天前

原创

神旗数码签约上海仪电,助力智算基础设施服务升级

神旗数码

日前,神旗数码有限公司旗下神州一诺与上海仪电集团全资子公司上海埃迪希科技服务有限公司签署合作协议。

1天前

百惠金控:亚洲首批个股杠杆及反向产品 助国际金融中心地位稳固

金融科技百惠金控

百惠金控分析,香港交易所的 ETP 市场(涵盖 ETF 以及杠杆及反向产品)近年来发展迅猛,已成为港...

1天前

原创

2025渣打中国企业峰会圆满举办

创新创业渣打中国企业峰会

6月5日,2025渣打中国企业峰会在上海盛大举行。

1天前

珠免集团(600185.SH):从“买得到”到“逛得好”,珠海免税正在这样变

上市公司珠免集团

作为链接港澳的重要枢纽,珠海各口岸正深度融入这片流动的热土与澎湃的消费热情之中。

1天前

CS Global Partners发布《2025世界公民报告》深度探讨全球变局与人类处境

创新创业世界公民报告

作为针对全球公民所面临最紧迫问题的权威分析,《世界公民报告》始终是该领域的标杆性研究成果。

1天前

浩鲸科技在2025MWC上海推出中企出海全栈支撑能力

创新创业浩鲸科技

浩鲸科技在2025MWC上海推出中企出海全栈支撑能力

1天前

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

分化浪潮中的坚守与突破 | 第19届中国投资年会,即将启幕

分化浪潮中的坚守与突破 | 第19届中国投资年会,即将启幕

在时代的浩渺长河中,“分化”宛如一条隐匿的脉络,贯穿于万物的生长、发展与变迁。从生命的进化到文明的演...

第二届中匈可再生能源、新材料商业投资峰会将盛大启幕

第二届中匈可再生能源、新材料商业投资峰会将盛大启幕

第二届中匈可再生能源、新材料商业投资峰会于2025年4月9日在匈牙利布达佩斯盛大启幕。

雕刻耐心|第18届中国投资年会·有限合伙人峰会在沪召开

雕刻耐心|第18届中国投资年会·有限合伙人峰会在沪召开

“中国投资年会”作为私募股权行业的年度盛会,已成功举办了18届,吸引了全国VC/PE领域从业者的广泛...