创新服务器系统设计 浪潮信息发布融合架构3.0

发布时间: 2023-08-21 信息来源: 浏览:800次

   “日前,在第五届OCP China Day 2023(开放计较中国手艺峰会)上,海潮信息正式推出融会架构3.0原型系统,以首创性的系统架构设计实现了计较资本、存储资本、内存资本、异构加快资本等焦点IT资本完全解耦与池化,撑持池化资本异步进级、撑持细粒度多主机同享高并发存储、亚微秒级远端内存同享拜候等特征,可经由过程软件界说实现"一套系统,N类利用",有用减缓当前数据中间 "内存墙"、"I/O墙"、"功耗墙"等瓶颈。

日前,在第五届OCP China Day 2023(开放计较中国手艺峰会)上,海潮信息正式推出融会架构3.0原型系统,以首创性的系统架构设计实现了计较资本、存储资本、内存资本、异构加快资本等焦点IT资本完全解耦与池化,撑持池化资本异步进级、撑持细粒度多主机同享高并发存储、亚微秒级远端内存同享拜候等特征,可经由过程软件界说实现"一套系统,N类利用",有用减缓当前数据中间 "内存墙"、"I/O墙"、"功耗墙"等瓶颈。融会架构3.0原型系统的发布,将有望成长出一种全解耦、全池化、高可扩大、易摆设、易治理的新型硬件根本架构,实现软硬高度协同,加快数据中间释放数字出产力,增进数字经济成长和与实体经济的深度融会。

1.jpg

智算时期,计较系统架构亟待冲破当前,数字化、智能化转型已成为企业成长、科研立异和社会治理的刚性需求,也催生了云计较、年夜数据、人工智能等数字手艺的蓬勃成长。但是,愈来愈多样化的利用对底层硬件资本的需求存在差别,致使利用传统架构的云、数、智、边、端等各类手艺平台彼此自力,硬件资本难以同享复用,造成资本华侈的同时也使得运维治理难度激增。好比,以年夜模子为代表的AIGC手艺需要基在海量数据集,在具有成百上千AI加快卡的集群上对千亿级参数的AI年夜模子进行散布式练习,对异构算力的需求更高;科学计较要求更高的计较精度,对通用算力的需求更高;内存计较则但愿让更多利用法式的数据驻留在内存当中,使得数据和算力更接近,以提高处置速度,对内存容量要求更高。但传统架构下,IT资本的扩大是以整机形态来完成的,即使用户亟需的是某种特定资本,但依然需要为整机附带的额外资本付费,这必将增添了IT支出并造成资本闲置华侈。

2.jpg

与此同时,在算力供给侧摩尔定律逐步放和缓登纳德缩放定律走向终结,现有的计较系统架构先本性不足被成倍放年夜,数据中间计较系统架构的立异已燃眉之急。海潮信息办事器产物线总司理赵帅暗示:"当前数据中间碰到的‘内存墙'、‘I/O墙'、‘功耗墙'等现象,其实不是孤立存在,它们是现有计较系统架构不足放年夜后的表现。只有经由过程计较系统架构的整体立异,才能完全解决各类瓶颈带来的挑战。"融会架构3.0:以数据为中间的新架构在此布景下,海潮信息推出融会架构3.0原型系统,打破了以往"以CPU为中间"的设计理念,而是从整体动身,经由过程系统架构立异解耦重构办事器系统,冲破性实现了计较资本、存储资本、内存资本、异构加快资本等焦点IT资本完全解耦与池化,可撑持多种通用途理器平台与GPU、FPGA、DPU等多种异构加快单位的协同计较,并可经由过程软件界说实现资本协同动态调剂。这类基在硬件重构手艺而开辟的新一代根本架构,将实现加倍自由的资本随需界说,为上层软件界说系统供给更超卓的矫捷性,使其可以或许按照利用特点,以高度主动化的体例分派与从头设置装备摆设硬件资本,不再遭到非动态设置的硬件根本举措措施的限制,让数据中间内部的人工智能、科学计较、云计较、年夜数据等各类利用同一运行在统一架构之上,实现多手艺平台融会,加快营业立异和数字化转型。

3.jpg

与传统的CPU为中间的计较架构分歧,融会架构3.0原型系统以数据为中间,实现计较节点内部各类算力芯片同享内存数据、同一编址和协同工作;在跨节点之间则经由过程智能数据处置单位和高速收集构成散布式互连互换,实现CPU、GPU、FPGA等各类加快芯片的算力协同和内存池化、新型存储资本池化,具有节点间的数据拜候延迟极低,撑持高效弹性扩大等优势。另外,融会架构系统可以实现更加矫捷的资本重构,为人工智能、年夜数据等多种利用场景供给壮大的算力支持。内存解耦与池化一向是业界的热门与难点,跟着以CXL为代表的串行缓存一致性总线的呈现,给主机和远端同享内存之间供给了低延时的拜候路径和缓存一致性包管,为年夜范围内存扩大与内存资本池化供给了可能。融会架构3.0原型系统冲破内存解耦池化要害手艺,研制新型利用串行缓存一致性总线和其互换手艺的内存模组和内存池化系统,保障主机系统对年夜容量、高带宽内存的利用需求。赵帅介绍,融会架构3.0原型系统初创JBOM自力内存资本池设计,立异实现高密度内存扩大方案,主机系统远端内存扩大手艺领先业界。经由过程软件界说系统设计和CXL高机能互换手艺,率先实现内存资本池化与细粒度多主机同享。系统互连设计方面,解耦与池化带来了新的互连挑战,整系统经由过程设计供电节制、复位、时钟锁定等协同工作体例实现解耦单位整体运行。另外,跟着数据速度的不竭爬升和系统链路变得加倍复杂,解耦池化系统互连链路互连延展已接近极限,系统针对复杂链路高速互连进行高精度的拟合仿真研究,正确阐发系统互连链路多样化拓扑和传输速度的极限。另外,融会架构3.0原型系统开辟软件界说治理系统,实现拓扑切换、端口动态治理、多主机资本同享与资本动态分区等高级功能;开辟资本治理软件,实现装备操纵率监控、装备分派环境设置装备摆设与治理、I/O吞吐量监控和链路健康诊断,保障主机系统硬件资本的动态摆设与高效治理。赵帅暗示:"融会架构3.0原型系统效力可比上一代软件虚拟化系统晋升一到两个数目级,可扩大性提高2~4倍,系统延时下降90%,PUE低在1.1。跟着数字经济、人工智能延续成长,企业的各项营业愈来愈依靠数据和其价值,算力手艺也需要不竭演进,融会架构3.0原型系统的发布,有助在企业晋升数据治理效力,最年夜化释放数据价值。"