新闻动态

“大国重器”背后的故事(一)| 探秘制冷机房

2020-12-10 20:16

在国家超级计算无锡中心,有一个神秘的地方,有的人也许一年都不曾去过一次,有的人却要每天在那个层高不到2米的地方进进出出,这就是我们的“制冷机房”。今天小编就跟随运维保障团队的兄弟们进入制冷机房,带大家了解一下“国之重器”背后的故事。



制冷机房也称“冷冻站”,位于无锡研创大厦的负二层,面积约2000平米,里面安装着15台冷水机组、42台增压水泵、1套水处理设备和13台高效过滤器,负责将超级计算机芯片产生的热量通过五楼的冷却塔转移至外界坏境中去,避免芯片因过热而造成不良后果。


制冷机房内部分设备展示

众所周知,一楼主机房内“神威·太湖之光”的运算设备除了连接大量网线外,每组运算单元上都接着两根水管,这是用来冷却运算设备的重要组成部分,而这一水冷技术是“神威系列”超算的一大特点。


运筹“维”幄,节能降耗



高效独特的水冷技术背后离不开神威团队的联合运维保障。据国家超级计算无锡中心运维保障部负责人姚振表示,冷水机的冷凝器每年至少需要进行4次大规模的物理清洗和1次化学清洗,从而减少管道流阻和增大管道换热能力,提高冷却系统的运行效率。

自2016年运维保障部接手“神威·太湖之光”硬件系统运维以来,一直加强组内人员的节能意识,并努力实施节能措施。通过加大冷却管路清洗频率和对冷却系统进行变频和自动化改造,五年来已为中心节省近千万度电



“冷水机冷凝器到底是怎么清洗的?”

“清洗一次工作量有多大?”

“保障部的同事们是如何为中心节能的?”

……

别着急

继续往下看


各司其职,从容不迫





冷机冷凝器由端盖和上下两部分铜管组成,一个管箱端盖重约200斤,需要2名工作人员拧开44颗螺栓和螺母,用起重机配合操作。



随后接上专用的便携式管路清洗机,将圆形尼龙刷或者黄铜丝硬毛刷用长杆连接,来回擦洗278根4米长的铜管,使积压在管内的污垢松动,最后再用干净的清水彻底冲洗冷凝器水管。

慎重其事,责有攸归



神威·太湖之光”冷却系统虽然经过了自动化控制和节能改造,但还是需要运维人员适时调整设定参数和对换热管道进行清洗,加强冷却系统的运行效率。

国家超级计算无锡中心运维保障部负责人姚振介绍到,“打个比方,我们16年刚接手的冷却系统就相当于一辆手动挡的车,为了提高系统运行效率,我们运维人员需要频繁的调整设定参数以应对末端计算负载的波动和外界环境温湿度的变化(相当于手动挡的车需要驾驶员根据路况频繁换挡来提高燃油效率),通过两年的运维经验和总结,19年我们对冷却系统进行了节能改造,增加了水泵变频器和自动优化控制系统(相当于把车的手动挡变速箱换成了自动变速箱,并配置了高效率的换挡程序)。同时我们也定期对冷却系统设备进行保养,并清洗各个换热部件(相当于汽车的保养和维修)。不管是手动挡还是自动挡的车,都需要一位车技娴熟并懂得车辆保养和维修的驾驶员,这样车辆才能安全稳定并高效的行驶,不用担心半路抛锚和缺钱加油。冷却系统也是这样,我们部门人员对自身的要求是既要成为技艺娴熟的工程师,也要有极强的节能意识。

只争朝夕,不负韶华



姚振继续说道:“先研发之忧而忧,后业务之乐而乐;起早与贪黑齐飞,调休共假期待定,这就是运维。清洗冷凝器虽然简单,也只是部门运维保障工作的一小部分,但考验的却是运维人的耐心与细心,清洗一台冷凝器整个过程需要耗费约3小时,如何在程式化的重复劳动中提高运维人的效率,为中心尽可能节约成本控制预算,提高服务外延的价值是我们部门不断探寻的问题。

的确,稳定是基础,安全是保障,高效是王道,调优就是价值的直观体现。2020年,对保障部的同事们来说,是竭尽全力、收获满满的一年。大到疫情保障,小到巡夜值守,没有一人选择退缩,大家齐心聚力,圆满完成了各项工作。在今后的工作中将继续履职尽责、担当作为,当好“设备主人”。


精准神威芯,高效运维人

让我们一起来认识一下保障部的同事们


历经夏日的招新,我们于超算相遇

从此便成一家人

饱受秋风的洗礼,我们于工作中成长,成为合格超算人

从今往后的日子,我们也将携手共进,共创辉煌