如何成功迁移到 HPC 托管设施
高性能计算 (HPC) 工作负载迁移到托管设施可以减少数据中心的运营和维护成本,但是,在迁移之前,管理员必须考虑多种因素,例如高速数据连接、硬件传输和应用程序要求等。
高性能计算的用例包括涉及大数据集的科学研究、人工智能和机器学习以及数据驱动的财务预测等。HPC 工作负载最初几乎完全运行在数据中心中。
现在,随着涌现更多的云计算和工作负载外包选项,企业数据中心托管更少的本地工作负载。由于运行较少数据的数据中心可能成本高昂,因此,人们非常想找到方法将剩余工作负载迁移出数据中心,迁移到云端或 HPC 托管设施中。
尽管亚马逊和微软等公共云提供商提供可行的选项,可在云端运行 HPC 工作负载,但这些产品并不总是最佳选择。使用费可以使基于云的 HPC 成本过高。
对于企业而言,仅仅采用云技术而完全放弃其现有的 HPC 硬件可能没有任何意义。迁移到云端可能需要重新配置应用程序、额外的安全措施和额外的成本。更好的选择可能是将 HPC 工作负载迁移到托管设施,这使企业可以保留其硬件,但减少内部维护工作。
选择 HPC 托管服务
当你的企业决定将其 HPC 工作负载移出数据中心,并转移到 HPC 托管设施中,你将需要做出很多决策。首先要做出的决定是:重用现有的 HPC 硬件还是更换硬件?
该决定会影响迁移成本和工作负载可用性。例如,如果你决定移除所有 HPC 硬件,并将这些组件物理地移到主机托管设施,则在该时间段内所有关联的工作负载将处于脱机状态。
在某些情况下,可以移动部分 HPC 节点到托管设施,将这些节点与本地节点同步,重定向应用程序流量到托管设施,然后删除其余节点。
但是,使部分节点脱机进行移动会降低应用程序的性能,直到所有节点都重新联机。节点之间和存储之间所需的吞吐量可以排除此过渡选项。
另一个重要的考虑因素是应用程序数据托管位置。HPC 的性质要求高水平的数据吞吐量。这意味着管理员应将应用程序数据放置在尽可能靠近 HPC 节点的位置,这不仅将影响企业选择在何处移动硬件,还影响可用的 HPC 托管选项。
如果业务需求要求将数据托管在单独的数据中心中,则管理员必须确保在托管设施和数据存储位置之间存在高速直接连接。
当企业将工作负载转移到托管设施时,管理员都必须考虑安全性。托管相对便宜的原因是,托管通常会在多个租户之间分摊成本。因此,在选择托管设施时,重要的是确保他们会严格控制和记录物理访问。
即使主机托管设施确实能够确保物理数据中心的安全性,管理员也应保护其 HPC 硬件免遭盗窃或篡改。很多托管租户选择在其资产周围安装围栏以控制物理访问。还有服务器级安全性的选项。
准备好进行 HPC 托管转移
根据迁移性质的不同,在迁移 HPC 工作负载时,最有用技术也会不同。例如,HPC 迁移到云端的方式应与迁移到托管中心的方式不同。通常情况下,企业选择托管设施是因为:数据中心空间用尽、缩小数据中心的占地面积或没有足够的设施员工。
在大多数情况下,迁移过程主要涉及将 HPC 硬件运输到托管设施,然后连接服务器和电缆。管理员可以使用备份和恢复软件将应用程序和数据传输到新硬件。
为了成功进行迁移,管理员应与 HPC 托管服务提供商合作,确定如何移动应用程序、确认应用程序可在新设施中正常运行,以及在迁移之前是否需要进行任何抢占式测试。如果迁移不是简单的直接迁移,那么可以使用很多提取、转换和加载 (ETL) 工具来帮助迁移并转换数据。