cases 成功案例
典型项目首页>成功案例>典型项目
超算平台项目




    超算管理平台采用先进的技术架构,将集群计算节点资源划分到HPCAI两个分区,两个分区资源区别对待,统一纳管,做到了两个分区的计算资源既相互独立又相互融合。两个分区的计算节点可以实现一键分区间相互迁移,灵活调配,满足用户在不同时段对AIHPC业务资源的不同需求。为用户提供了一套既能保证HPC作业性能无损,又能兼顾HPCAI操作习惯的集群管理平台。

  超算管理平台的管理模块和登录模块基于CloudOS云平台运行,共享头节点的硬件资源。头节点不再被人为区分为管理节点和登录节点,做到了硬件资源的拉通使用,提高了资源的利用率,在相同的资源条件下提供了更加稳定地冗余备份。云平台可以根据管理模块和登录模块的负载情况动态调节两个模块所占用的资源,具有极高的可靠性和可扩展性。云平台实时监控管理模块和登录模块的运行状态,发生故障时系统可以在秒量级内完成故障的发现和业务的恢复。

  超算管理平台管理员和普通用户的操作均可在Web上完成,管理员通过WebWebSSH进行集群部署、集群监控等管理工作,普通用户可以通过WebWebSSHnoVNC提交作业、查看作业结果、上传和下载文件、创建和编辑应用模板。

  管理员可以在计算节点上同时安装环境层同一软件的不同版本,通过模块管理实现对软件版本的管理。用户可以通过运行环境选择模块管理中的软件版本,为自己的应用构建运行环境。运行环境可以保存、编辑和分享。


版权所有:武汉盖威尔信息科技有限公司 备案号:鄂ICP备12011588号-1技术支持:新网科技