高特性测算群集“大夫” 曙光EasyOP释放HPC运维管

2021-03-07 07:04 jianzhan

高特性测算群集“大夫” 曙光EasyOP释放HPC运维管理工作压力


高特性测算群集“大夫” 曙光EasyOP释放HPC运维管理工作压力 运维管理是IT制造行业中1块较为难啃的骨头,特别是高特性测算群集的运维管理工作中。有鉴于此,曙光企业推出了EasyOP运维管理服务平台,期待可以减轻高特性测算群集运维管理难度,进而打造全新升级的HPCOnline绿色生态圈。 作者:韩蕊

高特性测算(HPC)早已运用到社会发展日常生活的各个方面。在解决电力能源紧缺、自然环境污染、全世界气侯转变层面;在精确医药学层面;在航空工业生产、高速铁路、重特大武器装备生产制造、高能物理学原材料高通量测算等行业充分发挥侧重手游大作用,针对传统式产业链升級、提高老百姓日常生活水平静开展关键基本科学研究科学研究具备关键实际意义。

要让这些进行高特性测算的设备们充分发挥功效,就必须高效率、长期性的运维管理体制。可是从我国目前的高特性测算运维管理工作中看来,大多数数高特性测算管理中心,欠缺技术专业的运维管理精英团队,这就致使高特性测算机的常见故障多、特性低、使用寿命短,没法真实充分发挥高特性测算机的功效。

根据我国高特性测算运维管理发展趋势的现况,中科曙光从2015年11月就刚开始试运作了EasyOP线上运维管理服务平台。历经6个月的试经营,EasyOP早已发展为1款对于高特性测算群集的技术专业运维管理专用工具,并于4月21日宣布上线。

EasyOP能做甚么?

2015年,曙光提出了"数据信息我国"发展战略,该发展战略表明,5年内要在中国百个大城市百个制造行业建成,构建1个遮盖全国性的数据信息服务平台,出示根据数据信息的服务。并表明,曙光将来要搭建1个遮盖全国性的数据信息服务平台,便于为客户出示根据数据信息的服务。曙光做为高特性测算制造行业的引领者,该怎样适用数据信息我国发展战略的落地、进行"从硬件配置出示商向综合性服务出示商转型发展"呢?

曙光EasyOP线上运维管理服务平台宣布上线公布典礼

在互联网技术+HPC的方式下,EasyOP是1款SaaS级的技术专业、高特性测算群集运维管理服务平台。EasyOP可以为HPC线上7*24小时的全性命周期的运维管理服务。曙光副总裁沙简直无敌进1步表明,EasyOP根据出示运维管理、调优等服务,将各行各业的权威专家从HPC的运维管理和管理方法中释放出来。不止于此,曙光期待根据EasyOP搭建1个資源买卖服务平台,打造1个HPC绿色生态圈,让闲时資源造就使用价值,从而为客户带来更多使用价值。

EasyOP有着5价位键技术性:监管数据信息即时远程控制收集、大量数据信息储存与展现、常见故障的剖析与精准定位技术性、很多数据信息统计分析与剖析、挪动终端设备的集成化与消息推送。选用EasyOP,HPC运维管理人员不但能够随时掌握HPC群集的经营状况和常见故障,还可根据网页页面或手机微信等线上资询服务与网上权威专家开展1对1的沟通交流。EasyOP还会将普遍、有意味着性的常见故障处理计划方案提交至专业知识库,便于于HPC运维管理人员累积。

曙光HPC产品研发部主管张晋锋当场演试了EasyOP服务平台,1个是网页页面版本号,1个是单机版版本号。根据演试,能够看出,HPC群集的运作情况、特性监管数据信息1目了然。并且能够灵便地配备告警义务人和通告方法。并且宣布上线的EasyOP还可以根据手机微信关心EasyOP群众号的方法,完成对HPC群集的即时监管,立即发现并处理群集出現的难题。

为何要挑选EasyOP?

我国手机软件制造行业研究会数据信息手机软件分会常务副秘书长姚继锋博士总结表明,要完成高特性测算群集的高效率运维管理,必须有3面的适用:管理方法规章制度、技术专业精英团队和支撑点系统软件,这3层面要相互有关、高宽比藕合才可以够确保群集的平稳运作。就技术性层面来讲,仅有"懂HPC,才可以够懂HPC线上运维管理。"EasyOP的产品研发精英团队所有来自于曙光高特性测算精英团队,再加运维管理精英团队,早已有近百人,这是1批懂硬件配置、懂手机软件,且懂运用的高特性测算精英团队。

数据信息显示信息,试经营期内,EasyOP总计接入来自20组HPC群集的超出7800个连接点,运用涵盖CAE、气候、海洋、物理学、微生物、原材料及互联网技术6大行业,对全部接入群集财产全面监管的指标值超出180项。

从周期上看,EasyOP接入時间跨度遍布有效,系统软件满负载和低负载的状况均包括在内。在监管的7800好几个连接点中,CPU的最高友谊均运用率为83%和70.1%,运行内存的最高友谊均运用率为40%和25.5%,储存的最高友谊均运用率为23%和20.3%。此外,在EasyOP接入的資源工作中,中短时长工作占近70%,工作排长队率约为1/5。这类线程同步每日任务下适于对HPC系统软件各子作用的全方向监管。

统计分析显示信息,试经营半年期内,所有群集共全自动开启近2900条通告信息内容,在其中2281条是因测算连接点关键构件温度上升开启的轻度类通告。比较严重类通告唯一3条,在其中两条诱因自共享资源储存挂载常见故障,1条系比较严重级別温渡过高致使连接点全自动关机,从侧边反应了曙光群集系统软件的高靠谱性。

中科院物理学所的徐力方科学研究员表明:"HPC群集的运维管理此前1直是大家的艰巨每日任务,十分艰辛。接入EasyOP后,大家的运维管理工作压力大大减少了,运维管理成本费和人力资源投入也都降低了,并且HPC群集的安全性性和应用高效率也得以提高。大家终究释放了。"

寄语:

运维管理是IT制造行业中1块较为难啃的骨头,特别是高特性测算群集的运维管理工作中,在以往的25年,中科数据信息在高特性测算行业取到了很好的考试成绩,中科曙光的高特性测算早已服务于航空航天、航空、电力能源、电力工程、气候、微生物、金融业、国防等诸多行业,交货群集数量超出10000套。

这样的曙光更有工作能力,并且更有义务为高特性测算群集的运维管理工作中出示更好的确保。期待曙光EasyOP可以协助HPC客户出示系统软件平稳运作的确保,出示系统软件高效率,让我国的HPC工作有更好的发展趋势。从而,曙光本身可以打造出身心健康的"HPC绿色生态圈",践行"数据信息我国"发展战略,完成"从硬件配置出示商向综合性服务出示商转型发展"的总体目标。


2019-07⑴5 16:32:52 云计算技术 意味着“我国速率”的6家我国超算管理中心,你掌握吗? 现如今,我国非常测算机研发、自主创新、运用发展趋势早已走过40年。而不久以往的10年,是我国非常测算机技术性自主创新与非常测算运用自主创新深层结合、迈进新环节的10年。