? 大乐透欧阳宵专栏
首頁
中科曙光針對高性能計算機群的運維平臺正式上線
作者:佚名 [ 2016-05-31 10:56:07 ]

                                                      來源于:武進新聞網

    中新網北京4月23日電 (記者 張素)記者23日從中科曙光獲悉,在經歷了6個月的試運營之后,中科曙光針對高性能計算機群推出的SaaS級專業化在線平臺EasyOP正式上線。
    今年3月,谷歌Alpha Go在與李世石九段的人機大戰中以4:1的成績勝出后名聲大噪。事實上,Alpha Go獲勝原因之一就是擁有穩定運行的強大超級計算系統。
    然而,目前基于高性能計算機群(HPC)的IT中心建設,能夠提供服務的公司往往難以做到全生命周期的運維服務。第三方HPC服務商并不研發和生產,解決問題的效率也不盡如人意。
    “EasyOP是曙光結合‘互聯網+’和HPC的產物,不僅幫助用戶維護HPC系統,還有望利用用戶的系統為其創造更多的價值。”中科曙光副總裁沙超群表示,“通過提供運維、調優等服務,將各行各業的專家從HPC的運維和管理中解放出來。
    沙超群介紹,該平臺具有五大關鍵技術:監控數據實時遠程采集、海量數據存儲與展示、故障的分析與定位技術、大量數據統計與分析、移動終端的集成與推送。
    來自中科院物理所的徐力方研究員對記者表示:“HPC集群的運維此前一直是我們的艱巨任務,非常辛苦。接入EasyOP后,我們的運維壓力大大降低了,運維成本和人力投入也都減少了,而且HPC集群的安全性和使用效率也得以提升。”
    2015年11月,EasyOP在全國高性能計算學術年會上亮相并宣布試運營。記者獲悉,從試運營的數據反饋信息來看,其表現稱得上專業、全面。在此期間,累計接入來自20組HPC集群的超過7800個節點,應用涵蓋CAE、氣象、海洋、物理、生物、材料及互聯網6大領域,對所有接入集群資產全面監控的指標超過180項。
    專家分析稱,在監控的7800多個節點中,CPU的最高和平均利用率為83%和70.1%,內存的最高和平均利用率為40%和25.5%,存儲的最高和平均利用率為23%和20.3%。在EasyOP接入的資源作業中,中短時長作業占近70%,作業排隊率約為1/5。這種多線程任務下適于對HPC系統各子功能的全方位監控。
    據統計,試運營半年期間,全部集群共自動觸發近2900條通知信息,其中2281條是因計算節點主要部件溫度升高觸發的輕微類通知。嚴重類通知僅有3條,從側面反映了曙光集群系統的高可靠性。
    “曙光推出EasyOP在線運維平臺,引領了我國HPC行業向互聯網+轉型的方向,將促進行業整體服務水平的提升。”中國軟件行業協會數學軟件分會常務副秘書長姚繼鋒表示,“EasyOP可實現曙光與HPC用戶的互聯,對于打造‘HPC生態圈’具有重要意義”。(完)

第1頁
排列5推荐号码