王者捕鱼器68000|王者捕鱼得分技巧
機房360首頁
當前位置:首頁 ? 數據中心資訊 ? NVIDIA集成AI超算中心經驗,打造AI就緒型數據中心

NVIDIA集成AI超算中心經驗,打造AI就緒型數據中心

來源:智東西 作者:Harris編輯 更新時間:2019/8/1 7:26:50

摘要:傳統數據中心向人工智能(AI)轉型已是大勢所趨。

  傳統數據中心向人工智能(AI)轉型已是大勢所趨。
  
  一方面,從智能客服、智能安防、智能風控、智能運維到智能質檢,愈加豐富的智能化應用致使存儲需求呈現指數級增長,并對數據中心的算力提出新的挑戰。
  
  另一方面,AI正打破傳統數據中心的管理和運營模式,完成更為精準的系統調優、故障預判等任務,替代更多人力,減少能耗和資源浪費,更大程度釋放生產力。
  
  作為AI時代的基礎設施,AI硬件正成為越來越多數據中心擴容建設的關鍵所在。尤其是能源、銀行、保險、制造、電信、醫療等重度存儲用戶,急需加速AI的基礎架構方案。
  
  當超強計算力成為數據中心的剛需,NVIDIAGPU憑借強大的并行計算和浮點能力突破了深度學習的算力瓶頸,成為AI硬件的首選。
  
  然而,對于許多傳統數據中心而言,部署包含AI硬件的基礎設施,需要耗費許多時間與人力。
  
  對此,NVIDIA基于GPU軟硬件生態系統,提供了一站式交付節點解決方案DGXPOD。
  
  這一方案可以大大節省構建基礎設施所花費的時間,幫助數據中心輕松快速進行AI部署,為擴展多GPU服務器節點提供更多支持。
  
  本期的智能內參,我們推薦《NVIDIADGXPOD數據中心參考設計》白皮書,從傳統數據中心的AI轉型之困著手,結合DGXPOD的應用實例,解讀NVIDIADGXPOD交付節點的核心亮點,為亟待快速轉型AI的數據中心架構師,以及準備構建AI就緒型數據中心提供參考。如需查閱此白皮書《NVIDIADGXPOD數據中心參考設計》,可直接點擊:NVIDIADGXPOD數據中心參考設計白皮書-白皮書下載-英偉達AI計算專區-智東西下載。
  
   
  數據中心AI轉型遭遇困局
  
  大數據、AI與云計算等新興技術卷起新的浪潮,在各類數據中心中形成連鎖反應。海量數據處理任務涌入數據中心,面對人工智能應用的訓練和推理,令傳統的CPU服務器難以招架。
  
  深度學習算法屬于計算密集型算法,與NVIDIAGPU計算架構十分契合。過去CPU需要花數十天完成的計算任務,通用GPU只用幾小時就能完成,這大幅提升深度學習等并行處理數據方法的計算效率,使得以GPU為基礎的設備日漸成為各大數據中心進行深度學習訓練的首選。
  
  然而,即便部署了強大的硬件設備,也不意味著數據中心的AI轉型計劃就萬事俱備了,還有一個關鍵問題擺在眼前——架構設計。
  
  數據中心需要考慮的因素遠不止算力,還需兼顧網絡、存儲、電源、散熱、管理和軟件等方面問題。
  
  硬件組合不是簡單粗暴的積木堆疊,并不是說計算節點越多,性能就會隨之線性增長。其計算性能會受制于高速互聯網絡,一旦出現數據擁堵,整機系統的效率都可能被拖累。另外,過多計算硬件堆疊,可能導致功耗過大,不利于日后的運營。
  
  因此,數據中心必須思考如何打造了降本增效的最佳方式,將各種硬件資源協同組合,在穩定安全的狀態下,以超低延遲和高帶寬訪問數據集。
  
  這對于缺乏AI部署經驗的傳統數據中心而言,無疑是個不小的挑戰。如果DIYGPU計算節點,不僅需要耗費人力和時間成本,還要考慮計算、存儲、交換機等各種硬件設備的集成兼容問題。
  
  對于這一痛點,NVIDIA提供了一個頗有吸引力的解決方案。
  
  它通過與領先的存儲、網絡交換技術提供商合作,提供一系列DGXPOD數據中心交付節點設計參考架構,將NVIDIA長期積累的超大規模數據中心AI部署經驗,轉化為可復制方案,無論是大中小型數據中心,均可以直接參考使用。
   
  NVIDIAAI超級計算機構建經驗轉換
  
  DGXPOD交付節點(PointofDelivery)是一種經優化的數據中心機架,包含多臺DGX-1或DGX-2服務器、存儲服務器和網絡交換機等最佳實踐。
  
  NVIDIA集成AI超算中心經驗,打造AI就緒型數據中心
  
  ▲DGXPOD參考架構正面圖
  
  這是NVIDIA構建大量超大規模GPU加速計算節點的經驗之集大成者。NVIDIA曾建立了大型的AI數據中心,包含數千臺領先的DGX服務器加速計算節點。
  
  今年6月,NVIDIA宣布推出全球速度排名第22位的超級計算機DGXSuperPOD,為企業快速部署自動駕駛汽車項目,提供同等大小的超算無法匹敵的AI性能。
  
  SATURNV亦是NVIDIA基于DGX系統構建的AI超級計算機,支持自動駕駛汽車、機器人、顯卡、HPC等多領域的NVIDIA內部AI研發。早在2016年推出之際,DGXSATURNV就登上Green500超算榜第一,被評為全球最經濟高效的超算,整體運算速度位列第28位,是最快的AI超算。
  
  基于使用SATURNV所遵循的設計原則和架構,NVIDIA在短短三周內就打造出一套基于NVIDIADGX-2配置的全新系統DGXSuperPOD。近期NVIDIA借助一套基于DGX-2的配置在MLPerf基準測試中創下六項AI性能記錄。
  
  在將DGXSATURAN打造成所有企業都可復制的、經驗證的設計過程中,NVIDIA經過實地檢驗積累了豐富的經驗,并將計算、網絡、存儲等多方面的最佳實踐,集中于NVIDIADGXPOD的設計之中。
  
  如今,包括Arista、思科、DDN、DellEMC、IBMStorage、Mellanox、NetApp和PureStorage等在內的業內數據中心領導者已圍繞DGXPOD,推出了基于其各自特有技術的相關產品。
  
  這些集成系統均為客戶提供經過經驗驗證的可靠方法,這意味著,每個企業都能量身定制完全適配自身需求的AI超算中心。
  
  例如,基于DGXPOD,NetApp推出了NetAppONTAPAI融合基礎架構。其由NVIDIADGX-1服務器、NetApp云互聯存儲系統提供支持,是NVIDIA和NetApp聯合開發和驗證的架構。
  
  借助這一架構,企業可以從小規模起步進行無縫擴展,智能管理跨邊緣、核心和云以及反向數據傳輸的完整深度學習數據管道,簡化AI部署。
  
  圍繞NVIDIADGXPOD參考架構和NetAppONTAPAI,英國劍橋咨詢公司構建了一套專門的AI研究設施,用于訓練一個能即刻準確識別各種音樂流派的AI“狂熱愛好者”。
  
  借助參考框架,其AI項目所帶來的對計算、存儲、網絡設施的需求均得到滿足。經過在16臺NVIDIAGPU上接受數百小時的音樂訓練,這位特殊的音樂愛好者,在“聽音識流派”的準確度上,甚至超越了人類和傳統編程。
  
  NVIDIA集成AI超算中心經驗,打造AI就緒型數據中心
  
  AI軟件:調優DGX硬件,降低管理門檻
  
  除了設計優化的DGX服務器、存儲服務器和網絡交換機組合,DGXPOD上還運行一整套適配的NVIDIAAI軟件堆棧,極大簡化DGXPOD的日常操作與維護,為大規模多用戶AI軟件開發團隊提供高性能的深度學習訓練環境。
  
    ▲NVIDIAAI軟件堆棧
  
  NVIDIAAI軟件包括DGX操作系統(DGXOS)、集群管理和協調工具、工作負載調度器、來自NVIDIAGPUCloud(NGC)容器注冊表的和優化容器,可以為使用者提供優化的操作體驗。
  
  DGXPOD管理軟件可根據需要,自動創新安裝DGXOS。DGXOS是NVIDIAAI軟件堆棧的基礎,基于優化版UbuntuLinux操作系統構建,并專門針對DGX硬件進行調優,支持各種NVIDIA庫和框架及GPU的容器進行時。
   
  ▲DGXPOD管理軟件層
  
  DGXPOD管理軟件層由Kubernete容器協調框架上運行的各項服務組成,可通過網絡(PXE)為動態主機配置協議(DHCP)和全自動DGXOS軟件配置提供服務。
  
  通過使用其簡單的用戶界面,管理員可在由Kubernetes和Slurm管理的域中移動DGX服務器。未來Kubernetes增強功能預計在純Kubernetes環境中,支持所有DGXPOD用例。
  
  DGXPOD上的NVIDIAAI軟件可借助Ansible配置管理工具進行管理,白皮書中有提供其開源的軟件管理堆棧和文檔在Github上的鏈接。
  
  智東西認為,DGXPOD一站式交付節點解決方案,不僅能加速數據中心的AI部署效率,同時也通過提供更強大的算力,大幅度提升數據的利用效率。
  
  當前,很多數據中心剛剛踏入或計劃踏入AI的大門,而當下主流的深度學習算法必須配備專業的AI基礎設施。基于NVIDIADGXPOD的架構方案,對于快速構建大規模AI計算集群非常具有參考價值。隨著此類基礎架構逐漸普及,更多數據中心將得以消除設備與資本預算之間的鴻溝。
  
  這只是NVIDIA打造AI就緒型數據中心宏圖的重要版面之一,利用DGX-1、DGX-2服務器和NVIDIAGPU大規模計算架構的發展進步,NVIDIA正將機器學習、深度學習和高性能計算(HPC)擴展到更多的數據中心,為金融、能源、制造、電信、醫療、科學計算等更多行業的生產力提升提供動力引擎。
  
  編輯:Harris

機房360微信公眾號訂閱
掃一掃,訂閱更多數據中心資訊

本文地址:http://www.aquhv.tw/news/201981/n3302120442.html 網友評論: 閱讀次數:
版權聲明:凡本站原創文章,未經授權,禁止轉載,否則追究法律責任。
相關評論
正在加載評論列表...
評論表單加載中...
  • 我要分享
推薦圖片
王者捕鱼器68000 360彩票老快3 福建快3开奖号码今天 河北时时推荐号码 1分赛车彩票app投注软件 七乐彩走势图带坐标 安徽快3一定牛 重庆老时时官方网站 山西快乐十分前三直遗 吉林时时上市时间 江苏e球彩常用奖金表