熟悉深度學習的人都知道,深度學習需要訓練。所謂訓練,就是在成千上萬個變量中尋找最佳值的計算。這需要不斷的嘗試去識別,最終的數值不是人工確定的數字,而是壹個正規的公式。通過這種像素級的學習,不斷總結規律,計算機可以實現像人壹樣思考。因此,更擅長並行計算和高帶寬的GPU成為關註的焦點。
很多人覺得深度學習GPU服務器配置和普通服務器有些不同,就像很多人覺得做設計的機器壹定很貴壹樣。其實只要顯卡或者CPU滿足深度學習的應用,就可以進行深度學習。因為CPU的核心數和架構相對於深度學習來說效率遠不如GPU,所以大部分深度學習服務器都是由高端顯卡運行的。
以下是關於如何選擇深度學習GPU服務器以及如何選擇深度學習服務器的壹些原則和建議:
1.電源:質量有保證,電力充足,有30~40%冗余。
穩定,穩定還是穩定。好的電源可以保證主機長時間運行不停機不重啟。可想而知,如果在計算過程中突然重啟,就得重新開始,不僅效率降低,還會影響心情。有些電源在低負載下使用可能不會有問題,但在高負載下運行就容易出問題。在選擇電源的時候,壹定要選擇有冗余,質量過硬的電源,不要隨便超功率。
2.顯卡:目前主流的RTX3090和最新的RTX4090也會上市。
顯卡在深度學習中起著重要的作用,也是預算的壹大部分。預算有限,可以選擇RTX3080 /RTX3090/RTX4090(上個月剛發布,本月12上市)。如果預算充足,可以選擇專業的深度學習卡泰坦RTX/特斯拉v 100/a 6000/a 100/h 100(供貨暫停中)等等。
3.CPU:兩者占優。這裏要講的是PC級和服務器級處理器的定位。
英特爾的處理器有至強、酷睿、賽揚、奔騰、Atom5,服務器端用的是至強。目前市面上最常見的是Core。目前是第三代至強可擴展系列處理器,分為白金、黃金、白銀三種。
AMD處理器分為銳龍銳龍、銳龍銳龍Pro、銳龍Threadripper、驍龍EPYC,其中驍龍是服務器端的CPU,銳龍是最常見的。目前是第三代EPYC(驍龍)處理器,AMD第三代EPYC 7003系列最高64核。
選擇單向還是雙向取決於軟件。單純用GPU計算,其實CPU並沒有太大的負荷。考慮到更多的用途,當然CPU也不能太差。主流的高性能多核多線程CPU就夠了。
4.內存:單個16G/32G/64G可選。服務器級內存有ECC功能,PC級內存沒有,這壹點很重要。
內存32G起步,內存可以擴展,夠用就好。如果不夠,可以以後再補充。買多了也是浪費。
5.硬盤:固態硬盤和機械硬盤。通常系統盤為了速度用固態硬盤,數據盤為了存儲用機械盤。
大品牌企業級的固態選擇,Nvme或者SATA協議差別不大,所以不要考慮雜固態,突然用起來就不好了。
6.機箱平臺:服務器層面,建議選擇超微主板平臺,穩定可靠是第壹要求。
預留足夠的空間方便升級,比如現在用單塊顯卡,以後再加壹塊顯卡;結構要合理,合理的空間更有利於空氣流通。最好加幾個散熱效果好的機箱風扇輔助散熱。溫度也是導致不穩定的壹個因素。
7.軟件和硬件支持/解決方案:是。
應用方向:深度學習、定量計算、分子動力學、生物信息學、雷達信號處理、地震數據處理、光學自適應、轉碼解碼、醫學成像、圖像處理、密碼破解、數值分析、計算流體力學、計算機輔助設計等眾多科研領域。
軟件:Caffe,TensorFlow,Abinit,Amber,Gromacs,Lamps,Namd,VMD,Materials Studio,Wien2K,Gaussian,Vasp,CFX,OpenFoam,ABAQUS,ANSYS,LS-DYNA,Maple,MATLAB,Blast,FFTW,NASTRAN的安裝,調試,優化,培訓,維護等技術支持和服務。
————————————————
版權聲明:本文為CSDN博主“AI 17316391579”原創文章,遵循CC 4.0 BY-SA版權協議。轉載請附上原出處鏈接和本聲明。
原文鏈接:/AI 17316391579/文章/詳情/12753617。