实验室准备新配一台四路 RTX2080Ti 的深度学习服务器。为了报销方便,没有选择供应商,而是选择在京东自营购买。本文详细介绍了配置服务器的过程。后续的系统安装可以参考本人的这篇博客:使用 LXD 搭建多人使用的 GPU 服务器
配置
博主在购买之前在知乎提了一个问题,得到了很有用的帮助。下面是具体配置:
类别 | 品牌 | 数量 | 单价 | 总价 |
---|---|---|---|---|
GPU | 技嘉RTX2080Ti TURBO 11G | 4 | 9999 | 39996 |
CPU | i9-9820X 10/20 | 1 | 6299 | 6299 |
主板 | 技嘉 X299-WU8 | 1 | 4999 | 4999 |
机箱 | 先马掠食者V1 | 1 | 999 | 999 |
内存 | 美商海盗船 复仇者LPX DDR4 3000 16GB | 8 | 579 | 4632 |
电源 | 振华 额定2000W LEADEX P 2000电源 | 1 | 3299 | 3299 |
NVME SSD | 三星 1TB SSD固态硬盘 970 EVO | 1 | 1699 | 1699 |
SATA SSD | 三星 1TB SSD固态硬盘 860 EVO | 1 | 1029 | 1029 |
CPU 散热 | 美商海盗船 H150i PRO | 1 | 1299 | 1299 |
- | - | - | - | 64251 |
其实配置的关键就是 GPU、CPU和主板的选择。
显卡选择
博主是2019年10月选择的配置,目前最具有性价比的显卡依然是 RTX2080Ti,图灵架构可以在混合精度运算时大幅度提升性能,缺点是显存较小,只有 11 GB
GPU 在确定是 RTX2080Ti 后就非常好选择了。注意多卡服务器必须是单风扇的涡轮版显卡,因为涡轮散热空气从头进入,热气从尾排出,多张卡互不影响。但是多风扇轴式散热是从下方吸入空气,侧面排出,如果是多卡排出的热气又被上卡吸进去,导致上卡温度爆炸,降频严重。下图可以理解涡轮风扇的风道。
CPU与主板选择
CPU与主板的选择无非就是Intel和AMD的选择,每家又分为民用级和服务器级,这里我选择的是Intel的民用级i9-9820X。AMD的线程撕裂者性价比更高,但可能坑多一些。服务器级的CPU以及主板一般需要经销商采购,区别主要是支持ECC的内存更稳定,京东自营一般不卖,所以没有考虑。
CPU 散热器选择
CPU散热器这里选择的是美商海盗船 H150i PRO 360一体水冷。一开始选择的是猫头鹰的风冷,但是由于个头太大,装上后散热块会和显卡背面金属触点接触(显卡没有背板),怕引起短路等问题,最终更换成一体水冷。
电源选择
由于显卡满载就需要至少1000W的功率,再加上CPU内存硬盘,1600W按道理是足够了,为了稳妥选择了振华的2000W电源。需要注意的是这块电源的插头是10A的空调插头,需要买个转接的插线板。
散热问题
服务器已经稳定运行了半年多,散热问题还是有必要提一下。虽然机箱装满了4个机箱风扇以及3个一体水冷的风扇,显卡也是机器学习专供的涡轮版可以及时将热气排到机箱外,但是由于机箱放置在只开着一扇窗户的小机房里,导致机房温度骤升(机箱的铁板烫的不敢用手摸)。最终在窗户上加上排气扇解决。四块显卡满载情况下,最下面的显卡温度控制最好,在76度左右,剩下的三块显卡均达到82度,可能碰到了功耗墙。
总结
本次装机除显卡为天猫旗舰店购买外,其余均在京东自营购买。如果下次还有机会重组一套配置的话,显卡的显存会尽可能换大一些的,CPU会尝试使用AMD,可能的话选择水冷(风险和维护成本有点高)。