实验室准备新配一台四路 RTX2080Ti 的深度学习服务器。为了报销方便,没有选择供应商,而是选择在京东自营购买。本文详细介绍了配置服务器的过程。后续的系统安装可以参考本人的这篇博客:使用 LXD 搭建多人使用的 GPU 服务器

配置

博主在购买之前在知乎提了一个问题,得到了很有用的帮助。下面是具体配置:

类别 品牌 数量 单价 总价
GPU 技嘉RTX2080Ti TURBO 11G 4 9999 39996
CPU i9-9820X 10/20 1 6299 6299
主板 技嘉 X299-WU8 1 4999 4999
机箱 先马掠食者V1 1 999 999
内存 美商海盗船 复仇者LPX DDR4 3000 16GB 8 579 4632
电源 振华 额定2000W LEADEX P 2000电源 1 3299 3299
NVME SSD 三星 1TB SSD固态硬盘 970 EVO 1 1699 1699
SATA SSD 三星 1TB SSD固态硬盘 860 EVO 1 1029 1029
CPU 散热 美商海盗船 H150i PRO 1 1299 1299
- - - - 64251

其实配置的关键就是 GPU、CPU和主板的选择。

显卡选择

博主是2019年10月选择的配置,目前最具有性价比的显卡依然是 RTX2080Ti,图灵架构可以在混合精度运算时大幅度提升性能,缺点是显存较小,只有 11 GB

GPU 在确定是 RTX2080Ti 后就非常好选择了。注意多卡服务器必须是单风扇的涡轮版显卡,因为涡轮散热空气从头进入,热气从尾排出,多张卡互不影响。但是多风扇轴式散热是从下方吸入空气,侧面排出,如果是多卡排出的热气又被上卡吸进去,导致上卡温度爆炸,降频严重。下图可以理解涡轮风扇的风道。

gpu_turbo

CPU与主板选择

CPU与主板的选择无非就是Intel和AMD的选择,每家又分为民用级和服务器级,这里我选择的是Intel的民用级i9-9820X。AMD的线程撕裂者性价比更高,但可能坑多一些。服务器级的CPU以及主板一般需要经销商采购,区别主要是支持ECC的内存更稳定,京东自营一般不卖,所以没有考虑。

CPU 散热器选择

CPU散热器这里选择的是美商海盗船 H150i PRO 360一体水冷。一开始选择的是猫头鹰的风冷,但是由于个头太大,装上后散热块会和显卡背面金属触点接触(显卡没有背板),怕引起短路等问题,最终更换成一体水冷。

电源选择

由于显卡满载就需要至少1000W的功率,再加上CPU内存硬盘,1600W按道理是足够了,为了稳妥选择了振华的2000W电源。需要注意的是这块电源的插头是10A的空调插头,需要买个转接的插线板。

散热问题

服务器已经稳定运行了半年多,散热问题还是有必要提一下。虽然机箱装满了4个机箱风扇以及3个一体水冷的风扇,显卡也是机器学习专供的涡轮版可以及时将热气排到机箱外,但是由于机箱放置在只开着一扇窗户的小机房里,导致机房温度骤升(机箱的铁板烫的不敢用手摸)。最终在窗户上加上排气扇解决。四块显卡满载情况下,最下面的显卡温度控制最好,在76度左右,剩下的三块显卡均达到82度,可能碰到了功耗墙。

总结

本次装机除显卡为天猫旗舰店购买外,其余均在京东自营购买。如果下次还有机会重组一套配置的话,显卡的显存会尽可能换大一些的,CPU会尝试使用AMD,可能的话选择水冷(风险和维护成本有点高)。