终于赶在2017年结束前,点亮了我的深度学习工作站。
配置表
配件 | 型号 | 价格 | 数量 | 合计 |
---|---|---|---|---|
GPU | 微星 GTX 1080 Ti AERO 11GB | 5999 | 2 | 11998 |
CPU | 英特尔 i7 6850K | 3799 | 1 | 3799 |
主板 | X99-E WS/USB 3.1 | 4298 | 1 | 4298 |
内存 | 海盗船复仇者16G/3000 | 1749 | 2 | 3498 |
SSD | 浦科特 PX-512M8SeG M.2 | 1899 | 1 | 1899 |
电源 | 长城 额定1250W 巨龙GW-EPS1250DA | 1099 | 1 | 1099 |
散热器 | 追风者 TC14PE双塔旗舰版 | 399 | 1 | 399 |
机械硬盘 | 希捷酷鱼系列 2TB 7200转64M SATA3 | 399 | 1 | 399 |
机箱 | 美商海盗船 780T 黑色 全塔机箱 | 1259 | 1 | 1259 |
总计 | 28648 |
工作站的选型和系统安装主要借鉴了以下两篇简书文章,都相当靠谱:
由于这两篇已经写的非常详细了,所以相同的部分就没必要再赘述,下面只记录下我填的坑。
顺便说一句,内存较2017年年中价格翻翻了,所以半年来深度学习工作站总价并未有明显下降。
坑1:显卡尺寸!显卡尺寸!显卡尺寸!
重要的事情说3遍。
作为工作站平台的x99 E WS/USB3.1已经是这个级别为数不多、能插满4张GTX1080ti的主板了,但是显卡的厚度务必以35mm为限。也就是说,基本上带两个大风扇甚至更多风扇的1080ti们,都不可以拿来组多卡。
我不仅买了MSI红龙1080ti,而且还在京东买的——不支持7天无理由退换货。结果连电都没上,直降500大洋挂在闲鱼上。已经出了一张,还剩一张。
MSI Aero 1080ti是OK的,35mm厚,刚刚好。
坑2:X99 E WS/USB3.1供电
X99 E WS/USB3.1供电位置(接电源),有4处,但是只有其中两处是必要的:24pin的主板供电和8pin的CPU供电。前者没有接错可能,后者我接错了。
两个8pin的CPU供电如下图。其实没必要两个都接满,我最终只接了左侧的8pin。
我的问题在于,我用了6pin+2pin组合,结果当满心欢喜首次按下开关时,只听到电源发出两声“嗒嗒”的金属片声音,风扇都纹丝不动。懵逼了数十分钟。现在看应该是断电保护在起作用。
错误的6+2:
对于8pin的CPU供电,务必使用下面的接口:
坑3:U盘安装Ubuntu出现nouveau SCHED_ERROR
由于x99 E WS/USB3.1连个集成显卡也没有,所以在Ubuntu下会有这个状况。按照下面这篇文章的方案即可解决:
安装ubuntu 提示nouveau SCHED_ERROR 08错误解决方案
坑4:Ubuntu启动紫屏卡住
Ubuntu安装好后重启,无需再从U盘启动,所以坑3的方案已经无用了,可此时显卡驱动还没装,就会出现紫屏的问题。本质上和坑3是一回事。
参考这篇即可顺利进入系统,等把显卡驱动装好后就不会再出现了。
双系统共享HDD
我装的双系统Win10+Ubuntu16.04,两者2/3开瓜分了512G的SSD,还有一块2T的HDD作为存储盘。为了实现双系统可以共享这个HDD,只需要做2件事:
- 可先在Windows下对HDD进行GPT分区操作,使用NTFS文件系统;
- 再Ubuntu下进行挂载设置,见下图;