NVIDIA CMP-40HX 使用感想与踩坑记录
作为垃圾佬,最近装机瘾又犯了,忍不住入手了一块被B站各UP主称赞的“无头骑士”CMP-40HX,据说该矿卡由RTX 2060 Super阉割而来。
看了一下矿卡攻略,某宝叠券叠金币能把价格干到300块甚至更低,还带质保,是比较有性价比的。但究竟好不好用还是得靠实战。
注意事项
- 40HX只有华硕一家,其使用的散热模具是这个型号。这张卡作为“无头骑士”,自然没有视频输出,所以尽管挡板部分没有去掉输出接口,但它是不能用的。因此在使用这张卡之前,需要准备一个带核显的CPU(Intel 4代以上),或者一个用于输出的亮机卡(需要主板带两个x16长度的pcie槽)。
- 这张卡最大的缺陷是PCIe通道被阉割得只剩1.1x4,以及半精度被大砍。万幸的是,PCIe通道不全的问题可以靠补全金手指上方的电容解决,即从1.1x4补到1.1x16(大致等效3.0x4)。而大部分商家现在为了能更好的卖出去这种矿卡,一般都会补上这组电容,因此在挑选的时候最好优先考虑补全电容的版本;而在计算方面,由于半精度被大幅阉割,只能用单精度去运行AI模型,而这样会导致显存容量占用暴增,对于这个只有8G显存的矿卡是不够用的,因此不建议将这张卡用于AI绘图等方面,打游戏就够了。
- 矿卡的运作环境懂得都懂。有些地方可能环境比较好,拿到手可能发现仅有一些浮灰;另一些地方发货到手可能是灰头土脸、锈迹斑斑,随时都有挂掉的风险。如果你打算要长时间使用这种卡,最好在质保期过了之后立刻拆开进行大保养,否则可能没多久就挂了。至于如何保养可以去看B站UP主们怎么做的。
- 关于驱动,这张矿卡是不能直接用官方驱动的,需要使用魔改驱动。这里提供两个可以使用的魔改驱动:NVIDIA-patcher和雨糖魔改版驱动。它们各有自己的安装方法,需要仔细参阅文档。对用于输出的核显和亮机卡,同样需要打上它们对应的驱动。
- 想让系统默认用40HX,需要手动设置高性能显卡和DirectX/OpenGL默认渲染GPU等内容。这部分操作可以在B站上查到,也可以参考我后续的说明。
- 最终声明,我极不推荐大家去买这种矿卡。如有能力,请直接购买消费级显卡,不要因为贪小便宜而带来更多的麻烦。
到手记录与使用感想
我手里的这张40HX来自于某宝的六菱电子,发货地在四川成都,叠券叠金币后的价格在300元出头,带有三个月的质保。
到手拆开快递之后,我对这张卡的第一印象是:挺大一块的,看着比较唬人。但仔细一看,散热器就两根热管,散热效果可以说是相当差的了。好在这张卡功耗并不高(184W左右),正常来说应该压得下温度的。
显卡的成色也比较干净,没有任何的生锈或氧化腐蚀的痕迹,里面只有少量干燥浮灰。


首先上机,由于本人使用的CPU为R5 5600,没有核显,只能弄一张亮机卡当视频输出,最后从750ti和RX6500之间选择了后者(后续有解释)。
装好之后开机,40HX的RGB灯条闪亮出场,显得它高端上档次,不愧是专业矿卡。


上机测试环节,我使用的是雨糖魔改版驱动,驱动链接和安装方法在上面提供的链接中查看。GPU-Z显示的参数如下:

可以发现,这张矿卡确实是由RTX 2060 Super阉割而来的,除PCIe通道外,其余参数基本一致。而和其他同类型矿卡有所不同的是,40HX保留了视频编解码:

GPGPU测试中,看起来单精度没有被动过,实际上半精度性能被大砍了一刀,后续会有解释。

3D Mark测试中,TS跑分为8356,水平还不错。

在游戏表现上,对比其他同类型矿卡是强很多的,在1080p上能够流畅游玩大部分游戏。
由于本人电脑没有那么多游戏供测试,只能在下面放一张黑神话的测试结果。对这张显卡的游戏测评大多可以在B站找到:

用它玩了几天游戏,感觉还不错。个人认为40HX在现在挺有性价比的,淘宝价格也来到了300出头甚至更低,就算是一年质保也就加个四五十块钱,性能比P106-100和30HX这类矿卡强一些,在2K及以下分辨率玩游戏也算是不错的。
像我在1080p分辨率的情况下,猎人荒野的召唤玩起来相当流畅;在Minecraft上不开光影能保持在300fps左右(需要优化模组),开了光影也有一部分能到60fps以上;而对于osu!这类音游,基本上也能稳定高帧率,就是延迟稍微有点高,大概平均在3.5ms到5ms之间,比原来的平均1.6ms高了不少。如果自己的CPU能够保持稳定运行这类游戏,那么高刷新率不是问题,需要担心的点在延迟上。延迟来自于显卡之间的数据传输,因此除了矿卡以外,最重要的还是亮机卡的性能,既不能太弱也不能强过矿卡(不然太强我要矿卡有啥用);对于fps游戏应该也是同样的道理,如有不对可以在评论区指出。
不过由于这类无头显卡要走核显或亮机卡,一通损耗下来,也只是强的有限,和正经显卡对比也就那样,更何况隔壁AMD同样是矿卡的5600XT和5700XT性能还更强。
踩坑记录1:亮机卡选择
之前有提及过,我手里既有一张750ti,也有一张RX6500,分别代表的是N家和A家。我分别插在第二个PCIe插槽上当亮机卡,速率为3.0x4。
750ti的最大劣势是HDMI版本太低,只能跑个1080p 120hz,RX6500可以跑满这个1080p 200hz的屏幕。
结果我在测试的过程中,两种N卡组一起反而发生了很麻烦的事情:Minecraft的画面撕裂非常严重,而且其他游戏的帧率也一样被严重限制。而我换到RX6500之后反而没有再出现这个问题了。
看得出来两个N卡的冲突概率是相当的高。我至今还没有发现是什么原因,目前还在排查中(目前推测是750ti太老而且性能太弱)。
踩坑记录2:高性能显卡选择
建议参照以下截图列出的步骤顺序进行,其中后面的两个脚本都需要管理员操作。运行patch_drv脚本时,建议按照提示进行操作;在选择默认GPU_v1.1脚本中,分别选择选项2和选项3,然后在它们的下一步选项中选择你的矿卡所展示的编号,再输入y并回车,之后重启就能完成游戏时显卡的默认选择了。

以上提及的两个脚本都可以在雨糖魔改版驱动中的下载地址找到;NVIDIA App需要自行前往NVIDIA官网下载;亮机卡如果是AMD的去AMD官网,是Intel的去Intel官网,以此类推。
踩坑记录3:半精度性能
这里忘记了截图,但我对这个测试有大致的记录。
在Stable Diffusion XL下运行半精度模型,生成一张简单的512×512图像竟然需要长达一分钟,1024×1024更是超级加倍到五分钟,同一个SDXL模型下对比Tesla M40这种老计算卡甚至更慢。而使用显存占用小的Stable Diffusion 1.5下运行单精度模型,同样的512×512图像则只需要6秒。
这已经很明显了,半精度就是被砍过的。除非找一位手眼通天的维修佬把显存扩到16G,否则用单精度跑AI绘图是不现实的。
