我们常常看到SSD上显示支持ECC。那么ECC是个什么东西呢?
ECC是SSD的数据校验、纠错。
为什么SSD需要ECC呢?
原因:
1.SSD容易产生数据读写错误。ECC需要去校验更改数据错误,以及判断是否坏块。
2.SSD读写的介质是NANDFLASH。而NANDFLASH在生产过程和使用过程中都会产生坏块。
为什么NANDFLASH会产生数据读写错误呢?
原因:
1.写入集中、写入放大、异常断电等等,数据读写错误是普遍的。
2.NANDFLASH坏块引起数据读写错误。
为什么NANDFLASH会有坏块?
原因:
1.生产时的造成的坏块。
2.使用中造成的坏块。NANDFLASH是通过电荷来实现数据储存的,而当电荷击穿底层的绝缘层,坏块或就出现了。
坏块太多的NANDFLAH,无法通过测试,就成了黑片,部分测试未通过NANDFLASH基本能用就成了白片,而NANDFLAH的坏块少并且通过全部测试是为正片。
NANDFLASH中坏块是普遍存在的,只是多少的问题。这些坏块影响NANDFLASH/SSD的读写性能和寿命。
如上图,SSD的写入主要分为顺序读写和随机读写,而SSD使用中不断增加的坏块,随机的出现在SSD的NANDFLASH中,这使得SSD读写时容易出现错误,和增加读写的等待时间。
为了减小坏块、错误数据对NANDFLASH/SSD的影响。主控需要对NANDFLASH里的坏块进行判定、校正错误数据、对坏块进行管理。于是主控加入了BBM坏块管理和ECC校验纠错。
ECC找到坏块或者“伪坏块”,对它们进行判断、识别、纠正、标注,如果确定它们是真的坏块,则将其交给BBM去管理。
这样在主控的干预下,SSD读写时就可以减少数据错误、避开坏块,从而保证了SSD的读写性能和安全、寿命。
随着主控技术的不断进步。主控的ECC和BBM能力不断增强,主控ECC能力越来越强,BBM也能管理和屏蔽更多的坏块了。
这使得SSD对NANDFLASH的品质要求越来越低。这使得黑片都可以拿来做SSD,且性能勉强达到使用要求。
主控进步是SSD技术的一种进步,但是降低对NANDFLASH品质的要求对于我们消费者来说,却是一件坏事。因为黑片从此可以暗度陈仓,鱼目混珠了。
简单的讲了讲ECC和SSD的坏块管理,就叭叭叭说了一大通。如果有错误和遗漏,欢迎交流。
下面我们来一点实际的。我们来看看如何通过查看“ECC的运行历史/状况”来大概看懂一个SSD的好坏。
(声明:此方法是我无意中发现的,是结合了ECC和BBM知识的一种猜想,有待验证。)
我用SSD-Z测到硬盘S.M.A.R.T自我检测分析报告,在里面,我看到“ECC错误率”格式化为682。而我的SSD才使用214小时。我的电脑几乎是24小时开机,也就是说我的SSD才使用15天以内。半个月时间,我的ECC检查到和格式化的错误数据/坏块达到了682次/个。
我用鲁大师测试SSD。硬件ECC校正数据达到了699。
这两个图说明,我的SSD“牛仔很忙”。
为什么SSD使用不久,但是ECC却很忙,检查到/纠正过的数据错误或者发现的坏块非常多?
因为:
1.可能是NANDFLASH品质很渣。
2.可能是SSD主控不给力。
只有这两个可能,且任何一个都代表SSD可能很差劲。
确实如此,我的SSD速度测试,顺序读为300多MB/S,顺序写入不到20MB/S,4K也是不堪入目,是一个性能比HDD还糟糕的SSD。
另外我也用其他SSD用上面的方法检测过。也证明,我们通过看“ECC的运行历史/状况”可以大概了解到SSD主控和NANDFLASH的好坏,进而了解到这款SSD的好坏。
(但是由于ECC的版本不同,可能有的SSD在测试时无法看到“ECC的运行历史/状况”。大家不妨自己试试。)