簇是一个文件单位的概念,一般会说一个文件占用了多少个簇,簇可以看成是多个扇区的集合。
一个扇区512个字节,一个簇可以是4个扇区、8个扇区、16个扇区、32、64、128、256、512个.........等等;这个我们称它为簇大小,也就是一个簇占用了多少个扇区。
在同一个分区内,所有簇的大小是一样的;在两个不同的分区中,每个簇的大小不一定相同,这取决于用户在创建分区时来指定。
簇在数据恢复中常常被用于描述文件占用的空间,也就是说一个文件占用了多少簇,假设现在有一个文件占用了8个簇,默认簇大小是8个扇区的话,该文件就占用了8簇 * 8扇区 = 64个扇区,一个扇区又有512个字节(bytes),那么这个文件在计算机中占用的字节数为 64扇区 * 512bytes = 32768 bytes
假设当前分区的簇单位为 8个扇区,也就是8 * 512bytes = 4096 bytes。现在有一个文件,它的大小是5000个字节(bytes),这时候计算机就会分配两个簇给这个文件(2 * 4096 bytes = 8192 bytes);
4096 bytes(一个簇的大小) < 5000 bytes(文件的大小) < 8192 bytes(两个簇的大小)
这时候文件会把第一个簇给占用满,第二个簇会占用到 5000-4096 = 904(bytes)个字节,剩下的空间计算机不会再分配给另一个文件,所以无论文件大小是多少,除非正好是簇大小的倍数,否则文件所占用的最后一个簇或多或少都会产生一些剩余的空间,且这些空间又不能给其它文件使用,即使这个文件只有0字节,也不允许两个文件或两个以上的文件共用一个簇,不然会造成数据混乱。