1.分区和目录
- 磁盘分区和目录关系:
-- 分区必须挂载到某个目录上
-- 目录是逻辑上的分区,分区是物理上的分区 - 查看分区和目录及使用情况
-- fdisk :查看和配置硬件分区
-- df : 查看分区空间使用情况
-- du : 查看文件占用空间情况
- 物理结构
磁盘物理结构
-- 磁盘面
-- 磁头
-- 磁道,盘片中一个同心圆叫一个磁道
-- 柱面,盘片中同一位置的磁道组成的空间叫一个柱面
-- 扇区,一个磁道划分为多个扇区,为一个扇形读取过程
预读取与连续存储,提升IO速度。文件存储结构
-
一个文件由目录项,inode和数据块组成
-- 目录项:包括文件名和inode节点号
-- inode: 又称文件索引节点,包括文件的基础信息以及数据块指针
-- 数据块:包含文件具体内容。
1.1 inode
文件存储在硬盘上,硬盘最小的存储单位是“扇区”sector,每个扇区存储512字节,相当于0.5KB.
而操作系统在读取硬盘时,是一次读取一个块“block”,多个扇区,典型的是8个sector,4KB。
文件存储在扇区中,则必须有存储文件的元信息,比如文件创建者,日期,大小,文件存放位置等,这些存储文件元信息的区域叫做inode。
inode包括:文件字节数,文件的拥有者user ID, 文件的group ID,文件的读、写、执行权限,文件时间戳,链接数,有多少文件名指向这个inode,文件数据的block的位置。可用stat命令查看文件的inode信息。
查看文件时,先从iNode表中查出文件属性以及数据存放点,再从数据块中读取数据。
文件存储结构示意图:
1.2 inode的大小
iNode也占用硬盘空间,格式化时,操作系统将硬盘分为两个区域,一个是数据区,一个是inode区。
每个inode大小为128或者256byte。一个目录下能建多少文件,受限于所在目录分区的inode数量。
1.3 inode节点号
每个inode都有一个inode节点号,os用iNode来识别不同文件。
Linux内部不使用文件名而使用inode号码来识别文件。
系统打开文件过程:
-- 1 根据文件名找到inode号码;
-- 2 通过inode号码,获取inode信息;
-- 3 根据inode信息,找到文件数据所在block,进行读取。
1.4 目录项
目录也是文件,打开目录,其实是打开目录文件。
目录是目录项的列表,每个目录项由两部分组成:所含文件的文件名 + 该文件名对应的inode节点号。
ls -i 可以列出整个目录文件,即文件名和inode号码。
1.5
1.5.1 touch一个新空文件占用磁盘空间情况?
空文件也占用磁盘空间,占用一个inode的大小。
1.5.2 新建一个空目录占用磁盘空间情况?
目录也是占用一个inode节点,block的大小,典型为4k
1.5.3 新建大小为1K的文件,实际占用多大磁盘空间?
系统分配空间以block为最小单位,因此实际占用一个inode(一般为256byte)和1个block(4k)
1.5.4 向操作系统发起读取2byte的文件,实际读取多少?
系统一次性读取一个block,4KB的内容。这就是程序的局部性原理。
- 软、硬链接
硬链接
Linux允许,多个文件名指向同一个inode号码,也就是可以通过不同文件名来读取相同的文件。修改文件时,会影响所有指向这个iNode的文件名。但是删除一个文件时,如果inode的引用不为0,则不会被删除。软链接
文件A,B的inode号码不同,但是文件A的内容是文件B的路径。读取A,系统会自动的访问B。文件A也叫文件B的软链接(soft link),或者符号链接(symbolic link)。这样,文件A会依赖于文件B,如果文件B被删除,则会导致错误"No such file or directory"。
与硬链接区别就是:文件A指向的是文件B的文件名,而不是iNode,这样B的iNode引用数量不会有改变。