对于刚刚接触linux系统的人来说,可能最难以适应的是新的linux文件系统,笔者也有着同样的疑惑,在查阅资料阅读、网上资料的基础上,理清楚了一些思路,在这里把自己在平台转变过程对文件系统的理解整理出来。
从真实到虚拟的转变
使用window平台文件系统人都会习惯:将不同用途的文件放在不同的分区下,例如第三方软件安装到D盘,电影音乐放在E,F盘,当找东西时第一件事是先找到分区,但在linux下在文件系统中看不到分区,则也造成了windows用户初始使用的不习惯。
在刚刚安装linux系统进行设置时,我们也会看到分区
按照教程依次将分区挂载到目录上,完成安装后我们就基本很少注意到分区的存在了。
** linux系统将物理磁盘抽象出来,从而为用户提供一个统一的界面来进行操作 **
在windows下我们看到的画面是这样的
C:\Program Files
D:\Game
E:\Movie
但在linux会看到这样的画面
初始设置的分区全都存在于同一个根目录下,以同样的形式呈现出来。
** 我们看到的并非windows下的真实分区,而是一个虚拟出来的文件系统 **
由此我们引入一个新的概念 虚拟文件系统
虚拟文件系统VFS
Linux支持多种类型的文件系统,因为它将底层与应用层分隔开,提供统一的接口支持应用层对于不同实现的文件系统的访问,这个统一的接口称为虚拟文件系统VFS。
- VFS为用户进程提供了一组统一的访问文件,目录和其他对象的统一方法
- VFS能够与不同的底层文件系统相适配。
VFS有4个主要的对象类型
超级块对象
存 储一个已安装的文件系统的控制信息,代表一个已安装的文件系统;每次一个实际的文件系统被安装时,内核会从磁盘的特定位置读取一些控制信息来填充内存中的 超级块对象。一个安装实例和一个超级块对象一一对应。超级块通过其结构中的一个域s_type记录它所属的文件系统类型。
VFS超级块是各种逻辑文件系统在安装时建立的,并在这些文件系统卸载时自动删除,它只存在于内存中。打开文件对象
file是和进程相关的,file代表一个打开的文件,file和inode之间是多对一的关系,因为多个进程可以打开同一个文件,系统会为每一次打开都创建一个file结构。inode对象
存储一个文件相关的信息,对于磁盘文件系统,这个对象通常对应磁盘上的一个文件控制块(磁盘inode)。
在Linux系统中,一个文件可以分成几个数据块存储.每个文件对应一个inode。这个inode中包含多个指针,指向属于该文件各个数据块。当操作系统需要读取文件时,只需要根据inode指向的位置,收集起分散的数据块,就可以获得我们的文件了。
在Linux下,可以使用$stat filename,来查询某个文件对应的inode编号。
每个inode有一个唯一的整数编号(inode number)表示,在文件系统中唯一标示。
inode仅仅是文件在内核内存中的表现形式
inode只包含数据块的位置信息,可以理解为指针,指针并不表示数据本身,只是指明了数据存储的位置。
- 目录项对象dentry
引 入目录项的概念主要是出于方便查找文件的目的。一个路径的各个组成部分,不管是目录还是普通的文件,都是一个目录项对象。如,在路径/home /source/test.c中,目录 /, home, source和文件 test.c都对应一个目录项对象。不同于前面的两个对象,目录项对象没有对应的磁盘数据结构,VFS在遍历路径名的过程中现场将它们逐个地解析成目录项 对象。
目录项在内核中起到了连接不同的文件对象inode的作用,进而起到了维护文件系统目录树的作用。dentry是一个纯粹的内存结构,由文件系统在提供文件访问的过程中在内存中直接建立。dentry中包含了文件名,文件的inode号等信息。
** 目录项只在内存中建立 **
介绍了几个VFS基本对象后,下面疏理下VFS管理文件的思路
VFS访问文件系统过程
- 在读取一个文件时,总是从根目录开始读取,每一个目录或者文件,在VFS中,都是一个文件对象,每一个文件对象都有唯一的一个inode与之对应。
- 读取到的第一个inode就是根目录的。读取到了该目录后,内核对象会为该文件对象建立一个目录项对象,并将其缓存起来,方便下一次读取时直接从内存中取。
- 目录本身也是一个文件,目录文件的内容即是该目录下的文件的名字与inode号,目录文件的内容就像一张表,记录的文件名与其inode no.之间的映射关系。根据路径即可找到当前需要读取的下一级文件的名字和inode,同时继续为该文件建立dentry
- dentry结构是一种含有指向父节点和子节点指针的双向结构,多个这样的双向结构构成一个内存里面的树状结构,也就是文件系统的目录结构在内存中的缓存了。
我们可以看到
- linux文件系统是一个树形结构
- linux将底层文件系统与用户层完全分离开来
- Windows的目录结构属于分区而Linux分区 '加载' 于目录结构。
总结
VFS的设计体现了一种抽象层的设计思维。
设计软件,本质上就是在解决如何管理复杂性的问题,我们从事软件开发的过程中,经常遇到软件升级修改的问题,对于常见的模块替换来说,可能导致其他调用模块访问接口的修改,产生很大的工作量。
“抽象层”使调用者可以忽略被调用者的具体内容,对于不同的对象提供的可扩展性的接入,对访问提供统一标准的支持。
个人理解设计模式中的“策略模式”中包含了这种思维,是一种简化体现的方式, 策略模式中Strategy类为Context定义了一系列的可供重用的算法或行为,析取出这些算法中的公共功能,并且提供了可以替换继承关系的办法,正如抽象层设计思维提取出下层的共性特征提供给上层,并提供了下层的替换方式,使得系统内核与应用软件能够以相同的方式对不同的文件系统进行访问。
** 本文内容夹杂了一些个人观点,如有不正之处欢迎指出 **