文件描述符fd

这里以问答的方式来讨论这个问题:

1. 文件描述符 fd 和文件指针 FILE *的关系?

文件描述符是什么?我们知道每一个进程都有一个自己的PCB(进程控制块),进程控制块的结构是:

struct task_struct {
     volatile long state;  //说明了该进程是否可以执行,还是可中断等信息
     unsigned long flags;  //Flage 是进程号,在调用fork()时给出
     int sigpending;    //进程上是否有待处理的信号
     mm_segment_t addr_limit; //进程地址空间,区分内核进程与普通进程在内存存放的位置不同
     //0-0xBFFFFFFF for user-thead
     //0-0xFFFFFFFF for kernel-thread
      
      
     //调度标志,表示该进程是否需要重新调度,若非0,则当从内核态返回到用户态,会发生调度
     volatile long need_resched;
     int lock_depth;  //锁深度
     long nice;       //进程的基本时间片
      
      
     //进程的调度策略,有三种,实时进程:SCHED_FIFO,SCHED_RR, 分时进程:SCHED_OTHER
     unsigned long policy;
     struct mm_struct *mm; //进程内存管理信息
     int processor;
      
      
     //若进程不在任何CPU上运行, cpus_runnable 的值是0,否则是1 这个值在运行队列被锁时更新
     unsigned long cpus_runnable, cpus_allowed;
     struct list_head run_list; //指向运行队列的指针
     unsigned long sleep_time;  //进程的睡眠时间
      
      
     //用于将系统中所有的进程连成一个双向循环链表, 其根是init_task
     struct task_struct *next_task, *prev_task;
     struct mm_struct *active_mm;
     struct list_head local_pages;       //指向本地页面      
     unsigned int allocation_order, nr_local_pages;
     struct linux_binfmt *binfmt;  //进程所运行的可执行文件的格式
     int exit_code, exit_signal;
     int pdeath_signal;     //父进程终止是向子进程发送的信号
     unsigned long personality;
      
      
     //Linux可以运行由其他UNIX操作系统生成的符合iBCS2标准的程序
     int did_exec : 1;
     pid_t pid;    //进程标识符,用来代表一个进程
     pid_t pgrp;   //进程组标识,表示进程所属的进程组
     pid_t tty_old_pgrp;  //进程控制终端所在的组标识
     pid_t session;  //进程的会话标识
     pid_t tgid;
     int leader;     //表示进程是否为会话主管
     struct task_struct *p_opptr, *p_pptr, *p_cptr, *p_ysptr, *p_osptr;
     struct list_head thread_group;   //线程链表
     struct task_struct *pidhash_next; //用于将进程链入HASH表
     struct task_struct **pidhash_pprev;
     wait_queue_head_t wait_chldexit;  //供wait4()使用
     struct completion *vfork_done;  //供vfork() 使用
     unsigned long rt_priority; //实时优先级,用它计算实时进程调度时的weight值
     
     
     //it_real_value,it_real_incr用于REAL定时器,单位为jiffies, 系统根据it_real_value
     //设置定时器的第一个终止时间. 在定时器到期时,向进程发送SIGALRM信号,同时根据
     //it_real_incr重置终止时间,it_prof_value,it_prof_incr用于Profile定时器,单位为jiffies。
     //当进程运行时,不管在何种状态下,每个tick都使it_prof_value值减一,当减到0时,向进程发送
     //信号SIGPROF,并根据it_prof_incr重置时间.
     //it_virt_value,it_virt_value用于Virtual定时器,单位为jiffies。当进程运行时,不管在何种
     //状态下,每个tick都使it_virt_value值减一当减到0时,向进程发送信号SIGVTALRM,根据
     //it_virt_incr重置初值。
     unsigned long it_real_value, it_prof_value, it_virt_value;
     unsigned long it_real_incr, it_prof_incr, it_virt_value;
     struct timer_list real_timer;   //指向实时定时器的指针
     struct tms times;      //记录进程消耗的时间
     unsigned long start_time;  //进程创建的时间
      
      
     //记录进程在每个CPU上所消耗的用户态时间和核心态时间
     long per_cpu_utime[NR_CPUS], per_cpu_stime[NR_CPUS];
      
     //内存缺页和交换信息:
     //min_flt, maj_flt累计进程的次缺页数(Copy on Write页和匿名页)和主缺页数(从映射文件或交换
     //设备读入的页面数); nswap记录进程累计换出的页面数,即写到交换设备上的页面数。
     //cmin_flt, cmaj_flt, cnswap记录本进程为祖先的所有子孙进程的累计次缺页数,主缺页数和换出页面数。
     //在父进程回收终止的子进程时,父进程会将子进程的这些信息累计到自己结构的这些域中
     unsigned long min_flt, maj_flt, nswap, cmin_flt, cmaj_flt, cnswap;
     int swappable : 1; //表示进程的虚拟地址空间是否允许换出
      
      
     //进程认证信息
     //uid,gid为运行该进程的用户的用户标识符和组标识符,通常是进程创建者的uid,gid
     //euid,egid为有效uid,gid
     //fsuid,fsgid为文件系统uid,gid,这两个ID号通常与有效uid,gid相等,在检查对于文件
     //系统的访问权限时使用他们。
     //suid,sgid为备份uid,gid
     uid_t uid, euid, suid, fsuid;
     gid_t gid, egid, sgid, fsgid;
     int ngroups; //记录进程在多少个用户组中
     gid_t groups[NGROUPS]; //记录进程所在的组
      
      
     //进程的权能,分别是有效位集合,继承位集合,允许位集合
     kernel_cap_t cap_effective, cap_inheritable, cap_permitted;
     int keep_capabilities : 1;
     struct user_struct *user;
     struct rlimit rlim[RLIM_NLIMITS];  //与进程相关的资源限制信息
     unsigned short used_math;   //是否使用FPU
     char comm[16];   //进程正在运行的可执行文件名
      
      
     //文件系统信息
     int link_count, total_link_count;
     //NULL if no tty 进程所在的控制终端,如果不需要控制终端,则该指针为空
     struct tty_struct *tty;
     unsigned int locks;
      
      
     //进程间通信信息
     struct sem_undo *semundo;  //进程在信号灯上的所有undo操作
     struct sem_queue *semsleeping; //当进程因为信号灯操作而挂起时,他在该队列中记录等待的操作
      
      
     //进程的CPU状态,切换时,要保存到停止进程的task_struct中
     struct thread_struct thread;
      
      
     //文件系统信息
     struct fs_struct *fs;
      
     //打开文件信息
     struct files_struct *files;
      
     //信号处理函数
     spinlock_t sigmask_lock;
     struct signal_struct *sig; //信号处理函数
     sigset_t blocked;  //进程当前要阻塞的信号,每个信号对应一位
     struct sigpending pending;  //进程上是否有待处理的信号
     unsigned long sas_ss_sp;
     size_t sas_ss_size;
     int(*notifier)(void *priv);
     void *notifier_data;
     sigset_t *notifier_mask;
     u32 parent_exec_id;
     u32 self_exec_id;
     spinlock_t alloc_lock;
     void *journal_info;
};

其中task_struct里面保存了指向该进程所有文件表struct files_struct *files的指针,看下files_struct里面哪些东西:

struct files_struct { 
    atomic_t    count;   // 引用计数(共享该file_struct的进程数)
    fd_set      close_on_exec;   // 执行exec时候关闭改文件描述符集合
    fd_set      open_fds;  // 文件描述符的屏蔽集合
    struct      file * fd[NR_OPEN]; // 文件描述符集合
    spinlock_t  file_lock;  // 文件锁
}; 

文件描述符fd就是该进程中具体某个文件信息在文件表file中的索引位置。
那文件指针FILE *是什么呢?文件指针指向进程中一个被称为FILE的结构,它包含一个缓存区和一个文件描述符。通过文件指针访问文件的时候,还是需要通过文件描述符来找到所指向的file结构体。也就是说通过文件句柄访问文件的时候,还是需要通过文件描述符fd去找到文件对应的file。

2. 文件描述 fd 指向的文件表项的具体结构?

struct file * fd[NR_OPEN] 这个数组里面存放的是打开的文件,它是由内核在打开文件的时候创建的。在文件的所有实例都关闭后,内核释放这个数据结构。f_count就是有多少个实例引用了这个文件。

struct  file {
        union {
             struct list_head fu_list;                   //文件对象链表指针linux/include/linux/list.h
             struct rcu_head fu_rcuhead;                 //RCU(Read-Copy Update)是Linux 2.6内核中新的锁机制
        } f_u;
        struct path                        f_path;       //包含dentry和mnt两个成员,用于确定文件路径
        #define f_dentry  f_path.dentry                  //f_path的成员之一,当前文件的dentry结构
        #define f_vfsmnt  f_path.mnt                     //表示当前文件所在文件系统的挂载根目录
        const struct file_operations      *f_op;         //与该文件相关联的操作函数
        atomic_t                          f_count;       //文件的引用计数(有多少进程打开该文件)
        unsigned int                      f_flags;       //对应于open时指定的flag
        mode_t                            f_mode;        //读写模式:open的mod_t mode参数
        off_t                             f_pos;         //该文件在当前进程中的文件偏移量
        struct fown_struct                f_owner;       //该结构的作用是通过信号进行I/O时间通知的数据。
        unsigned int                      f_uid, f_gid;  //文件所有者id,所有者组id
        struct file_ra_state              f_ra;          //在linux/include/linux/fs.h中定义,文件预读相关
        unsigned long                     f_version;     //记录文件的版本号,每次使用后都自动递增。
        #ifdef CONFIG_SECURITY
        void                              *f_security;   //用来描述安全措施或者是记录与安全有关的信息。
        #endif
        /* needed for tty driver, and maybe others */
        void                             *private_data;  //可以用字段指向已分配的数据
        #ifdef CONFIG_EPOLL
        /* Used by fs/eventpoll.c to link all the hooks to this file */
        struct list_head                  f_ep_links;  文件的事件轮询等待者链表的头,
        spinlock_t                        f_ep_lock;   f_ep_lock是保护f_ep_links链表的自旋锁。
        #endif /* #ifdef CONFIG_EPOLL */
        struct address_space              *f_mapping; 文件地址空间的指针
};

3. 文件表项file和底层之间的关系?

聊这个问题需要点文件系统的知识。

4. preforking(预先分配进程)涉及到fd共享问题

服务端并发模型中就有一个模型是:预先生成固定数量的进程,由这些进程去处理客户端的所有网络请求。那就得先fork出一定数量的进程。然后每一个进程都阻塞在accept上等待来自客户端的连接请求。但有一点:在fork出子进程的时候,监听的套接字listenfd已经生成了,且每一进程都共享了这个套接字,即这个文件描述符的引用计数是进程数量。当请求到达的时候每一个进程都会从睡眠中被唤醒,但其实只有一个进程能抢到连接,其他进程又将睡眠。这个问题就是我们常说的"惊群"效应。Linux内核在后来的版本上已经解决这个问题。可以通过查看源码发现:accept4的内核实现上是通过排它锁来解决这个问题的。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,456评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,370评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,337评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,583评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,596评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,572评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,936评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,595评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,850评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,601评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,685评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,371评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,951评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,934评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,167评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,636评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,411评论 2 342

推荐阅读更多精彩内容

  • 简单归纳:fd只是一个整数,在open时产生。起到一个索引的作用,进程通过PCB中的文件描述符表找到该fd所指向的...
    yiltoncent阅读 2,181评论 0 0
  • epoll概述 epoll是linux中IO多路复用的一种机制,I/O多路复用就是通过一种机制,一个进程可以监视多...
    发仔很忙阅读 10,858评论 4 35
  • 本文摘抄自linux基础编程 IO概念 Linux的内核将所有外部设备都可以看做一个文件来操作。那么我们对与外部设...
    lintong阅读 1,563评论 0 4
  • 内核(kernel)利用文件描述符(file descriptor)来访问文件。文件描述符是非负整数。打开现存文件...
    踩在浪花上00阅读 735评论 0 1
  • 0720(第四日)感恩无非,让你能和自己对话。亲爱的金禄:1此时你正在健身房的角落,写着今日的存款,晚上上私教,练...
    胡金禄阅读 224评论 1 1