PCID全称是Intel的process context identifier,目的是为了解决进程切换时TLBflush导致的性能下降问题。提出了好多年,但是直到最近才重新引起关注。
因为2018年的安全漏洞meltdown和spectre,导致各个操作系统紧急出台修补方案,这个就是KPTI,内核页表的隔离。由于KPTI的引入,导致了已有业务的性能下降,最高超过了30%。Linux使用了PCID,目的就是为了缓解KPTI机制引入的过大的性能下降。
尽管如此,PCID+KPTI仍然使得已有workload的性能下降,有报道说大约5%。
熟悉X86的都知道,提到进程切换引起的TLB flush,那就是来自CR3的加载,而PCID就是放在了CR3当中。因为CR3的特殊用法,使得PCID实际只有12位,理论上只能支持4096个process的使用,这在现今的Linux系统里面时不切实际。所以Linux采取了折中的方案,具体请参考http://happyseeker.github.io/kernel/2018/05/04/pti-and-pcid.html
而这里主要还是简单讲讲在支持PCID的Intel X86上,怎么正确的做到TLBflush。这个就是来自Intel SDM的描述,如下。
目前Linux内核只使用了6个PCID给用户进程,这个可以通过读取进程CR3来进行确认。示例代码的输出如下(Ubuntu18.04, 4.15.17)。
CR3=0x41e478005
CR4=0x1606e0
Current Process[3165] = cat
XXXX process 3165 CR3 = 41e478000, context_id = 1029
CR3=0x427bdc002
CR4=0x1606f0
Current Process[3166] = cat
XXXX process 3166 CR3 = 427bdc000, context_id = 102b
CR3=0x42786c003
CR4=0x1606e0
Current Process[3167] = cat
XXXX process 3167 CR3 = 42786c000, context_id = 102d
CR3=0x424cc2005
CR4=0x1606e0
Current Process[3168] = cat
XXXX process 3168 CR3 = 424cc2000, context_id = 102f
CR3=0x4281a8006
CR4=0x1606e0
Current Process[3169] = cat
XXXX process 3169 CR3 = 4281a8000, context_id = 1031
CR3=0x4295c0006
CR4=0x1606e0
Current Process[3170] = cat
XXXX process 3170 CR3 = 4295c0000, context_id = 1033
CR3=0x424148004
CR4=0x1606e0
Current Process[3171] = cat
XXXX process 3171 CR3 = 424148000, context_id = 1035
从输出可见,PCID是使能了(bit17 of CR4),而且进程的PCID都在预期的范围内。
后续会实际操作TLB flush,看看有和没有TLB flush的区别。