使用计算机离不开IO设备(键盘、鼠标、串口、打印机等),IO设备一般都有几个寄存器,通常我们都是对寄存器进行读写来控制IO设备的行为的。
不论什么设备,其读写寄存器的过程在硬件层面都是相同的:向地址总线发送电平信号(寻址),向控制总线发送电平信号(例如读写控制等),通过数据总线读写所需的数据。
上面的寻址过程首先要知道IO设备的地址,这个地址成为IO端口地址,简称为端口。
不同的CPU对于外设的编址方式不同,可以分为:统一编址和独立编址。
- 统一编址将外设地址归入到内存地址空间范围内,这种方式的编址CPU访问外设和访问内存的方式是一样的;
- 独立编址把IO设备的地址空间作为一个独立的地址空间,成为IO地址空间,每个端口对应一个IO地址,使用专门的指令来访问端口;
使用ISA总线结构的传统PC机IO地址空间范围是0x000-0x3FF,有1024个IO端口地址可供使用。 各控制器和控制卡所默认分配使用的端口地址范围见下表:
端口地址范围 | 分配说明 | 端口地址范围 | 分配说明 |
---|---|---|---|
0x000-0x01f | 8237A DMA控制器1 | 0x020-0x03f | 8259A可编程中断控制器1 |
0x040-0x05f | 8253/8254A 定时计数器 | 0x060-0x06f | 8042键盘控制器 |
0x070-0x07f | 访问CMOS RAM/实时时钟RTC(Real Time Clock)端口 | 0x080-0x09f | DMA页面寄存器访问端口 |
0x0a0-0x0bf | 8259可编程中断控制器2 | 0x0c0-0x0df | 8237A DMA控制器2 |
0x0f0-0x0ff | 协处理器访问端口 | 0x170-0x177 | IDE硬盘控制器1 |
0x1f0-0x1f7 | IDE硬盘控制器2 | 0x278-ox27f | 并行打印机端口2 |
0x2f8-0x2ff | 串行控制器2 | 0x378-0x38f | 并行打印机端口1 |
0x3b0-0x3bf | 单色MDA显示控制器 | 0x3c0-0x3cf | 彩色CGA显示控制器 |
0x3d0-0x3df | 彩色EGA/VGA显示控制器 | 0x3f0-0x3f7 | 软盘控制器 |
0x3f8-0x3ff | 串行控制器1 |
1. 边际效应
从上面看来,访问寄存器和访问内存的过程是一样的,但是,寄存器的访问可能存在边际效应(side effect, 副作用)。
对于边际效应,我这边个人理解是这样的:对于内存而言,我们对其的操作是存值取值,例如”a=0;b=0;“这两个语句的执行顺序调换对于我期待的结果并没有什么影响,所以编译器可能会对其进行优化,重排序等;而对于寄存器而言,读写操作需要严格按照要求来操作,比如某个寄存器被读一次后就会被清空,如果读写顺便被重排序,就会导致不可预料的问题了,而且也很难排查。
为了排除边际效应的影响:驱动程序必须确保不使用高速缓存(高速缓存会将读写操作在CPU寄存器中完成,使得CPU在不访问RAM,而我们的目的却是读写RAM),并且在访问寄存器时不会发生读写命令的重排序。
对于不使用高速缓存的解决方法是:把底层硬件配置成在访问IO区域时禁止硬件缓存。
对于读写重排序问题,对于必须保证执行顺序的操作之间设置内存屏障(memory barrier)。
#include <linux/kernel.h>
void barrier(void)
#include <asm/system.h>
void rmb(void); // 读内存屏障,保证屏障之前的读操作一定会在后来的读操作执行之前完成
void read_barrier_depends(void); // 与rmb类似,最好使用rmb
void wmb(void); // 写内存屏障,保证写操作的顺序
void mb(void); // 保证读写都不会乱序
内存屏障是会影响系统性能的,所以只能用在真正需要使用的地方。
2. IO端口相关操作
#include <linux/ioport.h>
struct resource *request_region(unsigned long first, unsigned long n, const char *name);
该函数告诉内核我们将要使用起始于first的n个端口。name是设备的名称。分配成功返回非NULL值,否则返回NULL。如果返回NULL,则不能使用申请的端口。
void release_region(unsigned long first, unsigned long n);
如果不再使用IO端口,使用上面的函数释放。
int check_region(unsigned long first, unsigned long n);
检查所需的端口是否可用,但由于该函数并不是原子操作的,因此即使其检查结果正常也不能保证分配一定成功。
当请求了需要的IO端口范围后,读写这些端口的函数如下:
unsigned inb(unsigned port);
void outb(unsgined char byte, unsigned port);
unsigned inw(unsigned port);
void outw(unsgined char byte, unsigned port);
unsigned inl(unsigned port);
void outl(unsgined char byte, unsigned port);
通常会将8/16/32位的端口进行区分,对应上面的b(byte)、w(word)、l(longwork)。
这里没有定义64位的IO操作,因为即使是在64位的体系架构上,端口地址空间也最大只使用32位的数据通路。
上面的函数只是对一个数据进行读写,内核也提供了串操作指令,相关的函数如下:
void insb(unsigned port, void *addr, unsigned long count);
void outsb(unsigned port, void *addr, unsigned long count);
void insw(unsigned port, void *addr, unsigned long count);
void outsw(unsigned port, void *addr, unsigned long count);
void insl(unsigned port, void *addr, unsigned long count);
void outsl(unsigned port, void *addr, unsigned long count);
使用串操作指令时,需要注意字节序的问题,否则会造成不可预测的结果,上面的串操作函数不会完成字节序的交换和匹配,需要自己完成。
3. IO内存操作
上面介绍的IO端口是和设备通信的一种机制,另一种机制是将设备的寄存器或内存映射到内存中,使其的访问类似RAM。虽然类似RAM,但是其仍然存在边际效应。
映射到内存的设备寄存器或内存可能是通过/不通过页表来访问的:如果通过页表来访问,就要先让物理地址对驱动程序可见(调用ioremap映射);如果不是通过页表访问,则类似于IO端口,通过一些函数来读写。
相关的操作函数如下:
struct resource *request_mem_region(unsigned long start, unsigned long len, char *name);
上面的函数从start开始分配len字节长度的区域,分配成功返回非NULL指针,否则返回NULL指针。
void release_mem_region(unsgined long start, unsigned long len);
不再使用已分配的内存区域时,使用上面的函数进行释放。
检查IO内存区域是否可用的函数如下:
int check_mem_region(unsigned long start, unsigned long len);
分配IO内存之后,还需要建立虚拟地址与IO内存的映射关系,使用 ioremap
实现,相关函数如下:
#include <asm/io.h>
void *ioremap(unsigned long phys_addr, unsigned long size);
void *ioremap_nocache(unsigned log phys_addr, unsigned long size);
void iounmap(void *addr);
调用 ioremap
之后,驱动程序即可访问对应的IO内存地址了,某些平台可以直接讲ioremap的返回值当指针直接使用,但不具有可移植性,所以需要使用内核提供的函数来访问:
#include <asm/io.h>
unsigned int ioread8(void *addr);
unsigned int ioread16(void *addr);
unsigned int ioread32(void *addr);
void iowrite8(u8 value, void *addr);
void iowrite16(u16 value, void *addr);
void iowrite32(u32 value, void *addr);
addr 是ioremap
的返回值。看名字就应该知道含义和使用方法了,这里不再说明。
如果要读写一系列的值,则可以使用以下函数:
void ioread8_rep(void *addr, void *buf, unsigned long count);
void ioread16_rep(void *addr, void *buf, unsigned long count);
void ioread32_rep(void *addr, void *buf, unsigned long count);
void iowrite8_rep(void *addr, void *buf, unsigned long count);
void iowrite16_rep(void *addr, void *buf, unsigned long count);
void iowrite32_rep(void *addr, void *buf, unsigned long count);
还有类似C语言中内存操作相关的函数:
void memset_io(void *addr, u8 value, unsigned int count);
void memcpy_fromio(void *dest, void * source, unsigned int count);
void memcpy_toio(void *dest, void *source, unsigned int count);