进程和线程
- 进程是程序执行的基本单位,也是操作系统资源分配的基本单位,拥有独立的内存空间和系统资源。一个进程至少有一个线程,可以有多个线程。
- 线程是进程内部的执行单元,是处理器任务调度和执行的基本单位。由于线程是进程的一部分,因此线程也被称为“轻量级进程”。
多线程
本节参考内容:
多线程用于解决多任务同时执行的需求,可以更合理地利用CPU资源。多线程以时分的方式,通过切换CPU所执行的任务实现,该切换取决于CPU的调度策略,因此具有不确定性。
并发:指一个系统能够同时执行多个任务。在单处理器的系统中,多个任务是交替执行的,因此处理器实际上在一段时间内只能同时执行一个任务,但由于执行任务的切换时间极短,所以看上去像是在多个任务同时运行。
并行:指一个系统同时执行多个任务,每个任务都在不同的处理器核心上执行,是真正的同时执行。
并发强调的是在单位时间内有多个任务在执行,但这些任务实际上可能是交替执行的;而并行强调在同一时刻有多个任务在同时执行。
以下在Linux系统中,以C语言为例,对多线程的有关函数进行梳理。所有函数除非另外指出,在调用时需包含pthread.h这一头文件。
线程的创建
pthread_create()函数用于创建线程,其函数原型如下:
int pthread_create(pthread_t* thread, const pthread_attr_t* attr, void* (*start_routine)(void*), void* arg);
- thread:指向pthread_t类型的指针,用于存储新创建线程的标识符。在成功创建线程后,该指针将被填充为一个唯一的标识符,用于后续对该线程的引用。
- attr:指向pthread_attr_t类型的指针,用于指定线程的属性。线程属性可以控制线程的某些行为,例如线程的调度策略、栈大小、分离(detach)状态等。如果不需要对线程属性进行特殊设置,可以指定为NULL。
- start_routine:指向线程函数的指针,是线程的入口,线程被创建后,将从该函数开始执行。线程函数的返回类型必须为void,并可以接受一个类型为void的参数。
- arg:指向传递给线程函数的参数的指针。可以将任意类型的数据转换为void*类型后传递给线程函数,在线程函数内部再通过适当的类型转换将其恢复成原始类型。
返回值:线程创建成功返回0,否则返回相应的错误号。
线程的退出
线程内部可以调用pthread_exit()函数以退出当前线程,其函数原型如下:
void pthread_exit(void* value_ptr);
- value_ptr:传递线程的退出值,若不关心可设为NULL。线程的退出值可用于pthread_join()函数的参数中。
返回值:无。
获取线程ID
pthread_self()函数用于获取当前线程的ID,其函数原型如下:
pthread_t pthread_self();
返回值:当前线程的ID。
线程的回收
pthread_join()函数用于阻塞等待指定ID的线程退出并回收线程资源,并可通过value_ptr参数获取线程的退出状态,其函数原型如下:
int pthread_join(pthread_t thread, void** value_ptr);
- thread:要回收的线程标识符,
- value_ptr:用于接收线程的返回值。
返回值:成功回收线程返回0,否则返回相应的错误号。
由于pthread_join()函数是一个阻塞函数,因此只要子线程在运行,调用该函数的线程就会被阻塞,直到子线程结束运行,调用该函数的线程才会继续向下执行。且pthread_join()函数每次被调用只能回收至多一个线程,如果要实现对多个线程的回收,就需要循环调用pthread_join()函数。
线程的分离
POSIX线程的一个特点是:除非线程具有分离属性,否则该线程除非通过pthread_join()函数回收,其资源不会释放。(进程结束时,其所占用的全部资源会被释放。)
pthread_detach()函数用于为线程设置分离属性,具有分离属性的线程在结束后,其退出状态不能由其他线程所获取,并且会自动释放资源,多用于网络和多线程服务器。其函数原型如下:
int pthread_detach(pthread_t thread);
- thread:待设置分离属性的线程。
返回值:成功设置分离属性返回0,否则返回相应的错误号。
线程的取消
pthread_cancel()函数用于取消线程。线程的取消可类比为进程的kill()函数,但调用pthread_cancel()函数不一定能真正取消指定的线程,只有当线程进入内核时才能被取消,如果线程一直运行于用户空间则无法被取消。其函数原型如下:
int pthread_cancel(pthread_t thread);
- thread:待取消的线程。
返回值:成功设置分离属性返回0,否则返回相应的错误号。
如果线程处于PTHREAD_CANCEL_ENABLE状态,则其会响应ptherad_cancel()函数而被取消;而如果线程处于PTHREAD_CANCEL_DISABLE状态,则取消线程的请求就会维持在挂起状态。默认情况下,线程都处于PTHREAD_CANCEL_ENABLE状态。
信号量
信号量用于进程或线程间的同步。信号量值为正时,获取到该信号量的进程或线程可以进行相关操作;信号量值为0时,尝试获取该信号量的进程或线程就会被挂起,或者不执行相关操作。
Linux共提供两种信号量:
- 内核信号量:由内核控制路径使用;
- 用户态进程使用的信号量:又区分为POSIX信号量和SYSTEM V信号量。
POSIX信号量又分为:
- 无名信号量:值保存于内存中,常用于线程间同步;
- 有名信号量:值保存在文件中,既可用于线程间同步,也可用于进程间同步。
POSIX信号量引用的头文件是semaphore.h,其值始终大于等于0。
以下探讨的均为POSIX信号量,为叙述简便,简称为信号量。
无名信号量
信号量具有自己的数据类型sem_t,其本质是一个长整型的数。
信号量的初始化
sem_init()函数用于信号量的初始化,其函数原型如下:
int sem_init(sem_t* sem, int pshared, unsigned int value);
- sem:指向sem_t类型的指针;
- pshared:值为0时表示该信号量在线程间共享,值大于0表示该信号量用于多个相关进程(即使用fork()创建的进程)间的同步;
- value:信号量的初始值。
返回值:成功初始化信号量返回0,否则返回相应的错误号。
信号量值的查询
sem_getvalue()函数用于获取指定信号量的当前值,其函数原型如下:
int sem_getvalue(sem_t* sem, int* sval);
- sem:指向待获取值的信号量的指针;
- sval:指向获取到的信号量值的指针。
返回值:成功获取到信号量的值返回0,否则返回-1。
信号量的销毁
sem_destroy()函数用于销毁指定的信号量(能被成功销毁的条件:没有线程在等待该信号量),释放其占用的资源,其函数原型如下:
int sem_destroy(sem_t* sem);
- sem:待销毁的信号量。
返回值:成功销毁返回0,否则返回-1。
信号量资源的释放
sem_post()函数用于将指定信号量的值加1,为V操作,同时也是原子操作,即如果有两个线程同时对同一信号量调用sem_post()函数,这种情况下不会发生冲突,信号量的值会始终加2。其函数原型如下:
int sem_post(sem_t* sem);
- sem:待进行值加1操作的信号量。
返回值:操作成功返回0,否则返回-1并设置errno。
信号量资源的申请
sem_wait()函数用于以阻塞形式将指定信号量的值减1,为P操作,同时也是原子操作。此外,sem_trywait()函数是sem_wait()函数的非阻塞形式,sem_timedwait()是sem_wait()函数的定时阻塞形式。这三个函数原型如下:
int sem_wait(sem_t* sem);
int sem_trywait(sem_t* sem);
int sem_timedwait(sem_t* sem, const struct timespec* abs_timeout);
- sem:待进行值减1操作的信号量。
- abs_timeout:指向struct timespec结构体的指针,指定了阻塞等待信号量的时间上限。
返回值:操作成功返回0,否则返回-1并设置errno。
struct timespec位于time.h头文件中,其定义为:
struct timespec { time_t tv_sec; // seonds long tv_nsec; // nanoseconds };
实际上tv_sec和tv_nsec都是long数据类型。调用clock_gettime()函数可以获取实时时间,例如:
struct timespec curr_time; clock_gettime(CLOCK_REALTIME, &curr_time); uint64_t curr_time_in_ns = tv_sec * 1e9 + tv_nsec;
如此便能得到以纳秒(ns)为单位的自1970年1月1日00:00:00 UTC开始的绝对时间,该时间存放在uint64_t类型的变量curr_time_in_ns中。
通过指定不同clock_gettime()函数的第一个参数,还可获取其他类型的时间。
有名信号量
有名信号量的特点是把信号量的值保存在文件中,这使得其既可用于线程间同步,也可用于相关进程间的同步,甚至用于不相关进程间的同步。
有名信号量在使用时,和无名信号量共享sem_post()和sem_wait()及其衍生形式函数。区别在于有名信号量使用sem_open()函数代替sem_init()函数,并且在结束时需要像关闭文件那样去关闭这个信号量。
信号量的打开/创建
sem_open()函数用于打开或创建一个有名信号量,其函数原型如下:
sem_t* sem_open(const char* name, int oflag, ...);
- name:有名信号量的名称;
- oflag:打开标志,常用的有O_CREAT和O_EXCL。如果使用了O_CREAT标志位,函数形参列表中的...用于指定信号量的权限和初始值。
oflag指定为O_CREAT时,若name所对应的信号量不存在,则会创建一个以name命名的信号量,且函数形参列表中的...都必须有效;若name所对应的信号量已存在,则会直接打开该信号量,且忽略函数形参列表中的...。
oflag指定为O_CREAT | O_EXCL时,若name所对应的信号量已存在,则sem_open()函数会直接返回SEM_FAILED。
返回值:成功打开或创建信号量则返回指向信号量的指针,否则返回SEM_FAILED。
Linux中,有名信号量都创建在/dev/shm目录下。假设将name命名为mysem,则所创建出的文件名为sem.mysem。
信号量的关闭
sem_close()函数用于关闭已打开的信号量,其函数原型如下:
int sem_close(sem_t* sem);
- sem:指向待关闭的已打开有名信号量的指针。
返回值:成功关闭返回0,否则返回-1。
信号量的删除
sem_unlink()函数用于从系统中删除指定有名信号量,其函数原型如下:
int sem_unlink(const char* name);
- name:待删除有名信号量的名称。
返回值:成功删除返回0,否则返回-1。
在删除有名信号量前,需确保该有名信号量已通过sem_close()函数关闭,如果有任何线程还在使用该有名信号量,sem_unlink()将不会起作用。也就是说,必须是最后一个使用该有名信号量的进程(线程)来执行sem_unlink()函数才会生效。