首先不要太过纠结于线程和进程,因为对于linux操作系统而言,进程和线程的最大的区别就是对资源共享
http://lkml.iu.edu/hypermail/linux/kernel/9608/0191.html
一. 如何区分
我们可以通过两个方面:
- 调度、执行的基本单位:每个进程都有自己的运行状态(state)、优先级、寄存器等,是OS调度的基本单位。
- 资源所有权:包括程序(program text)、数据(data )、文件(open file)等资源。一个进程拥有对这些资源的所有权,OS则提供保护功能,避免不同进程之间的资源冲突。
传统上我们认为,线程是最小的调度单元,而进程是最小的资源分配单元!
即:
- 进程是资源的容器,必须包含一个或多个线程。
- 内核调度的基本单位是线程、而非进程。
- 同一进程下的各个线程共享部分资源,但线程间私有栈等不共享
这样的好处是:
1. 创建、销毁、切换(看操作系统)的thread比process快很多
2. 由于共享地址空间,线程通信比进程通信高效得多
二.如何选择(从逻辑概念上理解,不谈具体的操作系统)
多进程:
优点:不互相影响,更安全
缺点:数据不共享,进程通讯较为麻烦,创建慢(网上查的,未能亲自验证)
多线程:
优点:创建速度快,数据共享
缺点:线程间相互影响,需要同步锁等操作
简而言之:
对于java而言,你基本不用考虑,果断用多线程吧!(哈哈)
三.问题
1.一个进程产生的线程可以跑在多个核上吗?
类似的问题还有 java线程可以在运行在多个cpu核上吗?
这类问题,归根结底,其实想问的是,操作系统的调度面对线程还是进程!
这里我们可以明确 操作系统的调度是面对线程(概念上)!
但是有个前提,这个线程被放到操作系统调度器上
这里我们必须知道操作系统把线程分成两类:用户线程和内存线程
简单说下二者应用上的区别:
用户线程:创建快,无法被打断,无法利用多核并行,即同一进程下的各个用户级线程无法同时运行在多个cpu上(因为内核根本不知道有用户线程这东西)
内核线程:创建慢,可以被打断,可以利用多核并行,是操作系统最小的调度单位
所以我们可以得出结论:如果创建的是内核线程,那么理论上可以利用多核并行,但是如果是用户线程,那么只能并发!
2.linux的线程和进程
//TODO,等有时间看完操作系统在回过头来学习linux系统的时候再说