python进阶——6. 线程与进程

6.1 创建线程

有两种方式创建一个线程,一种是实例化Thread,并传参;另一种是通过继承Thread,实现run方法。

from threading import Thread


def test(x):
    print(x)


t = Thread(target=test, args=("dai",))
t.start()


class Test(Thread):
    def __init__(self, value):
        Thread.__init__(self)
        self.value = value

    def run(self):
        test(self.value)


t = Test("blue")
t.start()

thread = []
for i in range(1, 11):
    t = Test(i)
    thread.append(t)
    t.start()
for t in thread:
    t.join()

print("main thread")

其中,join方法让主线程等待子线程结束。

对于python来说,多线程只适用于I/O密集型操作,不适用与CPU密集型操作。所谓I/O密集型操作类似于文件读写和网络相关,CPU密集型操作类似于复杂计算等。其主要的原因是python解释器有GIL锁的限制,不能将任务分配给多个处理器同时操作,所以对于在python中的线程来说,是一个美丽的梦。

6.2 线程间通信

线程中的通信可以通过共享消息队列来实现,在同一进程中,实例可以被多线程访问,但是需要注意的是同时访问需要一种线程安全的数据结构,要使用queue库中的Queue。

下面的实例中,生产者模拟I/O操作,消费者对生产者的结果进行处理,两者之间通过Queue进行通信。

from threading import Thread
from time import sleep
from queue import Queue


class Producer(Thread):
    def __init__(self, sid, queue):
        Thread.__init__(self)
        self.queue = queue
        self.sid = sid

    def run(self):
        self.work()
        self.queue.put((self.sid, 'Producer'+str(self.sid)))

    def work(self):
        sleep(2)
        print("Producer work" + str(self.sid))


class Consumer(Thread):
    def __init__(self, queue):
        Thread.__init__(self)
        self.queue = queue

    def run(self):
        while True:
            sid, data = self.queue.get()
            if sid == -1:
                break
            if data:
                print("Consumer received " + str(data))


if __name__ == "__main__":
    q = Queue()
    p_threads = [Producer(i, q) for i in range(1, 11)]
    c_thread = Consumer(q)
    for t in p_threads:
        t.start()
    c_thread.start()
    for t in p_threads:
        t.join()
    q.put((-1, None))

在生产者中处理work逻辑,并将数据写入到queue中,在消费者中一直死循环,消费掉queue中的数据。在main方法中启动10个生产者线程,开始工作,然后在任务都处理结束之后,设置queue的值-1让消费者跳出循环,结束程序。

6.3 线程事件通知

在python中可以通过threading库中的Event来控制线程之间的事件通知。主要的方法有wait和set,分别代表等待和开始。

下面的实例继续使用6.2中的生产者-消费者的实例进行扩展

from queue import Queue
from threading import Thread, Event
from time import sleep


class Producer(Thread):
    def __init__(self, sid, queue):
        Thread.__init__(self)
        self.queue = queue
        self.sid = sid

    def run(self):
        self.work()
        self.queue.put((self.sid, 'Producer' + str(self.sid)))

    def work(self):
        sleep(2)
        # print("Producer work" + str(self.sid))


class Consumer(Thread):
    def __init__(self, queue, s_event, r_event):
        Thread.__init__(self)
        self.queue = queue
        self.s_event = s_event
        self.r_event = r_event

    def run(self):
        count = 0
        while True:
            sid, data = self.queue.get()
            if sid == -1:
                self.r_event.set()
                self.s_event.wait()
                break
            if data:
                count += 1
                print("Consumer received " + str(data))
                if count == 3:
                    self.r_event.set()
                    self.s_event.wait()
                    self.s_event.clear()
                    count = 0


class Service(Thread):
    def __init__(self, s_event, r_event):
        Thread.__init__(self)
        self.s_event = s_event
        self.r_event = r_event
        self.setDaemon(True)

    def work(self):
        sleep(2)
        print("Service work")

    def run(self):
        while True:
            self.r_event.wait()
            self.work()
            self.r_event.clear()
            self.s_event.set()


if __name__ == "__main__":
    q = Queue()
    p_threads = [Producer(i, q) for i in range(1, 11)]
    s_event = Event()
    r_event = Event()
    c_thread = Consumer(q, s_event, r_event)
    service_thread = Service(s_event, r_event)
    service_thread.start()
    for t in p_threads:
        t.start()
    c_thread.start()
    for t in p_threads:
        t.join()
    q.put((-1, None))

可以看出,新建了一个Service的服务线程,每当消费者线程执行了三次就会调用服务线程一次,等待服务线程执行完一次之后继续在消费者线程继续执行,当消费者线程结束之后,服务线程也随之结束。

分析这段程序,在消费者线程中处理了三次就会让r_event处于触发状态,此时服务线程一直在死循环并接收到了r_event的状态,之后执行服务线程中的work方法。当服务线程处理结束后,会让s_event处于触发状态,在消费者的线程中接收到此事件将count重新归0开始新的循环。

clear方法主要的作用是让事件传递能够一直发生。setDaemon(True)以为着此线程为守护线程,当依赖的线程结束后,此线程也将结束。

6.4 线程本地数据

在一些场景下,对于所有线程都有一个共同的属性,但是这个属性的值每个进程都不相同,并且无法修改其他进程此属性的值,这种情况下可以使用线程本地数据来解决。

from threading import Thread, local

l = local()
l.x = 1


def f():
    return print(l.x)


f()
t = Thread(target=f)
t.start()

可以看出在主线程中获取线程本地数据并新建属性x值为1,然后在主线程中调用f方法打印其值;接下来新建了一个子线程,调用f方法,但是报错,因为x属性只在主线程中,在子线程是无法进行调用的。

6.5 线程池

与java中的线程池原理类似,在python中也可以通过线程池来维护多个线程,需要使用的模块是标准库中concurrent.futures下的ThreadPoolExecutor。

from concurrent.futures import ThreadPoolExecutor
import time

excutor = ThreadPoolExecutor(3)


def f(a, b):
    time.sleep(5)
    return a ** b


result = excutor.submit(f, 2, 3)
print(result.result())

for x in excutor.map(f, [2, 4, 6], [3, 5, 7]):
    print(x)

for x in excutor.map(f, [2, 4, 6, 8, 10], [3, 5, 7, 9, 11]):
    print(x)

在上面的实例中,对ThreadPoolExecutor实例化时传入需要线程池中线程的个数,通过submit方法传入所调用方法名和参数,返回值执行result可以得出每个线程的结果返回值。通过map方法,可以对多个线程进行调用、赋值,当启动的线程超过3个时,后面的线程处于等待状态,让线程池中的三个线程处理完成后再分配给后面的线程。

6.6 多进程

python的多进程操作可以使用标准库中的multiprocessing,启动一个进程的方法和启动一个线程方法相似,下面主要看进程之间的通信方式。

进程间的通信方式主要有两种方式,一种是通过multiprocessing中的Queue,一种是通过multiprocessing中的Pipe。

首先来看通过Queue的方式。在线程间通信时提到过,当时所用的也是Queue数据接口,只不过是queue标准库中的,其实两者之间差异不大,使用方法也比较类似。

from multiprocessing import Process, Pipe, Queue

q = Queue()
def f(q):
    print('start')
    print(q.get())
    print('end')

if __name__ == "__main__":
    Process(target=f, args=(q,)).start()
    q.put(2)

在main方法中启动一个进程,然后调用f方法,传入的是在主进程中实例化的Queue对象。在f方法中,子进程调用q.get方法等待接收事件信息,此时处于block状态。当在main方法中,主进程调用到了q.put方法给子进程传入事件,此时f方法就可以继续执行了。

Pipe管道方式通信
通过管道的方式通信,可以做到两个进程之间的双向通信。

from multiprocessing import Process, Pipe, Queue

q = Queue()
p1, p2 = Pipe()

def f_pipe(p):
    p.send(p.recv() * 2)


def f_queue(q):
    print('start')
    print(q.get())
    print('end')


if __name__ == "__main__":
    # Process(target=f, args=(q,)).start()
    # q.put(2)
    Process(target=f_pipe, args=(p2,)).start()
    p1.send(55)
    print(p1.recv())

在mian方法中启动了一个新的进程,并将管道的实例作为f_pipe方法的参数传入,之后在主进程中发送参数55传递给了子进程,然后子进程在f_pipe方法内处理完数据之后又将结果返回给了主进程。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,026评论 19 139
  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 173,680评论 25 708
  • @(python)[笔记] 目录 一、什么是进程 1.1 进程的概念 进程的概念起源于操作系统,是操作系统最核心的...
    CaiGuangyin阅读 1,280评论 0 9
  • 三只紫燕绕翠柳, 一辆红车泊路边。 门对玉龙千山雪, 腹藏诗书万卷篇。
    Mr_稻香老农阅读 485评论 4 7
  • 使用realm数据库,进行数据迁移后,模拟器运行没问题,但真机调试却报这个错原因:APP在真机有数据表的缓存解决:...
    熊猫啃竹凳阅读 826评论 3 0