多线程编程知识点记录:
1、单线程函数如何转换为多线程
1)线程函数调用
import threading
import time
from threading import current_thread
def myThread(arg1, arg2):
print(current_thread().getName(),'start')
print('%s %s'%(arg1, arg2))
time.sleep(1)
print(current_thread().getName(),'stop')
for i in range(1,6,1):
# t1 = myThread(i, i+1)
t1 = threading.Thread(target=myThread,args=(i, i+1))#多线程分配
t1.start()
print(current_thread().getName(),'end')
2)线程类调用
import threading
from threading import current_thread
class Mythread(threading.Thread):
def run(self):
print(current_thread().getName(),'start')
print('run')
print(current_thread().getName(),'stop')
for i in range(1,6,1):
t1 = Mythread()
t1.start()
t1.join()
print(current_thread().getName(),'end')
问题解答1:老师,我想不明白你重写这个run方法之后为什么这个线程还能够执行,之前是start函数调用原来这个run方法,你现在将它重写啦,重写不是覆盖前面父类的方法吗,您重写的run方法只是打印而已,怎么会执行呢?
答:Thread是threading模块的一个用于创建线程的类,创建线程有两个方法,一个是通过继承Thread类,重写run方法;我在视频中演示的Mythread类就是这种方法了,要注意覆盖的是父类继承过来的run方法,start还是继承过来不变的。这里要注意的是start()和run() 是Thread的两种不同方法,官方定义在这里:https://docs.python.org/3.7/library/threading.html那么把他们的解释翻译成中文就是 start() 开始线程工作,把run()方法放到一个另外的单独的线程里执行 ;run() 线程工作方法,在“当成”线程执行函数里面的代码。所以他们的作用一个是开启新线程,一个是按照线程的方式执行程序。我们可以写个小程序来验证一下:
import threading
from threading import current_thread
class Mythread(threading.Thread):
def run(self):
print(current_thread().getName())
t1 = Mythread()
t1.run()
t1.start()
这段程序的执行结果是:
MainThread
Thread-1
也就是说单独运行run()方法,会把主进程当做一个线程来看,执行的代码空间在MainThread主线程中,执行了start()方法,python会新创建一个线程,叫Thread-1,然后再去调用run()来运行,这就是他们两个的区别了。
问题解答2:多线程不能无限多吧,应该是看计算机的硬件性能。那么如何确定可以使用的最多线程?
答:最多线程由两方面决定:内存容量和软件限制。虽然线程是轻量级进程,但是创建线程也是要消耗内存的,初始状态下消耗大小就是内存栈了,每创建一个线程为其分配一个线程栈,还有一种限制是系统的配置参数限制,比如在linux上 每进程默认创建线程是1024个,在local_lim.h中定义,可以使用ulimt -a查看线程栈大小。
2、生产者和消费者程序事例
from threading import Thread,current_thread
import time
import random
from queue import Queue
queue = Queue(5)
class ProducerThread(Thread):
def run(self):
name = current_thread().getName()
nums = range(100)
global queue
while True:
num = random.choice(nums)
queue.put(num)
print('生产者 %s 生产了数据 %s' %(name, num))
t = random.randint(1,3)
time.sleep(t)
print('生产者 %s 睡眠了 %s 秒' %(name, t))
class ConsumerTheard(Thread):
def run(self):
name = current_thread().getName()
global queue
while True:
num = queue.get()
queue.task_done()
print('消费者 %s 消耗了数据 %s' %(name, num))
t = random.randint(1,5)
time.sleep(t)
print('消费者 %s 睡眠了 %s 秒' % (name, t))
p1 = ProducerThread(name = 'p1')
p1.start()
p2 = ProducerThread(name = 'p2')
p2.start()
p3 = ProducerThread(name = 'p3')
p3.start()
c1 = ConsumerTheard(name = 'c1')
c1.start()
c2 = ConsumerTheard(name = 'c2')
c2.start()
问题解答:消费者的task_done()还是不清楚用来干什么?
答:task_done()是配合join()使用的,join() 会让队列一直处于阻塞状态,直到queue里面所有的message都被get()取出来调用了task_done()才能返回,不用这个函数会让join()出现无限挂起的问题,不符合我们写程序的预期。它和join()一起使用来判断队列里是否还有message需要处理的一种机制,如果看它的代码实现,会发现它通过信号与join()进行配合的。
或许在初学阶段,大家更容易理解这种用法
while not workQueue.empty():
pass
就是一直循环,直到队列为空。
两种机制都可以判断为队列是否为空,看你需要那种方法和想要在哪种场景下使用。