先来看下面这段代码的执行:
如图中的代码所示,Python 在多线程环境下 print
的时候,由于输出显示的资源只有一个,当过多个线程想要在同一时间打印输出的时候,有的线程会因为没有抢到输出显示的资源而无法输出。
在实际的执行过程中 "Hello" 的输出次数基本都是正常的 4 次,极少的情况下出现如图中所示的 3 次。而 "the arg is" 的语句输出的次数有很大的概率不是 4 次。因为 i 是线程共享的变量,也就是说只有一个内存空间,而"Hello"字符串每个线程在执行 action 方法时会为它单独开辟一个内存空间。
还有一种情况是 print
的时候存在缓冲,但是,首先在 IDE 环境下默认是没有开启缓冲的,而且在 print
语句后调用 sys.stdout.flush()
,强制立刻刷新缓冲依然没有解决异常。
期间我还以为是因为主线程退出了,导致子线程没执行到 print
程序就结束运行了。但是在 Python 中,当主线程退出之后,即使之线程没有 join
, 子线程仍然会继续执行。如果希望主线程退出后,其子线程也退出而不再执行,则需要设置子线程为后台线程。Python 提供 setDaemon
方法,将子线程与主线程进行绑定,当主线程退出时,子线程的生命也随之结束。
值得注意的是,虽然 print
的次数会有异常(这里的异常是指
输出到控制台异常,实际上 print
语句是执行了的,只不过控制台上没有显示)。但是将 arg
变量写到文件里是正常的,虽然顺序是混乱的。
结论 Python print
不是线程安全的,在并发的情况下不按照正确的方式去写会出现无法预期的异常,正确的写法是在 t.start()
之后加一句 t.join()
来阻塞主线程,直到当前子线程执行完毕,或者加锁处理。
import threading
import time
def action(arg):
time.sleep(1)
sys.stdout.flush()
print 'the arg is:%s\r' %arg
print 'Hello'
for i in xrange(4):
t = threading.Thread(target=action, args=(i,))
t.start()
t.join()
import threading
import time
def action(arg):
lock.acquire()
time.sleep(1)
sys.stdout.flush()
print 'the arg is:%s\r' %arg
print 'Hello'
lock.release()
lock = threading.Lock()
for i in xrange(4):
t = threading.Thread(target=action, args=(i,))
t.start()