Python 多线程输出的问题

先来看下面这段代码的执行：

image.png

如图中的代码所示，Python 在多线程环境下 print 的时候，由于输出显示的资源只有一个，当过多个线程想要在同一时间打印输出的时候，有的线程会因为没有抢到输出显示的资源而无法输出。

在实际的执行过程中 "Hello" 的输出次数基本都是正常的 4 次，极少的情况下出现如图中所示的 3 次。而 "the arg is" 的语句输出的次数有很大的概率不是 4 次。因为 i 是线程共享的变量，也就是说只有一个内存空间，而"Hello"字符串每个线程在执行 action 方法时会为它单独开辟一个内存空间。

还有一种情况是 print 的时候存在缓冲，但是，首先在 IDE 环境下默认是没有开启缓冲的，而且在 print 语句后调用 sys.stdout.flush()，强制立刻刷新缓冲依然没有解决异常。

期间我还以为是因为主线程退出了，导致子线程没执行到 print 程序就结束运行了。但是在 Python 中，当主线程退出之后，即使之线程没有 join, 子线程仍然会继续执行。如果希望主线程退出后，其子线程也退出而不再执行，则需要设置子线程为后台线程。Python 提供 setDaemon 方法，将子线程与主线程进行绑定，当主线程退出时，子线程的生命也随之结束。

值得注意的是，虽然 print 的次数会有异常（这里的异常是指
输出到控制台异常，实际上 print 语句是执行了的，只不过控制台上没有显示）。但是将 arg 变量写到文件里是正常的，虽然顺序是混乱的。

结论 Python print 不是线程安全的，在并发的情况下不按照正确的方式去写会出现无法预期的异常，正确的写法是在 t.start() 之后加一句 t.join() 来阻塞主线程，直到当前子线程执行完毕，或者加锁处理。

import threading
import time

def action(arg):
    time.sleep(1)
    sys.stdout.flush()
    print 'the arg is:%s\r' %arg
    print 'Hello'

for i in xrange(4):
    t = threading.Thread(target=action, args=(i,))
    t.start()
    t.join()

import threading
import time

def action(arg):
    lock.acquire()
    time.sleep(1)
    sys.stdout.flush()
    print 'the arg is:%s\r' %arg
    print 'Hello'
    lock.release()

lock = threading.Lock()

for i in xrange(4):
    t = threading.Thread(target=action, args=(i,))
    t.start()

Python 多线程输出的问题

推荐阅读更多精彩内容