写在前面
关于线程的内容我们此前在R语言中给大家介绍过:调用的线程越多就算的越快嘛?。简单来说多线程/并行计算就是让机器同时完成多个”任务”,能减少任务的等待时间与机器资源的闲置,从而大大提升各位的生产效率。
实现方式
多线程在Python中的实现主要通过threading
模块来完成。语法为:
import threading
thread_obj = threading.Tread([group[, target[,name[, args [, kwargs]]]]])
- group: 未来功能的预留参数
- target: 执行的目标任务名
- args: 以元组的方式给任务传参
- kwargs:以字典方式给执行任务传参
- name:线程名,一般不用设置
启动程序,让线程开始工作:
thread_obj.start()
通过实例来感受一下:
1 无参数函数的并行
# 单线程模式
import time
# 定义两个函数
def fir_task():
temp_num = 0
while temp_num < 3:
print("这是任务1的输出")
time.sleep(1)
temp_num += 1
def sec_task():
temp_num = 0
while temp_num < 3:
print("这是任务2的输出")
time.sleep(1)
temp_num += 1
# 定义一个新函数调用这两个函数
def my_print():
fir_task()
sec_task()
my_print()
## 这是任务1的输出
## 这是任务1的输出
## 这是任务1的输出
## 这是任务2的输出
## 这是任务2的输出
## 这是任务2的输出
可以看到上面的代码中,任务1的结果输出之后,任务2才开始执行。此时命令的运行逻辑是串联的,但显然我们的计算机的算力足够让这两个任务同时运行,所以我们需要用调用并行来完成这两个任务:
# 多线程模式
# 导入模块
import threading,time
# 定义两个函数
def fir_task():
temp_num = 0
while temp_num < 3:
print("这是任务1的输出")
time.sleep(1)
temp_num += 1
def sec_task():
temp_num = 0
while temp_num < 3:
print("这是任务2的输出")
time.sleep(1)
temp_num += 1
# 定义一个新函数调用这两个函数
def my_print():
fir_task_thread = threading.Thread(target = fir_task)
sec_task_thread = threading.Thread(target = sec_task)
fir_task_thread.start()
sec_task_thread.start()
my_print()
## 这是任务1的输出
## 这是任务2的输出
可以看出,这时任务1和任务2的结果就是交叉输入啦,也就是两个任务的关系处于并行状态,这对大数据计算时节省计算时间尤为重要。
2 传参函数的并行
我们上面举的例子较为简单,因为定义的函数无需传递参数,当需要传递参数时需要通过args
传递元素或使用kwargs
传递字典。
import threading,time
def fir_task(mytask):
temp_num = 0
while temp_num < 3:
print(mytask)
time.sleep(1)
temp_num += 1
def sec_task(mytask):
temp_num = 0
while temp_num < 3:
print(mytask)
time.sleep(1)
temp_num += 1
# 定义一个新函数调用这两个函数
def my_print():
fir_task_thread = threading.Thread(target = fir_task,args=("自定义任务1",))
sec_task_thread = threading.Thread(target = sec_task,args=("自定义任务2",))
fir_task_thread.start()
sec_task_thread.start()
my_print()
## 自定义任务1
## 自定义任务2
可以看出我们向原函数传递了位置参数
往期回顾