在进行机器学习时候,比如图像文件往往是在一个文件夹下的不同类别中,我们需要读取每个类别中的所有文件,不同库中有不同的读取函数,但是为了更加清晰整个过程,这里实现一个基本的文件遍历,也给后面的工作一个提示。
import os
directory = 'D:\\some folders'
#### 找到首目录下的所有子目录
sub_direct = [x[0] for x in os.walk(directory)]
#### 遍历所有的子目录
for sub_folder in sub_direct[1:]:
print(sub_folder)
#### 获得每个子目录下的文件
sub_list = os.listdir(sub_folder)
#### 遍历每个文件
for item in sub_list:
#### 保存文件路径
item_path = sub_folder + '\\' + item
print(item_path)
break