9.4 项目:将带有美国风格日期的文件改名为欧洲风格日期
项目要求:上千个文本文件,文件名包含美国风格的日期( MM-DD-YYYY),需要将它们改名为欧洲风格的日期( DD-MM-YYYY)
#! python3
# change data format from A_style to E_style
import shutil, os, re
dateRegex = re.compile(r"""
((0|1)?\d)- # month
((0|1|2|3)?\d)- # day
((19|20)\d\d) # year
""", re.VERBOSE)
for amerfilename in os.listdir('.'):
euroFilename = dateRegex.sub(r'\3-\1-\5', amerfilename)
if euroFilename == amerfilename:
continue
abswd = os.path.abspath('.')
amerfilename = os.path.join(abswd, amerfilename)
euroFilename = os.path.join(abswd, euroFilename)
print('rename "%s" to "%s"' % (amerfilename, euroFilename))
shutil.move(amerfilename, euroFilename)
思路:
- 上面的解决方案和书中给的有些不同,代码更加精简
- euroFilename = dateRegex.sub(r'\3-\1-\5', amerfilename),亮点就是用“\数字”来进行位置对换;而书中给了大量中间变量,浪费了内存空间(个人意见)
- 这个好好琢磨,还是很有意思的,大家可以交流有无更优解
9.5 项目:将一个文件夹备份到一个 ZIP 文件
项目要求:假定你正在做一个项目,它的文件保存在 C:\AlsPythonBook 文件夹中。你担心工作会丢失, 所以希望为整个文件夹创建一个 ZIP 文件, 作为“快照” 。你希望保存不同的版本, 希望 ZIP 文件的文件名每次创建时都有所变化。
#! python3
# backup a folder to zip
import zipfile, os
def backuptozip(folder):
folder = os.path.abspath(folder)
os.chdir(folder)
number = 1
while True:
zipFilename = os.path.basename(folder) + '_' + str(number) + '.zip'
if not os.path.exists(zipFilename):
break
number += 1
print('Creating %s...' % (zipFilename))
backupZip = zipfile.ZipFile(zipFilename,'w')
for root, dirs, files in os.walk(folder):
print('Adding files in %s...' % root)
backupZip.write(root.replace(folder,'.\\'))
for file in files:
newBase = os.path.basename(folder) + '_'
if file.startswith(newBase) and file.endswith('.zip'):
continue
backupZip.write(os.path.join(root.replace(folder,'.\\'),file))
backupZip.close()
print('to_zip Done!')
backuptozip('old')
思路:
- 此项目书中已经给了详细的解答
- 主要是zipfile和os.walk的掌握
9.8.1 实践项目:选择性拷贝
项目要求:编写一个程序,遍历一个目录树,查找特定扩展名的文件(诸如.pdf 或.jpg),不论这些文件的位置在哪里, 将它们拷贝到一个新的文件夹中。
#! python3
# selective copy
import os, shutil
os.chdir('old')
# to generate a file, and make sure the file has not existed
try:
os.makedirs('copy_to_this_dir')
except FileExistsError:
pass
# walk throgh a dir and find particular file, like '.pdf','.txt', etc.
for root, dirs, files in os.walk('.'):
for file in files:
# what kind of file that you want to copy
if file.endswith('.bak') or file.endswith('.dat'):
# 这一步很重要,是为了排除自己复制成自己(因为os.walk的直线遍历性)
if file not in os.listdir('copy_to_this_dir'):
# copy these files to a new folder
shutil.copy(os.path.join(root,file),'copy_to_this_dir')
思路:
- 当时做这个作业居然几乎每步都写了注释,已经十分详尽
- 主要就是注意FileExistsError和“排除自己复制成自己”这两点
9.8.2 实践项目:删除不需要的文件
项目要求:编写一个程序,遍历一个目录树,查找特别大的文件或文件夹, 比方说, 超过100MB 的文件 (回忆一下,要获得文件的大小,可以使用 os 模块的 os.path.getsize())。将这些文件的绝对路径打印到屏幕上。
#! python3
# list oversized file in particular folder(and delete it)
import os
for root, dirs, files in os.walk('.'):
for file in files:
file_name = os.path.join(root, file)
if os.path.getsize(file_name) > 1024*1024:
print(file_name)
思路:
- 这个项目很简单,就是os.path.getsize的运用
- 1024*1024,这个很小,因为当时我练习时的文件中文件都是几k,按需放大即可
- 这个只是找出,并没有加入删除的代码
9.8.3 实践项目:消除缺失的编号
项目要求:编写一个程序, 在一个文件夹中, 找到所有带指定前缀的文件, 诸如 spam001.txt,spam002.txt 等,并定位缺失的编号(例如存在 spam001.txt 和 spam003.txt,但不存在spam002.txt)。让该程序对所有后面的文件改名,消除缺失的编号。
#! python3
# complete the filename that contain sequence like'spam001','spam003'
import os, re, shutil
os.chdir('spam')
# 找到指定文件夹中所有带指定前缀的文件
o_filenames = [x for x in os.listdir('.') if '.' in x and
x.startswith('abc')]
print(o_filenames)
# 定位缺失的编号
numRegex = re.compile(r'^abc(.*?).txt$')
o_num_list = []
for o_filename in o_filenames:
t_name_re = numRegex.search(o_filename)
o_num_list.append(t_name_re.group(1))
print(o_num_list)
n_num_list = []
for i in range(1,len(o_num_list)+1):
t_i = '%03d' % i
n_num_list.append(t_i)
print(n_num_list)
for i in n_num_list:
if i not in o_num_list:
print("abc%s.txt" % i)
# 对文件改名以消除缺失的编号
for i,v in zip(o_num_list, n_num_list):
shutil.move('abc%s.txt'%i, 'abc%s.txt'%v)
print('Rename project is done!')
思路:
- 当初构思了这道题挺久,然后网上找了答案结果找不到理想的,有个同学的答案不够简洁优美。就自己认真专研了,结果写出来很有成就感
- 找到指定文件夹中所有带指定前缀的文件:用了列表生成器[x for x in os.listdir...]来简化代码
- 定位缺失的编号:用了两个列表来装origin和not-origin的编号;t_i = '%03d' % i 这个能用0来填充成三位数
- 对文件改名以消除缺失的编号:用了zip来并列修改文件名字,也是极大简化了代码
就是因为9.8.3这道题,我才决定发博客和更多人交流。相较于一位网上同学的答案,此代码亮点在’%03d’和zip()函数的使用,还有任务拆分清晰。 做了个把小时的,代码还算满意,激励下自己继续努力。 如有错误,请指出以相互学习,多谢!
环境:python3
想做这个系列文章,就是因为当时看这本书时,想看看网上有没更优美的解决,但是略难找到。所以就把自己的项目练习放在了一个txt文件中,现在把练习代码放到这里,有不足之处希望大家能给出指导意见及相互交流、提升。