import os
def removeBom(file):
'''移除UTF-8文件的BOM字节'''
BOM = b'\xef\xbb\xbf'
existBom = lambda s: True if s == BOM else False
f = open(file, 'rb')
if existBom(f.read(3)):
fbody = f.read()
# f.close()
with open(file, 'wb') as f:
f.write(fbody)
if __name__ == '__main__':
for root, dirs, files in os.walk("D:\\PycharmProjects\\kscnn\\political"):
count = 0
for file in files:
#if file.find(".txt") != -1:
removeBom(os.path.join(root, file))
count += 1
print(count)
批量去除 utf-8的BOM
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 网站项目头部无缘无故出现了空白行,这个是utf8文件编码可能是utf8-bom。如果不是,文件本身编码问题的话!那...
- UTF-8分为两种,一种是不带BOM的,一种是带BOM的。其中第一种不带BOM的是标准形式,第二种带BOM的主要是...
- 今天在CSDN看到一个php输出空白隐形字符65279的问题,在网上找了下,发下这个65279字符是php用来标记...
- 问题描述 对于UTF-8无BOM格式的文件,使用file_get_contents()获取其内容之后,使用json...