import os
def removeBom(file):
'''移除UTF-8文件的BOM字节'''
BOM = b'\xef\xbb\xbf'
existBom = lambda s: True if s == BOM else False
f = open(file, 'rb')
if existBom(f.read(3)):
fbody = f.read()
# f.close()
with open(file, 'wb') as f:
f.write(fbody)
if __name__ == '__main__':
for root, dirs, files in os.walk("D:\\PycharmProjects\\kscnn\\political"):
count = 0
for file in files:
#if file.find(".txt") != -1:
removeBom(os.path.join(root, file))
count += 1
print(count)
批量去除 utf-8的BOM
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
推荐阅读更多精彩内容
- 网站项目头部无缘无故出现了空白行,这个是utf8文件编码可能是utf8-bom。如果不是,文件本身编码问题的话!那...
- UTF-8分为两种,一种是不带BOM的,一种是带BOM的。其中第一种不带BOM的是标准形式,第二种带BOM的主要是...
- 今天在CSDN看到一个php输出空白隐形字符65279的问题,在网上找了下,发下这个65279字符是php用来标记...
- 问题描述 对于UTF-8无BOM格式的文件,使用file_get_contents()获取其内容之后,使用json...