批量去除 utf-8的BOM

import os


def removeBom(file):
    '''移除UTF-8文件的BOM字节'''
    BOM = b'\xef\xbb\xbf'
    existBom = lambda s: True if s == BOM else False

    f = open(file, 'rb')
    if existBom(f.read(3)):
        fbody = f.read()
        # f.close()
        with open(file, 'wb') as f:
            f.write(fbody)


if __name__ == '__main__':
    for root, dirs, files in os.walk("D:\\PycharmProjects\\kscnn\\political"):
        count = 0
        for file in files:
            #if file.find(".txt") != -1:
            removeBom(os.path.join(root, file))
            count += 1
        print(count)

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

ThinkPHP3.2去除因为utf-8-bom编码影响的头部空白行的方法
网站项目头部无缘无故出现了空白行，这个是utf8文件编码可能是utf8-bom。如果不是，文件本身编码问题的话！那...
老牛圣斗士阅读 827评论 0赞 1
python 读取带BOM的utf-8格式文件
UTF-8分为两种，一种是不带BOM的，一种是带BOM的。其中第一种不带BOM的是标准形式，第二种带BOM的主要是...
HELLOTREE1阅读 3,207评论 0赞 0
php中隐形字符65279（utf-8的BOM头）问题
今天在CSDN看到一个php输出空白隐形字符65279的问题，在网上找了下，发下这个65279字符是php用来标记...
Gundy_阅读 949评论 0赞 2
UTF-8 BOM导致json_decode的结果为null
问题描述对于UTF-8无BOM格式的文件，使用file_get_contents()获取其内容之后，使用json...
yeqingwen阅读 364评论 0赞 0
2018―05―18 日精进打卡
姓名：叶彩霞【日精进打卡第038天】2018.05.18 第367期(无锡市) 乐观三组学员【知～学习】 ...
透明的水泡阅读 96评论 0赞 0

赞1赞

赞赏

手机看全文