WEBVTT字幕格式转SRT

网络上下载的视频很多配的是WEBVTT格式字幕,需要手工转换成SRT,我写了一段Python程序来自动实现

import os
import sys


def get_file_name(dir, file_extension):
    result_list = []
    for dir_path, _, files in os.walk(dir, False):
        for file_name in files:
            if os.path.splitext(file_name)[1] == file_extension:
                result_list.append(os.path.join(dir_path, file_name))
                print(file_name)
    return result_list


def change_vtt_to_srt(file_name, remove_vttfile):
    str = ''
    with open(file_name, 'r') as input_file:
        f_name_comp = os.path.splitext(file_name)[0]
        with open(f_name_comp + '.srt', 'w') as output_file:
            for line in input_file:
                if line[:6] != 'WEBVTT':
                    # VTT的格式中有的是是00:00:00.000 --> 00:00:00.000
                    if (len(line) == 30) and line[13:16] == '-->':
                        str = line.replace('.', ',')
                    # 有的是00:00.00 --> 00:00.000
                    elif (len(line) == 24) and line[10:13] == '-->':
                        str = '00:' + line[:9] + ' --> 00:' + line[14:]
                        str = str.replace('.', ',')
                    else:  # 不是以上格式的则为字幕内容
                        str = line
                    output_file.write(str)
    if remove_vttfile:
        os.remove(file_name)


if __name__ == '__main__':
    print('本程序可以将WEBVTT格式转换为SRT文件')
    print('======================================================')
    remove = False
    args = sys.argv
    if len(args) < 2:
        print('你需要在命令行中输入要转换的路径或文件名,例如:vvt2srt c:\\vttdir')
    else:
        if os.path.isdir(args[1]):
            file_list = get_file_name(args[1], ".vtt")
            for file in file_list:
                change_vtt_to_srt(file, remove_vttfile=remove)
        elif os.path.isfile(args[1]):
            change_vtt_to_srt(args[1], remove_vttfile=remove)
        else:
            print('输入的参数有错误,不是一个合法的文件夹和文件')
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 1、通过CocoaPods安装项目名称项目信息 AFNetworking网络请求组件 FMDB本地数据库组件 SD...
    阳明AI阅读 16,019评论 3 119
  • 男人想女人 隔座山 翻山越岭很难 愚公移山跑不过时间 女人想男人 隔层布 掀开那层布 ...
    踏浪抓鱼阅读 267评论 0 0
  • 写给宝贝的第四封信 亲爱的宝贝: 不知不觉,你已经半岁了。回想起我们相处的这半年时光,真是短暂。翻看你的照片,从出...
    余美鱼阅读 5,217评论 0 0
  • 直爽是自私者的借口。 我以自己直爽,实事求是,真诚,不说假话,不虚伪,有什么说什么为荣,我认为说假话,恭维别人太虚...
    张志鑫阅读 866评论 2 3
  • 点燃E战队 xiao阿娜 【回顾目标】 1. 今天周一,早上工作会有些忙,先把工作的事处理好 2. 在公司的电...
    xiao阿娜阅读 125评论 0 0