由于正在做声纹识别的项目,中间有一个环节接触到音频合并,在这里记录一下我做音频合并的过程。主要用到FFmpeg。首先说一下,我用的是ubuntu16。
FFmpeg的功能很强大,什么合并视频音频什么的都可以的,只是我下面只会讲音频拼接。
安装FFmpeg
安装过程我是参考[Ubuntu16.04下安装FFmpeg(超简单版)](https://blog.csdn.net/lwgkzl/article/details/77836207)
这位大神的安装过程是真的真的简单!!!
第一步:添加源
sudo add-apt-repository ppa:djcj/hybrid
第二步:更新源
sudo apt-get update
第三步:下载安装
sudo apt-get install ffmpeg
这样就完成了,真的超级简便~~~
音频拼接
音频拼接的代码我是参考linux下ffmpeg安装实现音频拼接
假如你的音频不是很多,只有几个的话,就可以用下面的代码
ffmpeg -i d1.mp3 -i d2.mp3 -filter_complex '[0:0] [1:0] concat=n=2:v=0:a=1 [a]' -map [a] j5.mp3#合并两个
ffmpeg -i 片头.wav -i 内容.WAV -i 片尾.wav -filter_complex '[0:0] [1:0] [2:0] concat=n=3:v=0:a=1 [a]' -map [a] 合成.wav#合并三个
代码中的-filter前面的都是你要合并的音频,要按照你的音频名字做修改,在complex后面‘[0:0] [1:0] [2:0]' 就是按照你合并音频来更改,其实我也不是很懂这里是什么意思,我的理解就是,3个音频 就是这样 如果是4个音频就在后面加上[3:0],而代码中的n=2或者是n=3,就是你要合并的音频个数啦,最后.wav/.mp3就是你要输出的合并后的音频名字啦!!!!
从上面的代码我们可以发现,就算无论你是mp3格式还是wav格式,上面的多个合并公式都是通用的!!!!!
同一目录下音频合并
假设我现在在test_mix这个文件夹中,有9个音频文件要合并。
我的代码如下:
import sys,os
def mix_wav:
cmd = 'ffmpeg'
for filename in os.listdir(path) : #os.listdir(path)打印出路径中的所有文件
cmd = cmd + ' -i ' + filename
cmd = cmd + " -filter_complex '[0:0] [1:0] [2:0] [3:0] [4:0] [5:0] [6:0] [7:0] [8:0]
concat=n=9:v=0:a=1 [a]' -map [a] /" +'output.wav'
os.system(cmd)
mix_wav(sys.argv[1])
把以上代码保存为mix.py。登上ubuntu后,选好目录后,输入一下代码
python mix.py test_mix/#更改路径的时候把test_mix/更改为你的路径
假设有两层文件夹
假设我现在把test_mix音频文件分为男和女,如下图
现在我们就要先进入test_mix 再进入到Fe和M中,代码如下
import sys,os
def mix_wav(path):
for category in os.listdir(path):
cmd='ffmpeg'
file_list=[]
for filename in os.listdir(path + category):
cmd = cmd + ' -i ' + path + category+'/'+filename
file_list.append(filename)
cmd = cmd + " -filter_complex '[0:0] [1:0] [2:0] [3:0] [4:0] [5:0] [6:0] [7:0] [8:0] concat=n=9:v=0:a=1 [a]' -map [a] /" + 'output.wav'
os.system(cmd)
mix_wav(sys.argv[1])
假设我合并完成后,我又想把未合并的音频删除掉,代码如下:
import sys,os
def mix_wav(path):
for category in os.listdir(path):
cmd='ffmpeg'
file_list=[]
for filename in os.listdir(path + category):
cmd = cmd + ' -i ' + path + category+'/'+filename
file_list.append(filename)
cmd = cmd + " -filter_complex '[0:0] [1:0] [2:0] [3:0] [4:0] [5:0] [6:0] [7:0] [8:0] concat=n=9:v=0:a=1 [a]' -map [a] /" + 'output.wav'
os.system(cmd)
for filename2 in file_list:
dele_file = 'rm ' + path + category+'/'+filename2
os.system(dele_file)
mix_wav(sys.argv[1])
假设你不知道文件夹里面有多少个音频,可以用下面的代码:
import sys,os
def mix_wav(path):
for category in os.listdir(path):
cmd='ffmpeg'
file_list=[]
for filename in os.listdir(path + category):
cmd = cmd + ' -i ' + path + category+'/'+filename
file_list.append(filename)
num=[]
for i in range(len(file_list)):
i=str(i)
num1 = '[' + str(i) +':0] '
num.append(num1)
cmd = cmd +" -filter_complex '"
for i in range(len(num)):
cmd =cmd +num[i]
cmd = cmd + " concat=n="+ str(len(file_list)) +":v=0:a=1 [a]' -map [a] " + path
+ category +'/output.wav'
os.system(cmd)
for filename2 in file_list:
dele_file = 'rm ' + path + category+'/'+filename2#删除原文件
os.system(dele_file)#若不删除把最后一个循环删掉
要注意一点!!合成后的音频是单声道!!!
到这里就差不多啦!!!!有什么问题可以留言私聊都可以哦!!!