由于正在做声纹识别的项目，中间有一个环节接触到音频合并，在这里记录一下我做音频合并的过程。主要用到FFmpeg。首先说一下，我用的是ubuntu16。

FFmpeg的功能很强大，什么合并视频音频什么的都可以的，只是我下面只会讲音频拼接。

安装FFmpeg

安装过程我是参考[Ubuntu16.04下安装FFmpeg（超简单版）]（https://blog.csdn.net/lwgkzl/article/details/77836207)

这位大神的安装过程是真的真的简单！！！

第一步：添加源

sudo add-apt-repository ppa:djcj/hybrid

第二步：更新源

sudo apt-get update

第三步：下载安装

sudo apt-get install ffmpeg

这样就完成了，真的超级简便~~~

音频拼接

音频拼接的代码我是参考linux下ffmpeg安装实现音频拼接

假如你的音频不是很多，只有几个的话，就可以用下面的代码

ffmpeg -i d1.mp3 -i d2.mp3 -filter_complex '[0:0] [1:0] concat=n=2:v=0:a=1 [a]' -map [a] j5.mp3#合并两个

ffmpeg -i 片头.wav -i 内容.WAV -i 片尾.wav -filter_complex '[0:0] [1:0] [2:0] concat=n=3:v=0:a=1 [a]' -map [a] 合成.wav#合并三个

代码中的-filter前面的都是你要合并的音频，要按照你的音频名字做修改，在complex后面‘[0:0] [1:0] [2:0]' 就是按照你合并音频来更改，其实我也不是很懂这里是什么意思，我的理解就是，3个音频就是这样如果是4个音频就在后面加上[3:0]，而代码中的n=2或者是n=3，就是你要合并的音频个数啦，最后.wav/.mp3就是你要输出的合并后的音频名字啦！！！！
从上面的代码我们可以发现，就算无论你是mp3格式还是wav格式，上面的多个合并公式都是通用的！！！！！

同一目录下音频合并

假设我现在在test_mix这个文件夹中，有9个音频文件要合并。

我的代码如下：

import sys,os
def mix_wav:
      cmd = 'ffmpeg'
      for filename in os.listdir(path) : #os.listdir(path)打印出路径中的所有文件
            cmd = cmd + ' -i ' + filename
      cmd = cmd + " -filter_complex '[0:0] [1:0] [2:0] [3:0] [4:0] [5:0] [6:0] [7:0] [8:0] 
                 concat=n=9:v=0:a=1 [a]' -map [a] /" +'output.wav'
      os.system(cmd)

mix_wav(sys.argv[1])

把以上代码保存为mix.py。登上ubuntu后，选好目录后，输入一下代码

python mix.py test_mix/#更改路径的时候把test_mix/更改为你的路径

假设有两层文件夹

假设我现在把test_mix音频文件分为男和女，如下图

现在我们就要先进入test_mix 再进入到Fe和M中，代码如下

import sys,os

def mix_wav(path):
    for category in  os.listdir(path):
        cmd='ffmpeg'
        file_list=[]
        for filename in os.listdir(path + category):
            cmd = cmd + ' -i ' + path + category+'/'+filename
            file_list.append(filename)
        cmd = cmd + " -filter_complex '[0:0] [1:0] [2:0] [3:0] [4:0] [5:0] [6:0] [7:0] [8:0] concat=n=9:v=0:a=1 [a]' -map [a] /" + 'output.wav'
        os.system(cmd)

mix_wav(sys.argv[1])

假设我合并完成后，我又想把未合并的音频删除掉，代码如下：

import sys,os

def mix_wav(path):
    for category in  os.listdir(path):
        cmd='ffmpeg'
        file_list=[]
        for filename in os.listdir(path + category):
            cmd = cmd + ' -i ' + path + category+'/'+filename
            file_list.append(filename)
        cmd = cmd + " -filter_complex '[0:0] [1:0] [2:0] [3:0] [4:0] [5:0] [6:0] [7:0] [8:0] concat=n=9:v=0:a=1 [a]' -map [a] /" + 'output.wav'
        os.system(cmd)
        for filename2 in file_list:
            dele_file = 'rm ' + path + category+'/'+filename2
            os.system(dele_file)

mix_wav(sys.argv[1])

假设你不知道文件夹里面有多少个音频，可以用下面的代码：

import sys,os

def mix_wav(path):
    for category in  os.listdir(path):
        cmd='ffmpeg'
        file_list=[]
        for filename in os.listdir(path + category):
            cmd = cmd + ' -i ' + path + category+'/'+filename
            file_list.append(filename)
        num=[]        
        for i in range(len(file_list)):
            i=str(i)
            num1 = '[' + str(i) +':0] '
            num.append(num1)
        cmd = cmd +" -filter_complex '"
        for i in range(len(num)):
            cmd =cmd +num[i]
        cmd = cmd + " concat=n="+ str(len(file_list)) +":v=0:a=1 [a]' -map [a] " + path 
                  + category +'/output.wav'
        os.system(cmd)
        for filename2 in file_list:
            dele_file = 'rm ' + path + category+'/'+filename2#删除原文件
            os.system(dele_file)#若不删除把最后一个循环删掉

要注意一点！！合成后的音频是单声道！！！
到这里就差不多啦！！！！有什么问题可以留言私聊都可以哦！！！

FFmpeg合并同一目录下音频