android音视频学习之路任务二

使用AudioRecord录制音频，并转化成Wav格式，再播放

一、了解AudioRecord

AudioRecord是Android系统提供的用于实现录音的功能类。主要功能是让各种Java应用能够管理音频资源，以便他们能够录制声音相关的硬件所手机的声音。

开始录制的时候，AudioRecord需要初始化一个buffer用来缓存新的声音数据。我们可以在AudioRecord的构造方法中去初始化它的大小，此外还需要指定一个最小值minBufferSize，录制的源文件不能小于该单位。

int minBufferSize = AudioRecord.getMinBufferSize(SAMPLE_RATE_INHZ, CHANNEL_CONFIG, AUDIO_FORMAT);

三个参数分别为：音频采样率，音频声道数，音频格式
android设备录音的大致流程如下：
1.构造一个AndroidRecord对象
2.初始化一个相关联的声音buffer，该Buffer大于等于minBufferSize
3.开始录音
4.创建一个数据流，一边从AudioRecord中读取声音数据到初始化的buffer,一边将buffer中数据导入数据流
5.关闭数据流
6.停止录音
需要权限：WRITE_EXTERNAL_STORAGE和RECORD_AUDIO

二、使用AudioRecord

2.1声明AudioRecord对象

定义一些需要的全局变量

AudioRecord audioRecord = null;
boolean isRecording = false;//声明一个状态，记录是否正在录音状态，默认为false

获取buffer的大小并创建AudioRecord：

final  int minBufferSize = AudioRecord.getMinBufferSize(SAMPLE_RATE_INHZ, CHANNEL_CONFIG, AUDIO_FORMAT);
audioRecord = new AudioRecord(MediaRecorder.AudioSource.MIC, SAMPLE_RATE_INHZ,
                CHANNEL_CONFIG, AUDIO_FORMAT, minBufferSize);

2.2创建buffer和目标文件

final byte[] data = new byte[minBufferSize];
final File file = new File(getExternalFilesDir(Environment.DIRECTORY_MUSIC),"test.pcm");

2.3开始录音

audioRecord.startRecording();
isRecording = true;

2.4创建一个数据流，一边从AudioRecord中读取声音数据到初始化的buffer，一边将buffer中数据导入数据流。

        new Thread(new Runnable() {
            @Override
            public void run() {
                FileOutputStream os = null;
                try {
                    os = new FileOutputStream(file);
                } catch (FileNotFoundException e) {
                    e.printStackTrace();
                }
                if (null != os){
                    while (isRecording){
                        int read = audioRecord.read(data,0,minBufferSize);
                        if (AudioRecord.ERROR_INVALID_OPERATION!=read){
                            try {
                                os.write(data);
                            } catch (IOException e) {
                                e.printStackTrace();
                            }
                        }
                    }
                    try {
                        Log.e("run------>","close file output stream !");
                        os.close();
                    } catch (IOException e) {
                        e.printStackTrace();
                    }
                }
            }
        }).start();

2.5录制结束释放资源

        isRecording = false;
        if (null != audioRecord){
            audioRecord.stop();
            audioRecord.release();
            audioRecord = null;
        }

此时录制完成的音频文件为原始音频数据，无法直接播放，于是有了接下来的操作，PCM转Wav格式。文件所在：/storage/emulated/0/Android/data/com.liu.autiorecord/files/Music/test.wav测试的时候可以看看该文件是否生成。

三、PCM转WAV

3.1转化之前，我们需要简单了解下PCM和Wav的区别

1.PCM（Pulse Code Modulation—-脉码调制录音)。所谓PCM录音就是将声音等模拟信号变成符号化的脉冲列，再予以记录。PCM信号是由[1]、[0]等符号构成的数字信号，而未经过任何编码和压缩处理。与模拟信号比，它不易受传送系统的杂波及失真的影响。动态范围宽，可得到音质相当好的影响效果。也就是说，PCM就是没有压缩的编码方式，PCM文件就是采用PCM这种没有压缩的编码方式编码的音频数据文件。
2.WAV是由微软开发的一种音频格式。WAV符合 PIFF Resource Interchange File Format规范。所有的WAV都有一个文件头，这个文件头音频流的编码参数。WAV对音频流的编码没有硬性规定，除了PCM之外，还有几乎所有支持ACM规范的编码都可以为WAV的音频流进行编码。WAV也可以使用多种音频编码来压缩其音频流，不过我们常见的都是音频流被PCM编码处理的WAV，但这不表示WAV只能使用PCM编码，MP3编码同样也可以运用在WAV中，和AVI一样，只要安装好了相应的Decode，就可以欣赏这些WAV了。
3.在Windows平台下，基于PCM编码的WAV是被支持得最好的音频格式，所有音频软件都能完美支持，由于本身可以达到较高的音质的要求，因此，WAV也是音乐编辑创作的首选格式，适合保存音乐素材。因此，基于PCM编码的WAV被作为了一种中介的格式，常常使用在其他编码的相互转换之中，例如MP3转换成WMA。

如上引用的描述，也就是说我们对音频进行编辑操作，其实就是音频解码后的PCM音频采样数据进行操作，因为PCM记录的就是采样后的音频信息，而我们常说的WAV文件是在PCM数据的基础上添加一组头信息，用于描述这个WAV文件的采样率，声道数，采样位数，音频数据大小等信息，这样这个WAV就可以被音频播放器正确读取并播放，而单纯的PCM文件因为只有编码的音频数据，没有其他描述信息，所以无法被音频播放器识别播放。

3.2WAV文件头信息

Wav文件头是由大小44个字节的数据组成：

1.4字节数据，内容为“RIFF”，表示资源交换文件标识
2.4字节数据，内容为一个整数，表示从下个地址开始到文件尾的总字节数
3.4字节数据，内容为“WAVE”，表示WAV文件标识
4.4字节数据，内容为“fmt ”，表示波形格式标识（fmt ），最后一位空格。
5.4字节数据，内容为一个整数，表示PCMWAVEFORMAT的长度
6.2字节数据，内容为一个短整数，表示格式种类（值为1时，表示数据为线性PCM编码）
7.2字节数据，内容为一个短整数，表示通道数，单声道为1，双声道为2
8.4字节数据，内容为一个整数，表示采样率，比如44100
9.4字节数据，内容为一个整数，表示波形数据传输速率（每秒平均字节数），大小为采样率 * 通道数 * 采样位数
10.2字节数据，内容为一个短整数，表示DATA数据块长度，大小为通道数 * 采样位数
11.2字节数据，内容为一个短整数，表示采样位数，即PCM位宽，通常为8位或16位
12.4字节数据，内容为“data”，表示数据标记符
13.4字节数据，内容为一个整数，表示接下来声音数据的总大小

由以上信息可知，对于一个PCM文件来说，只要知道它的大小，采样率，声道数，采样位数，就可以通过添加一个WAV文件头得到一个WAV文件了。

3.3声道数和采样位数下的PCM编码

声道通常可以分为单声道和双声道，双声道又分为左声道和右声道。

采样位数表示一个采样数据用多少位来表示，通常为8位和16位，对于8位表示一个字节来表示一个采样数据，16位表示用两个字节表示一个采样数据，两个字节为低位字节和高位字节，通常低位字节在前，高位字节在后。

因此结合声道和采样字节数（采样位数），可以组成下图的PCM数据格式：

image.png

可以看到8位单声道的PCM数据，只需要一个字节就能表示一个采样数据，而16位双声道（立体声）的PCM数据，需要4个字节来表示一个采样数据。那么计算一个PCM大小的方法就很简单了。

对于8位单声道，采样率为8000，1分钟的PCM音频来说，大小是

//采样率 * 通道数 * 采样位数/8 * 秒数
8000 * 1 * 8/8 * 60 = 480000，大约480k

对于16位双声道，采样率为44100，1分钟的PCM音频来说，大小是

//采样率 * 通道数 * 采样位数/8 * 秒数
44100 * 2 * 16/8 * 60 = 10584000，大约10M

而WAV文件的大小就是比PCM多出44个字节数。
在 PcmToWavUtil.java 代码中体现：

long longSampleRate = mSampleRate;
int channels = mChannel == AudioFormat.CHANNEL_IN_MONO ? 1 : 2;
long byteRate = 16 * mSampleRate * channels / 8;

转换过程

byte[] data = new byte[mBufferSize];
        try {
            FileInputStream in = new FileInputStream(inFilename);
            FileOutputStream out = new FileOutputStream(outFilename);
            //PCM文件大小
           long totalAudioLen = in.getChannel().size();
            //总大小，由于不包括RIFF和WAV，所以是44 - 8 = 36，在加上PCM文件大小
           long totalDataLen = totalAudioLen + 36;
            //调用方法添加文件头信息
            writeWaveFileHeader(out, totalAudioLen, totalDataLen,
                    longSampleRate, channels, byteRate);
            while (in.read(data) != -1) {
                out.write(data);
            }
            //关闭输入输出流
            in.close();
            out.close();
        } catch (IOException e) {
            e.printStackTrace();
        }

3.4添加文件头信息

 private void writeWaveFileHeader(FileOutputStream out, long totalAudioLen,
                                     long totalDataLen, long longSampleRate, int channels, long byteRate)
            throws IOException {
        byte[] header = new byte[44];
        // RIFF/WAVE header
        header[0] = 'R';
        header[1] = 'I';
        header[2] = 'F';
        header[3] = 'F';
        header[4] = (byte) (totalDataLen & 0xff);
        header[5] = (byte) ((totalDataLen >> 8) & 0xff);
        header[6] = (byte) ((totalDataLen >> 16) & 0xff);
        header[7] = (byte) ((totalDataLen >> 24) & 0xff);
        //WAVE
        header[8] = 'W';
        header[9] = 'A';
        header[10] = 'V';
        header[11] = 'E';
        // 'fmt ' chunk
        header[12] = 'f';
        header[13] = 'm';
        header[15] = ' ';
        // 4 bytes: size of 'fmt ' chunk
        header[16] = 16;
        header[17] = 0;
        header[18] = 0;
        header[19] = 0;
        // format = 1
        header[20] = 1;
        header[21] = 0;
        header[22] = (byte) channels;
        header[23] = 0;
        header[24] = (byte) (longSampleRate & 0xff);
        header[25] = (byte) ((longSampleRate >> 8) & 0xff);
        header[26] = (byte) ((longSampleRate >> 16) & 0xff);
        header[27] = (byte) ((longSampleRate >> 24) & 0xff);
        header[28] = (byte) (byteRate & 0xff);
        header[29] = (byte) ((byteRate >> 8) & 0xff);
        header[30] = (byte) ((byteRate >> 16) & 0xff);
        header[31] = (byte) ((byteRate >> 24) & 0xff);
        // block align
        header[32] = (byte) (2 * 16 / 8);
        header[33] = 0;
        // bits per sample
        header[34] = 16;
        header[35] = 0;
        //data
        header[36] = 'd';
        header[37] = 'a';
        header[38] = 't';
        header[39] = 'a';
        header[40] = (byte) (totalAudioLen & 0xff);
        header[41] = (byte) ((totalAudioLen >> 8) & 0xff);
        header[42] = (byte) ((totalAudioLen >> 16) & 0xff);
        header[43] = (byte) ((totalAudioLen >> 24) & 0xff);
        out.write(header, 0, 44);
    }

使用 PcmToWavUtil.java

PcmToWavUtil pcmToWavUtil = new PcmToWavUtil(SAMPLE_RATE_INHZ, CHANNEL_CONFIG, AUDIO_FORMAT);
                File pcmFile = new File(getExternalFilesDir(Environment.DIRECTORY_MUSIC), "test.pcm");
                File wavFile = new File(getExternalFilesDir(Environment.DIRECTORY_MUSIC), "test.wav");
                if (!wavFile.mkdirs()) {
                    Log.e("--------", "wavFile Directory not created");
                }
                if (wavFile.exists()) {
                    wavFile.delete();
                }
                pcmToWavUtil.pcmToWav(pcmFile.getAbsolutePath(), wavFile.getAbsolutePath());

四.使用AudioTrack播放录音

@RequiresApi(api = Build.VERSION_CODES.LOLLIPOP)
private void play(){
        /*
         * SAMPLE_RATE_INHZ 对应pcm音频的采样率
         * channelConfig 对应pcm音频的声道
         * AUDIO_FORMAT 对应pcm音频的格式
         * */
        int channelConfig = AudioFormat.CHANNEL_OUT_MONO;
        final int minBufferSize = AudioTrack.getMinBufferSize(SAMPLE_RATE_INHZ, channelConfig, AUDIO_FORMAT);
        audioTrack = new AudioTrack(
                new AudioAttributes.Builder()
                        .setUsage(AudioAttributes.USAGE_MEDIA)
                        .setContentType(AudioAttributes.CONTENT_TYPE_MUSIC)
                        .build(),
                new AudioFormat.Builder().setSampleRate(SAMPLE_RATE_INHZ)
                        .setEncoding(AUDIO_FORMAT)
                        .setChannelMask(channelConfig)
                        .build(),
                minBufferSize,
                AudioTrack.MODE_STREAM,
                AudioManager.AUDIO_SESSION_ID_GENERATE);
        audioTrack.play();
        isPlaying = true;

        File file = new File(getExternalFilesDir(Environment.DIRECTORY_MUSIC), "test.pcm");
        try {
            fileInputStream = new FileInputStream(file);
            new Thread(new Runnable() {
                @Override
                public void run() {
                    try {
                        byte[] tempBuffer = new byte[minBufferSize];
                        while (fileInputStream.available() > 0) {
                            int readCount = fileInputStream.read(tempBuffer);
                            if (readCount == AudioTrack.ERROR_INVALID_OPERATION ||
                                    readCount == AudioTrack.ERROR_BAD_VALUE) {
                                continue;
                            }
                            if (readCount != 0 && readCount != -1) {
                                audioTrack.write(tempBuffer, 0, readCount);
                            }
                        }
                    } catch (IOException e) {
                        e.printStackTrace();
                    }
                }
            }).start();

        } catch (IOException e) {
            e.printStackTrace();
        }
    }

代码是写出来了，自己不太懂的地方还有很多。还需要做一些功夫
demo

文章来源
部分：https://www.cnblogs.com/renhui/p/7457321.html
部分：https://blog.csdn.net/hesong1120/article/details/79043482