iOS 关于PCM2AMR的转换记录

项目中遇到一个问题,集成的语音识别模块,由于对采样率有要求,所以识别结束后保存的PCM音频文件是用的16K的采样率,而原先的项目中,包括安卓端的语音播报也都是使用8K的采样率,这样就出现个问题:是把16K的PCM转换成16K的AMR还8K的AMR?

方案一:16K PCM 转换成 16K AMR

由于对音频转换相关方面知识的欠缺,只好上谷歌、百度,也成功的找到一篇关于转换的文章:使用opencore_amr实现WAV 转 AMR (8Khz,16Khz)(更新版)
解决方案也很简单,先将PCM转换成WAV,其实PCM就是缺少信息头的WAV,所以转换WAV就是给PCM添加头信息。
这里有现成解决方案,请参考别人实现的代码,git地址如下:https://github.com/codemonkeybulucck/opencore-amrDemo-iOS

方案二:16K PCM转换成8K PCM,再转换成8K AMR

通过方案一我已经成功转换成16K的AMR,上传TFS服务器上后,发现H5无法正常播报,安卓端还没有转换成功,推荐给安卓方案二,结果他们找到了一个网上的现成解决方案:JSSRC,并且顺利完成把16K PCM转换成了8K AMR,也解决后续H5播放的问题。
通过代码了解到,JSSRC是基于SSRC的C语言版本翻译成JAVA,于是在github上找到了C语言版的源码:https://github.com/ronalde/ssrc-packaging
通过研究JAVA版和C语言版,最终在ssrc.c中新增了一个转换方法:

int tansfer(FILE *fpi,FILE *fpo,int sfrq,int dfrq,int bps, int dbps, int nch,unsigned int length, double att, int dither, int quiet_) {
    int twopass = 0;
    int pdf = 0;
    double noiseamp, peak;
    noiseamp = 0.18;
    
    if (dither < 0 || dither > 4) {
        fprintf(stderr,"unrecognized dither type : %d\n", dither);
        return -1;
    }
    quiet = quiet_;
    
    if (!quiet) printf("Shibatch sampling rate converter version " VERSION "\n\n");
    
    if (bps != 1 && bps != 2 && bps != 3 && bps != 4) {
        fprintf(stderr,"Error: Only 8bit, 16bit and 24bit PCM are supported.\n");
        return -1;
    }
    
    if (dbps == -1) {
        if (bps != 1) {
            dbps = bps;
        } else {
            dbps = 2;
        }
        if (dbps == 4) {
            dbps = 3;
        }
    }
    
    if (dfrq == -1) {
        dfrq = sfrq;
    }
    
    if (dither == -1) {
        if (dbps < bps) {
            if (dbps == 1) {
                dither = 4;
            } else {
                dither = 3;
            }
        } else {
            dither = 1;
        }
    }
    
    if (!quiet) {
        const char *dtype[] = {
            "none","no noise shaping","triangular spectral shape","ATH based noise shaping","ATH based noise shaping(less amplitude)"
        };
        const char *ptype[] = {
            "rectangular","triangular","gaussian"
        };
        printf("frequency : %d -> %d\n",sfrq,dfrq);
        printf("attenuation : %gdB\n",att);
        printf("bits per sample : %d -> %d\n",bps*8,dbps*8);
        printf("nchannels : %d\n",nch);
        printf("length : %d bytes, %g secs\n",length,(double)length/bps/nch/sfrq);
        if (dither == 0) {
            printf("dither type : none\n");
        } else {
            printf("dither type : %s, %s p.d.f, amp = %g\n",dtype[dither],ptype[pdf],noiseamp);
        }
        printf("\n");
    }
    
    if (sfrq < dfrq) {
        peak = upsample(fpi,fpo,nch,bps,dbps,sfrq,dfrq,1,length/bps/nch,twopass,dither);
    }
    else if (sfrq > dfrq) {
        peak = downsample(fpi,fpo,nch,bps,dbps,sfrq,dfrq,1,length/bps/nch,twopass,dither);
    }
    else {
        peak = no_src(fpi,fpo,nch,bps,dbps,1,length/bps/nch,twopass,dither);
    }
    
    if (!quiet) {
        printf("\n");
    }
    
    if (dither != 0) {
        quit_shaper(nch);
    }
    
    if (!twopass && peak > 1) {
        if (!quiet) printf("clipping detected : %gdB\n",20*log10(peak));
    }
    
    return 0;
}

通过下述的使用方式,即可完成16kPCM到8kPCM的转换,至于8kPCM到8kAMR就通过大家常用的opencore-amr库就可以实现了。

char *pcm16k = (char *)[[[NSBundle mainBundle] pathForResource:@"uscvoice16k" ofType:@"pcm"] cStringUsingEncoding:NSUTF8StringEncoding];
    FILE *fpi = fopen(pcm16k, "rb");
    if (fpi == NULL)
    {
        return NO;
    }
    
    NSString *documentDir = NSSearchPathForDirectoriesInDomains(NSDocumentDirectory, NSUserDomainMask, YES).firstObject;
    char *pcm8k = (char *)[[documentDir stringByAppendingPathComponent:@"pcm8k.pcm"] cStringUsingEncoding:NSUTF8StringEncoding];
    // 创建并初始化amr文件
    FILE *fpo = fopen(pcm8k, "wb");
    if (fpo == NULL)
    {
        fclose(fpi);
        return NO;
    }
    
    tansfer(fpi, fpo, 16000, 8000, 2, 2, 1, INT_MAX, 0,0, true);
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,427评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,551评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,747评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,939评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,955评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,737评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,448评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,352评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,834评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,992评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,133评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,815评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,477评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,022评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,147评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,398评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,077评论 2 355