java 实现文字转语音 -仅限windows系统

1. 下载资源jacob

将.dll文件添加到jre下的bin文件夹下
64位操作系统选择jacob-1.18-x64.dll文件
32位操作系统选择jacob-1.18-x86.dll
链接:https://pan.baidu.com/s/1bppqj07 密码:hdcv

MSTTSSpeech.java

import com.jacob.activeX.ActiveXComponent;
import com.jacob.com.ComThread;
import com.jacob.com.Dispatch;
import com.jacob.com.Variant;
/**
  * 调用MSTTS将字符串转换成语音信息
  * 调用windows speech API(SAPI)
  * @author suyunlong
  *
  */
public class MSTTSSpeech
{
    private int volume=100;// 声音:1到100
    private int rate=0;// 频率:-10到10
    private int voice=0;// 语音库序号
    private int audio=0;// 输出设备序号
    private ActiveXComponent ax=null;
    private Dispatch spVoice=null;// 声音对象
    private Dispatch spFileStream=null;// 音频文件输出流对象,在读取或保存音频文件时使用
    private Dispatch spAudioFormat=null;// 音频格式对象
    private Dispatch spMMAudioOut=null;// 音频输出对象
    private int formatType=22;// 音频的输出格式,默认为:SAFT22kHz16BitMono
    public MSTTSSpeech() 
    {
        ComThread.InitSTA();
        if(ax==null)
        {
            ax=new ActiveXComponent("Sapi.SpVoice");
            spVoice=ax.getObject();
        }
    }
    /**
     * 改变语音库
     * @param voice 语音库序号
     */
    public void changeVoice(int voice)
    {
        if(this.voice != voice)
        {
            this.voice=voice;
        }
        try
        {
            Dispatch voiceItems=Dispatch.call(spVoice,"GetVoices").toDispatch();
            int count=Integer.valueOf(Dispatch.call(voiceItems,"Count").toString());
            if(count>0)
            {
                Dispatch voiceItem=Dispatch.call(voiceItems,"Item",new Variant(this.voice)).toDispatch();
                Dispatch.put(spVoice,"Voice",voiceItem);
            }
        }
        catch(Exception e)
        {
            System.out.println(e.getMessage());
            e.printStackTrace();
        }
    }
    /**
     * 改变音频输出设备
     * @param audio 音频设备序号
     */
    public void changeAudioOutput(int audio)
    {
        if(this.audio != audio)
        {
            this.audio=audio;
        }
        try
        {
            Dispatch audioOutputs=Dispatch.call(spVoice,"GetAudioOutputs").toDispatch();
            int count=Integer.valueOf(Dispatch.call(audioOutputs,"Count").toString());
            if(count > 0)
            {
                Dispatch audioOutput=Dispatch.call(audioOutputs,"Item",new Variant(this.audio)).toDispatch();
                Dispatch.put(spVoice,"AudioOutput",audioOutput);
            }
        }
        catch(Exception e)
        {
            System.out.println(e.getMessage());
            e.printStackTrace();
        }
    }
    /**
     * 播放语音 
     * @param text 要转换成语音的文本
     */
    public void speak(String text)
    {
        this.speak(text,0);
    }
    /**
     * 停止播放语音
     */
    public void stop()
    {
        // this.speak("", 1);
        Dispatch.call(spVoice,"Pause");
    }
    /**
     * 播放语音
     * @param text 要转换成语音的文本
     * @param type 类型0:播放,1:停止
     */
    private void speak(String text,int type)
    {
        switch(type) 
        {
            case 0:
                try
                {
                    // 调整音量和读的速度
                    Dispatch.put(spVoice,"Volume",new Variant(this.volume));// 设置音量
                    Dispatch.put(spVoice,"Rate",new Variant(this.rate));// 设置速率
                    // 设置音频格式类型
                    if(spAudioFormat==null)
                    {
                        ax=new ActiveXComponent("Sapi.SpAudioFormat");
                        spAudioFormat=ax.getObject();
                        ax=new ActiveXComponent("Sapi.SpMMAudioOut");
                        spMMAudioOut=ax.getObject();
                    }
                    Dispatch.put(spAudioFormat,"Type",new Variant(this.formatType));
                    Dispatch.putRef(spMMAudioOut,"Format",spAudioFormat);
                    Dispatch.put(spVoice,"AllowAudioOutputFormatChangesOnNextSet",new Variant(false));
                    Dispatch.putRef(spVoice,"AudioOutputStream",spMMAudioOut);
                    // 开始朗读
                    Dispatch.call(spVoice,"Speak",new Variant(text));
                }
                catch(Exception e)
                {
                    System.out.println(e.getMessage());
                    e.printStackTrace();
                }
                break;
            case 1:
                try
                {
                    Dispatch.call(spVoice,"Speak",new Variant(text),new Variant(2));
                }
                catch(Exception e)
                {
                    System.out.println(e.getMessage());
                    e.printStackTrace();
                }
                break;
            default:
                break;
        }
    }
    /**
     * 获取系统中所有的语音库名称数组 
     * @return String[]
     */
    public String[] getVoices()
    {
        String[] voices=null;
        try
        {
            Dispatch voiceItems=Dispatch.call(spVoice,"GetVoices").toDispatch();
            int count=Integer.valueOf(Dispatch.call(voiceItems,"Count").toString());
            if(count > 0)
            {
                voices=new String[count];
                for(int i=0;i<count;i++)
                {
                    Dispatch voiceItem=Dispatch.call(voiceItems,"Item",new Variant(i)).toDispatch();
                    String voice=Dispatch.call(voiceItem,"GetDescription").toString();
                    voices[i]=voice;
                }
            }
        }
        catch(Exception e)
        {
            System.out.println(e.getMessage());
            e.printStackTrace();
        }
        return voices;
    }
    /**
     * 获取音频输出设备名称数组
     * @return String[]
     */
    public String[] getAudioOutputs()
    {
        String[] result=null;
        try
        {
            Dispatch audioOutputs=Dispatch.call(spVoice,"GetAudioOutputs").toDispatch();
            int count=Integer.valueOf(Dispatch.call(audioOutputs,"Count").toString());
            if(count > 0)
            {
                result=new String[count];
                for(int i=0;i<count;i++)
                {
                    Dispatch voiceItem=Dispatch.call(audioOutputs,"Item",new Variant(i)).toDispatch();
                    String voice=Dispatch.call(voiceItem,"GetDescription").toString();
                    result[i]=voice;
                }
            }
        }
        catch(Exception e)
        {
            System.out.println(e.getMessage());
            e.printStackTrace();
        }
        return result;
    }
    /**
     * 将文字转换成音频信号,然后输出到.WAV文件
     * @param text 文本字符串
     * @param filePath 输出文件路径
     */
    public void saveToWav(String text,String filePath)
    {
        // 创建输出文件流对象
        ax=new ActiveXComponent("Sapi.SpFileStream");
        spFileStream=ax.getObject();
        // 创建音频流格式对象
        if(spAudioFormat==null)
        {
            ax=new ActiveXComponent("Sapi.SpAudioFormat");
            spAudioFormat=ax.getObject();
        }
        // 设置音频流格式类型
        Dispatch.put(spAudioFormat,"Type",new Variant(this.formatType));
        // 设置文件输出流的格式
        Dispatch.putRef(spFileStream,"Format",spAudioFormat);
        // 调用输出文件流对象的打开方法,创建一个.wav文件
        Dispatch.call(spFileStream,"Open",new Variant(filePath),new Variant(3),new Variant(true));
        // 设置声音对象的音频输出流为输出文件流对象
        Dispatch.putRef(spVoice,"AudioOutputStream",spFileStream);
        // 调整音量和读的速度
        Dispatch.put(spVoice,"Volume",new Variant(this.volume));// 设置音量
        Dispatch.put(spVoice,"Rate",new Variant(this.rate));// 设置速率
        // 开始朗读
        Dispatch.call(spVoice,"Speak",new Variant(text));
        // 关闭输出文件流对象,释放资源
        Dispatch.call(spFileStream,"Close");
        Dispatch.putRef(spVoice,"AudioOutputStream",null);
    }
    /**
     * @return the volume
     */
    public int getVolume()
    {
        return volume;
    }
    /**
     * @param volume
     * the volume to set
     */
    public void setVolume(int volume)
    {
        this.volume = volume;
    }
    /**
     * @return the rate
     */
    public int getRate()
    {
        return rate;
    }
    /**
     * @param rate
     * the rate to set
     */
    public void setRate(int rate)
    {
        this.rate = rate;
    }
    /**
     * @return the voice
     */
    public int getVoice()
    {
        return voice;
    }
    /**
     * @param voice
     * the voice to set
     */
    public void setVoice(int voice)
    {
        this.voice = voice;
    }
    /**
     * @return the audio
     */
    public int getAudio()
    {
        return audio;
    }
    /**
     * @param audio
     * the audio to set
     */
    public void setAudio(int audio)
    {
        this.audio=audio;
    }
    /**
     * @return the ax
     */
    public ActiveXComponent getAx()
    {
        return ax;
    }
    /**
     * @param ax
     * the ax to set
     */
    public void setAx(ActiveXComponent ax)
    {
        this.ax=ax;
    }
    /**
     * @return the formatType
     */
    public int getFormatType()
    {
        return formatType;
    }
    /**
     * 设置音频输出格式类型<br>
     * SAFTDefault = -1<br>
     * SAFTNoAssignedFormat = 0<br>
     * SAFTText = 1<br>
     * SAFTNonStandardFormat = 2<br>
     * SAFTExtendedAudioFormat = 3<br>
     * // Standard PCM wave formats<br>
     * SAFT8kHz8BitMono = 4<br>
     * SAFT8kHz8BitStereo = 5<br>
     * SAFT8kHz16BitMono = 6<br>
     * SAFT8kHz16BitStereo = 7<br>
     * SAFT11kHz8BitMono = 8<br>
     * SAFT11kHz8BitStereo = 9<br>
     * SAFT11kHz16BitMono = 10<br>
     * SAFT11kHz16BitStereo = 11<br>
     * SAFT12kHz8BitMono = 12<br>
     * SAFT12kHz8BitStereo = 13<br>
     * SAFT12kHz16BitMono = 14<br>
     * SAFT12kHz16BitStereo = 15<br>
     * SAFT16kHz8BitMono = 16<br>
     * SAFT16kHz8BitStereo = 17<br>
     * SAFT16kHz16BitMono = 18<br>
     * SAFT16kHz16BitStereo = 19<br>
     * SAFT22kHz8BitMono = 20<br>
     * SAFT22kHz8BitStereo = 21<br>
     * SAFT22kHz16BitMono = 22<br>
     * SAFT22kHz16BitStereo = 23<br>
     * SAFT24kHz8BitMono = 24<br>
     * SAFT24kHz8BitStereo = 25<br>
     * SAFT24kHz16BitMono = 26<br>
     * SAFT24kHz16BitStereo = 27<br>
     * SAFT32kHz8BitMono = 28<br>
     * SAFT32kHz8BitStereo = 29<br>
     * SAFT32kHz16BitMono = 30<br>
     * SAFT32kHz16BitStereo = 31<br>
     * SAFT44kHz8BitMono = 32<br>
     * SAFT44kHz8BitStereo = 33<br>
     * SAFT44kHz16BitMono = 34<br>
     * SAFT44kHz16BitStereo = 35<br>
     * SAFT48kHz8BitMono = 36<br>
     * SAFT48kHz8BitStereo = 37<br>
     * SAFT48kHz16BitMono = 38<br>
     * SAFT48kHz16BitStereo = 39<br>
     * <br>
     * // TrueSpeech format<br>
     * SAFTTrueSpeech_8kHz1BitMono = 40<br>
     * // A-Law formats<br>
     * SAFTCCITT_ALaw_8kHzMono = 41<br>
     * SAFTCCITT_ALaw_8kHzStereo = 42<br>
     * SAFTCCITT_ALaw_11kHzMono = 43<br>
     * SAFTCCITT_ALaw_11kHzStereo = 4<br>
     * SAFTCCITT_ALaw_22kHzMono = 44<br>
     * SAFTCCITT_ALaw_22kHzStereo = 45<br>
     * SAFTCCITT_ALaw_44kHzMono = 46<br>
     * SAFTCCITT_ALaw_44kHzStereo = 47<br>
     * <br>
     * // u-Law formats<br>
     * SAFTCCITT_uLaw_8kHzMono = 48<br>
     * SAFTCCITT_uLaw_8kHzStereo = 49<br>
     * SAFTCCITT_uLaw_11kHzMono = 50<br>
     * SAFTCCITT_uLaw_11kHzStereo = 51<br>
     * SAFTCCITT_uLaw_22kHzMono = 52<br>
     * SAFTCCITT_uLaw_22kHzStereo = 53<br>
     * SAFTCCITT_uLaw_44kHzMono = 54<br>
     * SAFTCCITT_uLaw_44kHzStereo = 55<br>
     * SAFTADPCM_8kHzMono = 56<br>
     * SAFTADPCM_8kHzStereo = 57<br>
     * SAFTADPCM_11kHzMono = 58<br>
     * SAFTADPCM_11kHzStereo = 59<br>
     * SAFTADPCM_22kHzMono = 60<br>
     * SAFTADPCM_22kHzStereo = 61<br>
     * SAFTADPCM_44kHzMono = 62<br>
     * SAFTADPCM_44kHzStereo = 63<br>
     * <br>
     * // GSM 6.10 formats<br>
     * SAFTGSM610_8kHzMono = 64<br>
     * SAFTGSM610_11kHzMono = 65<br>
     * SAFTGSM610_22kHzMono = 66<br>
     * SAFTGSM610_44kHzMono = 67<br>
     * // Other formats<br>
     * SAFTNUM_FORMATS = 68<br>
     * 
     * @param formatType
     *            音频输出格式类型
     */
    public void setFormatType(int formatType)
    {
        this.formatType=formatType;
    }
    public static void main(String[] args)
    {
        MSTTSSpeech speech=new MSTTSSpeech();
        String text="这是我的测试,物理内存至少需要512MB,建议2GB以上,虚拟内存是主机物理内存的两倍,不要设到系统盘,硬盘空闲空间大于4.77GB.";
        speech.setFormatType(6);
        // speech.setRate(-1);
        speech.saveToWav(text,"D:/test.wav");
        //speech.speak(text);
        SoundUtil.wavToPcm("D:/test.wav");
    }
}

SoundUtil.java


import java.io.File;
import java.io.IOException;
import javax.sound.sampled.AudioFileFormat;
import javax.sound.sampled.AudioFormat;
import javax.sound.sampled.AudioInputStream;
import javax.sound.sampled.AudioSystem;
import javax.sound.sampled.UnsupportedAudioFileException;

/**
 * 与声音有关的工具类
 * @author suyunlong
 *
 */
public class SoundUtil
{
    /**
     * 将WAV格式的音频文件转换为PCM格式的文件
     * @param wavFilePath WAV文件路径
     * @throws UnsupportedAudioFileException
     * @throws IOException
     */
    public static void wavToPcm(String wavFilePath)
    {
        try
        {
            File wavFile=new File(wavFilePath);
            AudioInputStream sourceAudioInputStream=AudioSystem.getAudioInputStream(wavFile);
            // 此处的转换必需是16bit的音频文件
            AudioInputStream targetAudioInputStream=AudioSystem.getAudioInputStream(AudioFormat.Encoding.ULAW,
                    sourceAudioInputStream);
            String newFilePath=wavFilePath.substring(0,wavFilePath.lastIndexOf(".")+1)+"pcm";
            AudioSystem.write(targetAudioInputStream,AudioFileFormat.Type.WAVE,new File(newFilePath));
        }
        catch(UnsupportedAudioFileException e)
        {
            System.out.println(e.getMessage());
            e.printStackTrace();
        }
        catch(IOException e)
        {
            System.out.println(e.getMessage());
            e.printStackTrace();
        }
    }
    /**
     * 获取音频文件的编码格式 
     * @param wavFilePath 音频文件格式
     * @return String
     */
    public static String getWavFormat(String wavFilePath)
    {
        File wavFile=new File(wavFilePath);
        AudioInputStream ais;
        String result="";
        try
        {
            ais=AudioSystem.getAudioInputStream(wavFile);
            AudioFormat af=ais.getFormat();
            result=af.toString();
        }
        catch(UnsupportedAudioFileException e)
        {
            System.out.println(e.getMessage());
            e.printStackTrace();
        }
        catch(IOException e)
        {
            System.out.println(e.getMessage());
            e.printStackTrace();
        }
        return result;
    }
    public static void main(String[] args)
    {
        System.out.println(SoundUtil.getWavFormat("D:/test.wav"));
        SoundUtil.wavToPcm("D:/test.wav");
    }
}
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,919评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,567评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,316评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,294评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,318评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,245评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,120评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,964评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,376评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,592评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,764评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,460评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,070评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,697评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,846评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,819评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,665评论 2 354

推荐阅读更多精彩内容

  • Windows 10 企业版 1511版 (64位) Windows 10 Enterprise, Version...
    g0阅读 6,150评论 1 8
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,654评论 18 139
  • 姓名:周君会 学号:17011210526 转载自: http://www.jianshu.com/p/...
    lotus儿阅读 1,937评论 1 9
  • 人这一生就像一场路途遥远的旅行。只身上路,看千山暮雪,渡大海汪洋,最后驻足一处。这一路我们都不会知道下一秒会在哪里...
    船长Captain阅读 203评论 1 2
  • 嘿,这是第19个12月1日!恭喜自己来到这个世界上19周年,经历了好的也经历了不好的,幸运的是,都有所成长!...
    Dada大哒阅读 771评论 0 0