科大訊飛語音識(shí)別和語音播放dome

KitorinZero 發(fā)布于2019-08-15 10:49 / 3550人閱讀

摘要：最后，現(xiàn)在時(shí)間是年月日到目前為止科大訊飛的不支持客戶端和服務(wù)端分開的情況，也就是說，語音合成是在服務(wù)端的話筒的播放，語音識(shí)別需要服務(wù)端的麥克風(fēng)錄音，，對(duì)于沒有任何卵用。

首先登陸科大訊飛開發(fā)者平臺(tái)，注冊(cè)賬號(hào)，（走你->http://www.xfyun.cn/）
可以根據(jù)功能（語音識(shí)別，語音播放等），平臺(tái)（java，window等），來創(chuàng)建屬于自己的應(yīng)用。
應(yīng)用創(chuàng)建成功后對(duì)有一個(gè)對(duì)應(yīng)的appid以及sdk（開發(fā)工具包）;
我們自己開發(fā)的話需要sdk里面的四個(gè)文件

分別是兩個(gè)庫文件：libmsc64(32).so ,msc64(32).dll 
兩個(gè)jar包 ：Msc.jar ,json-jena.jar

jar包正常導(dǎo)入，兩個(gè)文件需要注意，如果是javaSE項(xiàng)目，就直接放到項(xiàng)目的根目錄下，

如果項(xiàng)目是javaweb且在window系統(tǒng)中，將文件放在哪里都可以，但是必須將文件的路徑加入到電腦環(huán)境變量的path路徑里，

如果是項(xiàng)目是javaweb在linux系統(tǒng)中，需要將兩個(gè)庫文件放到lib文件夾下。

最后，現(xiàn)在時(shí)間是2017年7月11日14:39.到目前為止科大訊飛的javaSDK不支持客戶端和服務(wù)端分開的情況，也就是說，語音合成是在服務(wù)端的話筒的播放，語音識(shí)別需要服務(wù)端的麥克風(fēng)錄音，so，javaSDK對(duì)于javaWeb沒有任何卵用。

下面是javaSE版本的dome的介紹：

/**
 * Created by Mshu on 2017/6/27.
 * 語音識(shí)別
 */   
public class Listening {
    private static final String APPID = "你的專屬appid";
    public static void main(String[] args) {
        SpeechUtility.createUtility("appid=" + APPID);
        //1.創(chuàng)建SpeechRecognizer對(duì)象
        SpeechRecognizer mIat= SpeechRecognizer.createRecognizer( );
        //2.設(shè)置聽寫參數(shù)，詳見《MSC Reference Manual》SpeechConstant類
        mIat.setParameter(SpeechConstant.DOMAIN, "iat"); //領(lǐng)域短信和日常用語：iat (默認(rèn))；視頻：video；地圖：poi；音樂：music
        mIat.setParameter(SpeechConstant.LANGUAGE, "zh_cn");//簡(jiǎn)體中文：zh_cn（默認(rèn)）；美式英文：en_us
        mIat.setParameter(SpeechConstant.ACCENT, "mandarin ");//方言普通話：mandarin(默認(rèn));粵 語：cantonese四川話：lmz;河南話：henanese
        mIat.setParameter(SpeechConstant.ASR_AUDIO_PATH, "./tts_test.pcm");                      //識(shí)別完成后在本地保存一個(gè)音頻文件
        mIat.setParameter(SpeechConstant.AUDIO_SOURCE,"1");  //如果不寫默認(rèn)是“1”，“1”是從麥克風(fēng)讀取聲音，“-1”是從.pcm音頻文件讀取聲音
        //3.開始聽寫-
        Recognizer recognizer =new Recognizer();
        mIat.startListening (recognizer);
    }
}

/**
 * Created by Mshu 2017/7/11.
 * 語音識(shí)別回掉
 */
public class Recognizer implements RecognizerListener {
    //開始錄音
    public void onBeginOfSpeech() {
        System.out.println(".。開始錄音。.");
    }
    //音量值0~30
    public void onVolumeChanged(int volume){
            /*System.out.println("當(dāng)前音量"+volume);*/
    }
    //結(jié)束錄音
    public void onEndOfSpeech() {
        System.out.println("錄音結(jié)束");
    }
    //擴(kuò)展用接口
    public void onEvent(int eventType,int arg1,int arg2,String msg) {}
    //聽寫結(jié)果回調(diào)接口(返回Json格式結(jié)果，用戶可參見附錄)；
    //一般情況下會(huì)通過onResults接口多次返回結(jié)果，完整的識(shí)別內(nèi)容是多次結(jié)果的累加；
    //關(guān)于解析Json的代碼可參見MscDemo中JsonParser類；
    //isLast等于true時(shí)會(huì)話結(jié)束。
    public void onResult(RecognizerResult results, boolean isLast){
        System.out.println("Result:"+results.getResultString ());
        //結(jié)果實(shí)例
        //Result:{"sn":1,"ls":false,"bg":0,"ed":0,"ws":[{"bg":0,"cw":[{"sc":0.00,"w":"你好"}]}]}
        //sn:第幾句
        //ls:是否是第一句
        //bg：開始
        //ed:結(jié)束
        //ws:詞語
        //cw:中文分詞
        //w:單詞
        //sc:分?jǐn)?shù)
    }
    //會(huì)話發(fā)生錯(cuò)誤回調(diào)接口
    public void onError(SpeechError error) {
        // error.getPlainDescription(true); //獲取錯(cuò)誤碼描述
        System.out.println(error.getErrorDesc());
    }
    


 * Created by Mshu on 2017/6/27.
 * 語音合成
 */
import com.iflytek.cloud.speech.*;
public class Spesking {
    private static final String APPID = "59522b3c";
    public static void specking() {
    SpeechUtility.createUtility("appid=" + APPID);
//1.創(chuàng)建SpeechSynthesizer對(duì)象
        SpeechSynthesizer mTts= SpeechSynthesizer.createSynthesizer( );
//2.合成參數(shù)設(shè)置，詳見《MSC Reference Manual》SpeechSynthesizer 類
        mTts.setParameter(SpeechConstant.VOICE_NAME, "xiaoyan");    //設(shè)置發(fā)音人
        mTts.setParameter(SpeechConstant.SPEED, "50");              //設(shè)置語速  范圍0~100
        mTts.setParameter(SpeechConstant.VOLUME, "80");             //設(shè)置音量，范圍0~100
//設(shè)置合成音頻保存位置（可自定義保存位置），保存在“./tts_test.pcm”
//如果不需要保存合成音頻，注釋該行代碼
        mTts.setParameter(SpeechConstant.TTS_AUDIO_PATH, "./tts_test.pcm");
//3.開始合成
        Synthesizer synthesizer = new Synthesizer();
        mTts.startSpeaking("語音合成測(cè)試程序", synthesizer);
    }
}
/**
 * Created by Asus on 2017/6/29.
 * 語音合成回掉
 */
public class Synthesizer implements SynthesizerListener {
    //會(huì)話結(jié)束回調(diào)接口，沒有錯(cuò)誤時(shí)，error為null
    public void onCompleted(SpeechError error) {
    }

    @Override
    public void onEvent(int i, int i1, int i2, int i3, Object o, Object o1) {
    }

    //緩沖進(jìn)度回調(diào)
    //percent為緩沖進(jìn)度0~100，beginPos為緩沖音頻在文本中開始位置，endPos表示緩沖音頻在文本中結(jié)束位置，info為附加信息。
    public void onBufferProgress(int percent, int beginPos, int endPos, String info) {
    }

    //開始播放
    public void onSpeakBegin() {
    }

    //暫停播放
    public void onSpeakPaused() {
    }

    //播放進(jìn)度回調(diào)
    //percent為播放進(jìn)度0~100,beginPos為播放音頻在文本中開始位置，endPos表示播放音頻在文本中結(jié)束位置.
    public void onSpeakProgress(int percent, int beginPos, int endPos) {
    }

    //恢復(fù)播放回調(diào)接口
    public void onSpeakResumed() {
    }
}

以上是語音識(shí)別和語音合成兩個(gè)基礎(chǔ)功能，由于篇幅限制，就不寫其他功能了，

其他功能比如無聲合成和音頻流聽寫，其實(shí)就是將文字合成語音文件和讀取語音文件并播放兩個(gè)功能。對(duì)了！

還有上傳詞匯表的功能，上傳用戶詞表可以提高詞表內(nèi)詞匯的識(shí)別率，也可以提高語義的效果，對(duì)付多音字比較奏效，比如 Fa Yan的讀音，對(duì)應(yīng)的漢子有 “發(fā)言” ， “發(fā)炎” ；如果將 ”發(fā)炎“ 的詞匯加入詞匯表，它會(huì)優(yōu)先辨識(shí)為發(fā)炎。

完整功能的dome地址：https://github.com/Mshu95/vioce (別用我的appid)
----在下載的SDK里面也有官方的例子。

GPU云服務(wù)器云服務(wù)器科大訊飛語音識(shí)別科大訊飛語音識(shí)別科大訊飛語音識(shí)別demo 科大訊飛語音 linux

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://systransis.cn/yun/67365.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

KitorinZero

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

美國第三大公共圖書館波士頓公共圖書館遭網(wǎng)絡(luò)攻擊全系統(tǒng)技術(shù)中斷

閱讀 550·2021-08-31 09:45
CloudCone ,大硬盤vps補(bǔ)貨，$20/年，1核/1G/250GB HDD/5TB月流量(理

閱讀 1661·2021-08-11 11:19
在單頁應(yīng)用中，如何優(yōu)雅的上報(bào)前端性能數(shù)據(jù)

閱讀 895·2019-08-30 15:55
重學(xué)前端學(xué)習(xí)筆記（十三）--瀏覽器工作解析（三）

閱讀 833·2019-08-30 10:52
5行js代碼搞定導(dǎo)航吸頂效果

閱讀 2865·2019-08-29 13:11
js驗(yàn)證身份證號(hào)碼記錄

閱讀 2937·2019-08-23 17:08
React.js 常見問題

閱讀 2847·2019-08-23 15:11
JavaScript是如何工作的:Web推送通知的機(jī)制

閱讀 3077·2019-08-23 14:33

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來選購！

科大訊飛語音識(shí)別和語音播放dome

相關(guān)文章

智能語音受熱捧，華為云聯(lián)手科大訊飛惡補(bǔ)短板

**語音識(shí)別框架最新進(jìn)展——深度全序列卷積神經(jīng)網(wǎng)絡(luò)登場(chǎng)**

原 Python用ctypes調(diào)用動(dòng)態(tài)庫的方式使用科大訊飛語音識(shí)別

**微信小程序--------語音識(shí)別（前端自己也能玩）**

在Python中使用科大訊飛Web API進(jìn)行語音合成

發(fā)表評(píng)論

0條評(píng)論

KitorinZero

男|高級(jí)講師

TA的文章

美國第三大公共圖書館波士頓公共圖書館遭網(wǎng)絡(luò)攻擊全系統(tǒng)技術(shù)中斷

CloudCone ,大硬盤vps補(bǔ)貨，$20/年，1核/1G/250GB HDD/5TB月流量(理

在單頁應(yīng)用中，如何優(yōu)雅的上報(bào)前端性能數(shù)據(jù)

重學(xué)前端學(xué)習(xí)筆記（十三）--瀏覽器工作解析（三）

5行js代碼搞定導(dǎo)航吸頂效果

js驗(yàn)證身份證號(hào)碼記錄

React.js 常見問題

JavaScript是如何工作的:Web推送通知的機(jī)制

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來選購！

科大訊飛語音識(shí)別和語音播放dome

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來選購！