語音識別技術(shù)如何入門?
作為硬件工程師,有做過智能語音音箱方面的相關(guān)經(jīng)歷和語音識別的硬件測試,下面我來分析一下。
語音識別技術(shù)的實(shí)現(xiàn),主要三部分:
1. 硬件部分硬件的實(shí)現(xiàn)主要是是語音信號處理,語音從MIC進(jìn)入,轉(zhuǎn)變成電信號通過專門的AD芯片采樣給CPU處理。語音采集的質(zhì)量由外界的影響因素比較多,包括MIC的密封性,通音孔的結(jié)構(gòu)設(shè)計(jì),PCB元器件的布局,和信號線的布線等。語音的前端采集對于后端的識別至關(guān)重要。所以語音識別的硬件部分,是要下功夫?qū)W習(xí)的。現(xiàn)在提供語音識別服務(wù)的公司也比較多,有科大訊飛,思必馳,百度,XMOS,啟英泰倫等,他們一般會提供硬件開發(fā)的demo板。
2. 軟件部分軟件部分主要包括外設(shè)的驅(qū)動(dòng),包括各個(gè)接口的驅(qū)動(dòng),調(diào)試AD芯片的驅(qū)動(dòng),語音采集后的場景匹配,孤立詞識別,關(guān)鍵詞識別和連續(xù)語音識別,還有詞語的匹配。后面還要和云端對接,使識別的內(nèi)容對接網(wǎng)絡(luò),交換數(shù)據(jù)。供應(yīng)商會有SDK開發(fā)包,一般基于安卓的,驅(qū)動(dòng)也有C語言的。
3. 云端部分云端主要包括語音識別后的的內(nèi)容對接,包括天氣,新聞,音樂,購物,和各種有聲讀物等。百度云,騰訊云,還有其他內(nèi)容供應(yīng)商會提供這些接口的對接。
總結(jié)
語音識別技術(shù)涉及面還是比較廣的,硬件,軟件,云端都涉及到了,所以入門的話,需要先選定方向。硬件方向可以是硬件設(shè)計(jì)相關(guān),包括語音識別相關(guān)的硬件設(shè)計(jì)和測試,從基礎(chǔ)的硬件設(shè)計(jì)開始學(xué)習(xí),可以關(guān)注我頭條號學(xué)習(xí)更多硬件知識。軟件方向可以從安卓開發(fā),單片機(jī)開發(fā),系統(tǒng)開發(fā),驅(qū)動(dòng)開發(fā)等開始,C語言,java,python等都是基礎(chǔ)。云端包括大數(shù)據(jù),算法的實(shí)現(xiàn),服務(wù)器存儲,網(wǎng)頁開發(fā)等,編程語言也是需要熟練掌握。