自強課程
課程名稱
數位語音訊號處理III-語音活動偵測、關鍵字辨認、語者辨認
如期開班
課程代碼:
10A059
上課時間:
2021/10/27(三),9:00~16:00,共6小時
上課時數:
6 小時
上課地點:
課程費用:
5000元
(符合超值優惠價格者需送出報名表後,系統發出報名成功回函確認金額。)
超值優惠:
- VIP企業會員價:VIP企業會員可享優惠價格 (按我)
- 會員優惠價: 會員於開課前七天完成報名繳費者可享會員優惠價 4800 元
- 會員紅利折抵:本課程歡迎使用紅利折抵,最高可使用 200 點
課程目標:
語音活動偵測是雜訊壓抑的關鍵因素,在低雜訊比或環境雜訊是人聲時,如果僅依靠聲音特徵去判斷是否為語音,其準確性會大幅下降,可利用嘴唇的影像特徵來幫助判斷是否為語音,並有期望的成效。但臉部特徵的演算法是加密過的並且為了達到高準確性而有諸多的限制,因此必須去重新實現或找到替代的演算法,以達到高強度且方便於延伸應用的目標。
課程大綱:
一、語音活動偵測(Voice Activation Detection)
1.1簡介(Introduction)
1.2參數求取與噪音抑制(Feature Extraction and Noise Suppression)
1.3分類與偵測(Classification and Decision Smoothing)
二、關鍵字辨認(Keyword Spotting)
2.1簡介(Introduction)
2.2隱藏式馬可夫模型(Hidden Markov Model-based Approach)
2.3深度類神經網路(Deep Neural Network-based Approach)
2.4Google關鍵字辨認系統(Google’s CNN-based Approach)
2.5基於深度學習之關鍵字辨認(Survey of Deep Learning-based Approach)
三、語者辨認(Speaker Recognition)
3.1簡介(Introduction)
3.2統計法(Statistic Model-based Approach)
3.3子空間法(Subspace-based Approach)
3.4類神經網路與端對端語者辨認(Neural Network/End-to-End Speaker Recognition)
1.1簡介(Introduction)
1.2參數求取與噪音抑制(Feature Extraction and Noise Suppression)
1.3分類與偵測(Classification and Decision Smoothing)
二、關鍵字辨認(Keyword Spotting)
2.1簡介(Introduction)
2.2隱藏式馬可夫模型(Hidden Markov Model-based Approach)
2.3深度類神經網路(Deep Neural Network-based Approach)
2.4Google關鍵字辨認系統(Google’s CNN-based Approach)
2.5基於深度學習之關鍵字辨認(Survey of Deep Learning-based Approach)
三、語者辨認(Speaker Recognition)
3.1簡介(Introduction)
3.2統計法(Statistic Model-based Approach)
3.3子空間法(Subspace-based Approach)
3.4類神經網路與端對端語者辨認(Neural Network/End-to-End Speaker Recognition)
課程師資:
學 歷: 國立交通大學電信博士
專 長: 數位訊號處理、語音訊號處理(語音、語者與語言辨認、語音合
成)、無線聲學通訊系統
經 歷: 交通大學電信所博士後研究、 飛利浦資深研發工程師、工研院
資通所技術顧問、經研院顧問
專 長: 數位訊號處理、語音訊號處理(語音、語者與語言辨認、語音合
成)、無線聲學通訊系統
經 歷: 交通大學電信所博士後研究、 飛利浦資深研發工程師、工研院
資通所技術顧問、經研院顧問
學員須知:
注意事項