數位語音處理概論
-
課程簡介
- 資源下載
- 第一章 Introduction to Digital Speech Processing
- 第二章 Fundamentals of Speech Recognition
- 第四章 More about Hidden Markov Models
- 第四章 More about Hidden Markov Models
- 第五章 Acoustic Modeling
- 第六章 Language Modeling
- 第七章 Speech Signal and Front-end Processing
- 第八章 Search Algorithms for Speech Recognition
- 第九章 Speech Recognition Updates
- 第九章 Speech Recognition Updates / 第十章 Speech-based Information Retrieval
- 第十章 Speech-based Information Retrieval
- 第十章 Speech-based Information Retrieval/第十一章Spoken Document Understanding and Organization for User-content Interaction
- 第十二章 Computer-Assisted Language Learning (CALL)
- 第十三章 Speaker Variabilities: Adaption and Recognition
- 第十四章 Linguistic Processing and Latent Topic Analysis
- 第十五章 Robustness for Acoustic Environment
- 第十六章 Some Fundamental Principles: EM Algorithm
- 第十七章 Spoken Dialogues
- 第十八章 Conclusion

本月點閱|597 次
授課日期|2016 年 2 月
數位語音處理概論
Introduction to Digital Speech Processing
李琳山
學分數:3學分
開課單位:電機工程學系
本課程共 19 講| 19
20
1
本作品除另有註明外,採創用 CC「姓名標示-非商業性-相同方式分享」3.0 臺灣版授權釋出。
課程概述
- 本課程專為大學部同學所開授。所需要的最主要基礎能力是數學模型(機率、線性代數)及軟體程式,所有難題由數學模型分析,並由程式求解;其中大部份核心觀念均與機器學習(Machine Learning)密切相關。前半學期強調基礎背景知識,後半則著重研究課題,讓修課同學體會由基礎走入研究的歷程。內容深度適合電機系或資工系大三或大四同學選修。評分依據含期中期末考(35%)、程式作業(35%)、期末專題(30%)。
- 在Apple、Google、Microsoft等全球性產業推出行銷全球的主流產品後,語音技術如何將成為人類生活之一關鍵部份已廣為人知。無線網路環境下日新月異並具多元功能的智慧型手機及各種新型的隨身及可穿戴(Wearable)電子設備如眼鏡、手錶(iwatch),加上雲端資訊(Cloud Computing)、巨量數據(Big Data)之實現,智慧汽車、智慧家庭等願景,語音技術未來的發展已是無可限量。在輕薄短小的硬體及豐富的應用環境下,原有的鍵盤、滑鼠等個人電腦上網介面不再方便,語音很顯然成為最方便自然的網路介面之一;而網路上的數位內容多以多媒體形式呈現,它們未必有文字檔案,卻都帶著語音訊息。文字和語音終將成為人類語言資訊的兩種對等形式,今日人類生活中的諸多以文字達成的功能(例如上網輸入文字指令、透過文字搜尋數位內容等)均可能用語音達成。這些都是語音訊號處理技術未來可能的空間。
課程目標
本課程所需要的最主要基礎能力是數學模型(機率、線性代數)及軟體程式,前半強調基礎背景知識,後半則著重研究課題,讓修課同學體會由基礎走入研究的歷程。內容深度適合電機系或資工系大三或大四同學選修。
參考書目
- X. Huang, A. Acero, H. Hon, “Spoken Language Processing”, Prentice Hall, 2001,松瑞
- C. Becchetti, L. Prina Ricotti, “Speech Recognition- Theory and C++ implementation”, Johy Wiley and Sons, 1999, 民全
- L. Rabiner, B.H. Juang, “Fundamentals of Speech Recognition”, Prentice Hall, 1993, 民全
- F. Jelinek, “Statistical Methods for Speech Recognition”, MIT Press, 1999
- D. Jurafsky, J. Martin, “Speech and Language Processing- An Introduction to Natural Language Processing, Speech Recognition, and Computational Linguistics, 2nd edition”, Prentice-Hall, 2009
- G. Tur, R. De Mori, “Spoken Language Understanding- Systems for Extracting Semantic Information from Speech”, John Wiley & Sons, 2011