自強課程
課程名稱
自然語言處理與文字資料探勘實作(Natural Language Processing and Text Mining)
熱烈招生中
📢超級早鳥優惠:➡會員114/5/22(含)前報名:7,800元/人!
課程代碼:
14W320
上課時間:
6/19、6/26,星期四,09:00-16:00,共二週12小時。
上課時數:
12 小時
課程費用:
8500元
(符合超值優惠價格者需送出報名表後,系統發出報名成功回函確認金額。)
超值優惠:
- VIP企業會員價:VIP企業會員可享優惠價格 (按我)
- 會員優惠價: 會員於開課前七天完成報名繳費者可享會員優惠價 8000 元
- 團報價方案:會員2人同行,可享同行價 7800 元(須於課前告知)
- 會員紅利折抵:本課程歡迎使用紅利折抵,最高可使用 100 點
課程目標:
大數據時代的來臨使得複雜資料建模的工作日形重要,結構性較差的文本數據尤其有許多的實務應用,其分析加值工作涉及資訊擷取、自然語言處理與資料探勘/機器學習等跨領域學科,可能的任務包括對文件或詞項進行集群、分類與概念提取等工作。
本課程「自然語言處理與文字資料探勘實作」採用Python語言實作文本數據前處理、集群、分類案例,課程內容著重自然語言處理的統計分析基礎,以及資料探勘/機器學習方法的運用,以整合式開發環境Spyder與Jupyter Notebook進行實機操作,幫助學員掌握開放源碼的資料科學語言,有效完成企業文本數據的處理與分析建模工作,提昇個人與企業競爭優勢。
本課程「自然語言處理與文字資料探勘實作」採用Python語言實作文本數據前處理、集群、分類案例,課程內容著重自然語言處理的統計分析基礎,以及資料探勘/機器學習方法的運用,以整合式開發環境Spyder與Jupyter Notebook進行實機操作,幫助學員掌握開放源碼的資料科學語言,有效完成企業文本數據的處理與分析建模工作,提昇個人與企業競爭優勢。
課程大綱:
1. 自然語言處理困難點
2. 自然語言處理任務層級與類別
3. 文本數據準備與文件記號化
4. 文本數據的各種表示方式
4-1 詞袋模型
4-2 分佈式語義與靜態詞嵌入
4-3 字詞順序表達
5. 文件詞項矩陣與文本數據正規化
6. 字詞關聯與文字雲
7. 監督式學習之文字資料探勘案例
8. 非監督式學習之潛在主題分析案例
2. 自然語言處理任務層級與類別
3. 文本數據準備與文件記號化
4. 文本數據的各種表示方式
4-1 詞袋模型
4-2 分佈式語義與靜態詞嵌入
4-3 字詞順序表達
5. 文件詞項矩陣與文本數據正規化
6. 字詞關聯與文字雲
7. 監督式學習之文字資料探勘案例
8. 非監督式學習之潛在主題分析案例
課程師資:
鄒慶士 教授
專長:機率與統計學習、進化式多目標最佳化、賽局模型應用、系統模擬與強化學習、時間序列分析與控制
現任:國立臺北商業大學資訊與決策科學研究所暨智能控制與決策研究室教授
經歷:
香港科技大學(廣州)工業信息與智能研究所訪問教授(2024.10~2025.01)
國立臺北商業大學校務永續發展中心主任(2023.08~2024.07)暨推廣教育部主任(2024.02~2024.07)
專長:機率與統計學習、進化式多目標最佳化、賽局模型應用、系統模擬與強化學習、時間序列分析與控制
現任:國立臺北商業大學資訊與決策科學研究所暨智能控制與決策研究室教授
經歷:
香港科技大學(廣州)工業信息與智能研究所訪問教授(2024.10~2025.01)
國立臺北商業大學校務永續發展中心主任(2023.08~2024.07)暨推廣教育部主任(2024.02~2024.07)
主辦單位:
財團法人自強工業科學基金會
學員須知:
注意事項