自強課程
課程名稱
【線上實作課程】自然語言處理與文字資料探勘實作(Natural Language Processing and Text Mining)
熱烈招生中
🚩建議【先修】👉➡13W310 自然語言處理與文字資料探勘實作(Natural Language Processing and Text Mining)
🚩建議【進階】👉➡13W322 預訓練大語言模型(Pre-trained Large Language Models)
🚩建議【進階】👉➡13W322 預訓練大語言模型(Pre-trained Large Language Models)
課程代碼:
13W310
上課時間:
113/11/5、11/12,星期二,9:00-16:00,共12小時
上課時數:
12 小時
課程費用:
8000元
(符合超值優惠價格者需送出報名表後,系統發出報名成功回函確認金額。)
超值優惠:
- VIP企業會員價:VIP企業會員可享優惠價格 (按我)
- 會員優惠價: 會員於開課前七天完成報名繳費者可享會員優惠價 7800 元
- 早安鳥方案:會員於開課二週前(含)報名並完成繳費,可享超值優惠價 7300 元
- 會員紅利折抵:本課程歡迎使用紅利折抵,最高可使用 100 點
課程目標:
大數據時代的來臨使得複雜資料建模的工作日形重要,結構性較差的文本數據尤其有許多的實務應用,其分析加值工作涉及資訊擷取、自然語言處理與資料探勘/機器學習等跨學科領域,終極任務是對文件或詞項進行集群、分類與概念提取等工作。
本課程「自然語言處理與文字資料探勘實作」採用Python語言實作文本數據前處理、集群、分類案例,課程內容著重自然語言處理的統計分析基礎,以及資料探勘/機器學習方法的運用,以整合式開發環境Spyder與Jupyter Notebook進行實機操作,幫助學員掌握開放源碼的資料科學語言,有效完成企業文本數據的處理與分析建模工作,提昇個人與企業競爭優勢。
本課程「自然語言處理與文字資料探勘實作」採用Python語言實作文本數據前處理、集群、分類案例,課程內容著重自然語言處理的統計分析基礎,以及資料探勘/機器學習方法的運用,以整合式開發環境Spyder與Jupyter Notebook進行實機操作,幫助學員掌握開放源碼的資料科學語言,有效完成企業文本數據的處理與分析建模工作,提昇個人與企業競爭優勢。
修課條件:
課程大綱:
1.自然語言處理困難點
2.自然語言處理任務層級與類別
3.文本數據準備與文件記號化
4.文本數據的各種表示方式
(1)詞袋模型
(2)分佈式語義與靜態詞嵌入
(3)字詞順序表達
5.文件詞項矩陣與文本數據正規化
6.字詞關聯與文字雲
7.監督式學習之文字資料探勘案例
8.非監督式學習之潛在主題分析案例
2.自然語言處理任務層級與類別
3.文本數據準備與文件記號化
4.文本數據的各種表示方式
(1)詞袋模型
(2)分佈式語義與靜態詞嵌入
(3)字詞順序表達
5.文件詞項矩陣與文本數據正規化
6.字詞關聯與文字雲
7.監督式學習之文字資料探勘案例
8.非監督式學習之潛在主題分析案例
課程師資:
講師:鄒慶士
專長:機率統計學習與人工智慧、大數據與資料科學、進化式多目標最佳化、賽局模型應用、數學規劃應用、等候網路與系統模擬、時間序列分析與控制
現任:國立臺北商業大學資訊與決策科學研究所教授兼校務永續發展中心主任
專長:機率統計學習與人工智慧、大數據與資料科學、進化式多目標最佳化、賽局模型應用、數學規劃應用、等候網路與系統模擬、時間序列分析與控制
現任:國立臺北商業大學資訊與決策科學研究所教授兼校務永續發展中心主任
主辦單位:
財團法人自強工業科學基金會
相關課程:
學員須知:
注意事項