自強課程

課程名稱
【竹科管理局補助課程(申請中)】Python強化學習及通用人工智慧( Python Hands-On on Reinforcement Learning towards Artificial General Intelligence)
熱烈招生中
<<實作課程、名額有限>>
📢會員於7/15前報名:
🥇園區內:3000元
🥈園區外:4000元
※任職於 【科學園區廠商】 優先錄取!
※早鳥優惠價統一於確定開課後修改金額!
📢會員於7/15前報名:
🥇園區內:3000元
🥈園區外:4000元
※任職於 【科學園區廠商】 優先錄取!
※早鳥優惠價統一於確定開課後修改金額!
💥上課出席率需達75%哦❗💥
課程代碼:
14W322
上課時間:
8/7、8/14,星期四,09:00-16:00,共二週12小時。
上課時數:
12 小時
課程費用:
(以下費用已由竹科管理局補助80%)
4000元
(科學園區廠商優惠價格需送出報名表後,系統發出報名成功回函確認金額。)
超值優惠:
課程目標:
學習強化學習各種解題方法的理論與應用實務,並能運用TensorFlow、PyTorch、Keras、OpenAI等Python套件與函式庫,讓學員短時間內掌握強化學習的重要知識。
課程特色:
強化學習(Reinforcement Learning, RL)處理的問題涉及動態環境下的一系列相依決策,而非彼此獨立或一次性的決策制定。其目標在於尋找長期或跨期規劃下的最佳(optimal long-term planning)控制與決策,作業研究 (Operations Research, OR)中的確定性模型與隨機模型均與此類問題相關,動態規劃(dynamic programming)、馬可夫鏈(Markov chains)、馬可夫決策過程(Markov Decision Processes, MDP)、蒙地卡羅模擬(Monte Carlo simulation)等,都是牽涉其中的觀念與解決方法。而應用的場景包括下棋、Atari遊戲、汽車自動駕駛、機器人控制、供應鏈運作、製造品質與設備維護、行銷個人化與推薦系統、財務投資、智慧城市與資通安全等。
與機器學習的另外兩大支柱 - 監督式學習與非監督式學習相比,RL是在不確定的情況下,尋求長期利益最大化的控制與決策過程。它是從試誤經驗中不斷精煉解題策略的無精確目標學習方式,是創建智慧代理人(agent,或稱智能體)邁向通用人工智慧的計算框架。本課程結合案例數據進行實作,期能激發參與者對智能系統各種應用的興趣,邁向機器自主學習與譬劃未來的新境界。
與機器學習的另外兩大支柱 - 監督式學習與非監督式學習相比,RL是在不確定的情況下,尋求長期利益最大化的控制與決策過程。它是從試誤經驗中不斷精煉解題策略的無精確目標學習方式,是創建智慧代理人(agent,或稱智能體)邁向通用人工智慧的計算框架。本課程結合案例數據進行實作,期能激發參與者對智能系統各種應用的興趣,邁向機器自主學習與譬劃未來的新境界。
修課條件:
已修習機器學習或深度學習相關課程
課程大綱:
1.強化學習背景知識
1-1.隨機變數與機率函數
1-2.抽樣與蒙地卡羅法
1-3.梯度下降與倒傳遞更新
2.強化學習原理
2-1.循序決策相關名詞與動態規劃(狀態state、行動action、狀態轉移transition、報酬reward、政策policy、回報return 、價值value等)
2-2.隨機過程、馬可夫鏈、貝爾曼方程與馬可夫決策過程
2-3.價值最佳化方法(時間差法, SARSA, Q-learning, 高級技巧)
2-4.政策最佳化方法(政策梯度policy gradient)
2-5.行動者-評論家方法(actor-critic method)
2-6.連續控制與其他主題
1-1.隨機變數與機率函數
1-2.抽樣與蒙地卡羅法
1-3.梯度下降與倒傳遞更新
2.強化學習原理
2-1.循序決策相關名詞與動態規劃(狀態state、行動action、狀態轉移transition、報酬reward、政策policy、回報return 、價值value等)
2-2.隨機過程、馬可夫鏈、貝爾曼方程與馬可夫決策過程
2-3.價值最佳化方法(時間差法, SARSA, Q-learning, 高級技巧)
2-4.政策最佳化方法(政策梯度policy gradient)
2-5.行動者-評論家方法(actor-critic method)
2-6.連續控制與其他主題
課程師資:
鄒慶士 教授
專長:機率與統計學習、進化式多目標最佳化、賽局模型應用、系統模擬與強化學習、時間序列分析與控制
現任:國立臺北商業大學資訊與決策科學研究所暨智能控制與決策研究室教授
經歷:
香港科技大學(廣州)工業信息與智能研究所訪問教授(2024.10~2025.01)
國立臺北商業大學校務永續發展中心主任(2023.08~2024.07)暨推廣教育部主任(2024.02~2024.07)
專長:機率與統計學習、進化式多目標最佳化、賽局模型應用、系統模擬與強化學習、時間序列分析與控制
現任:國立臺北商業大學資訊與決策科學研究所暨智能控制與決策研究室教授
經歷:
香港科技大學(廣州)工業信息與智能研究所訪問教授(2024.10~2025.01)
國立臺北商業大學校務永續發展中心主任(2023.08~2024.07)暨推廣教育部主任(2024.02~2024.07)
主辦單位:
財團法人自強工業科學基金會
學員須知:
注意事項
※請前往竹科管理局廠商與單位名錄進行查詢,即可判斷公司是否為園區內廠商。
- 本計畫鼓勵女性學員報名參加培訓課程,必要時得優先錄取。
- 本計畫以竹科園區事業單位從業員工為主優先錄取,若有名額將開放有志進入園區就業人士報名參加。
- 若遇不可預測之突發因素,基金會保有相關課程調整、取消及講師之變動權。
- 無紙化環境,輕鬆達到減碳救地球,即日起16小時以上課程結業證書或未達16小時課程上課證明皆以電子方式提供。
- 本課程不適用廠商VIP折扣優惠
- 課前請詳閱簡章之課程內容或利用課程諮詢電話。
- 課程嚴禁旁聽,亦不可攜眷參與。
- 優惠方案擇一使用。
☆課程費用包含:紙本講義及稅。(不供午餐)
☆計畫補助課程不適用於其他基金會優惠方案及不可使用紅利點數折抵費用。
★計畫補助課程開課後,若因故無法上課,則不予退費。
✨針對園區廠商提供企業內訓課程規劃並享有優惠方案,若有需求可洽03-5623116分機3610鄒小姐。