自強課程
課程名稱
AI時代的深度強化學習:入門與實踐
熱烈招生中
Deep Reinforcement Learning (DRL) in the Age of AI: An Introduction and Hands-on Practice
課程代碼:
15C601
上課時間:
2026/01/17~2026/01/18兩天09:30~16:30
上課時數:
12 小時
上課地點:
台南市歸仁區歸仁十三路一段160號<致遠樓一樓>
課程費用:
9800元
(符合超值優惠價格者需送出報名表後,系統發出報名成功回函確認金額。)
超值優惠:
- VIP企業會員價:VIP企業會員可享優惠價格 (按我)
- 早安鳥方案:會員於開課二週前(含)報名並完成繳費,可享超值優惠價 9000 元
課程目標:
本課程旨在協助學員建立深度強化學習(Deep Reinforcement Learning, DRL)的基礎知識,熟悉常見 DRL 演算法,透過實作將DRL應用在AI問題上。
課程特色:
理論與實務兼備:從基礎概念到進階演算法,逐步建立完整的 DRL 知識體系。
熱門演算法精選:涵蓋 SARSA、DQN、A2C、PPO 等常用演算法,掌握業界與研究常見方法。
動手實作導向:每個單元皆配有 Google Colab 筆記本,提供可立即運行的程式範例。
易於入門:專為具備 Python 基礎 的學員設計,降低學習門檻,快速掌握 DRL 精髓。
應用視野拓展:結合理論與案例,讓學員了解 DRL 在 生成式 AI 與物理AI 中的應用潛力。
熱門演算法精選:涵蓋 SARSA、DQN、A2C、PPO 等常用演算法,掌握業界與研究常見方法。
動手實作導向:每個單元皆配有 Google Colab 筆記本,提供可立即運行的程式範例。
易於入門:專為具備 Python 基礎 的學員設計,降低學習門檻,快速掌握 DRL 精髓。
應用視野拓展:結合理論與案例,讓學員了解 DRL 在 生成式 AI 與物理AI 中的應用潛力。
修課條件:
有興趣的學員皆可參加
課程大綱:
1. Formulation of Reinforcement Learning
(DRL01_ML.ipynb & DRL02_FronzenLake1.ipynb)
2. Deep Learning Basics & Cross-Entropy Method
(DRL03_NN.ipynb & DRL04_CrossEntropy.ipynb)
3. Bellman Equation and Value Iteration Methods
(DRL05_ValueFunction4V.ipynb, DRL06_ValueFunction4Q.ipynb)
4. Monte Carlo Method vs. Temporal Difference Method
(DRL07_MC.ipynb)
5. Deep Q-Network (DQN) for Pong Game
(DRL08_DQN.ipynb)
6. Policy-Based Methods
(DRL09_HillClimbing.ipynb, DRL10_REINFORCE.ipynb)
7. Policy-Value Combined Methods
(DRL11_AAC.ipynb)
8.Proximal Policy Optimization (PPO) Method
(DRL12_PPO.ipynb)
9. Course Summary and Outlook
(DRL13_SB3_PPO.ipynb, DRL14_SKRL_PPO.ipynb)
(DRL01_ML.ipynb & DRL02_FronzenLake1.ipynb)
2. Deep Learning Basics & Cross-Entropy Method
(DRL03_NN.ipynb & DRL04_CrossEntropy.ipynb)
3. Bellman Equation and Value Iteration Methods
(DRL05_ValueFunction4V.ipynb, DRL06_ValueFunction4Q.ipynb)
4. Monte Carlo Method vs. Temporal Difference Method
(DRL07_MC.ipynb)
5. Deep Q-Network (DQN) for Pong Game
(DRL08_DQN.ipynb)
6. Policy-Based Methods
(DRL09_HillClimbing.ipynb, DRL10_REINFORCE.ipynb)
7. Policy-Value Combined Methods
(DRL11_AAC.ipynb)
8.Proximal Policy Optimization (PPO) Method
(DRL12_PPO.ipynb)
9. Course Summary and Outlook
(DRL13_SB3_PPO.ipynb, DRL14_SKRL_PPO.ipynb)
課程師資:
自強基金會專業講師
主辦單位:
財團法人自強工業科學基金會
學員須知:
注意事項



