自強課程
課程名稱
圖形處理器(GPU)運算開發設計實作含趨勢(自備NB)
熱烈招生中
NVIDIA CUDA
課程代碼:
15C043
上課時間:
2026/6/24(三)、6/25(四),9:00~16:00,共12小時
上課時數:
12 小時
上課地點:
課程費用:
12500元
(符合超值優惠價格者需送出報名表後,系統發出報名成功回函確認金額。)
超值優惠:
- VIP企業會員價:VIP企業會員可享優惠價格 (按我)
- 會員優惠價: 會員於開課前七天完成報名繳費者可享會員優惠價 12300 元
- 會員紅利折抵:本課程歡迎使用紅利折抵,最高可使用 100 點
(金銀級會員已是最優惠價,無法再使用紅利折抵。)
課程目標:
1.建立 GPU 平行運算與 CUDA 核心觀念
2.理解 GPU 平行運算架構、CUDA 程式模型與記憶體階層,奠定高效能運算基礎。
3.培養 CUDA 平行程式設計與效能最佳化能力
4.透過實作課程,學習資料切割、執行緒配置、多串流與多 GPU 設計技巧。
5.應用 GPU 平行運算於 AI 與高效能運算領域
6.將 CUDA 技術實際應用於人工智慧、科學計算與工程模擬,銜接產業需求與未來運算最新趨勢。
2.理解 GPU 平行運算架構、CUDA 程式模型與記憶體階層,奠定高效能運算基礎。
3.培養 CUDA 平行程式設計與效能最佳化能力
4.透過實作課程,學習資料切割、執行緒配置、多串流與多 GPU 設計技巧。
5.應用 GPU 平行運算於 AI 與高效能運算領域
6.將 CUDA 技術實際應用於人工智慧、科學計算與工程模擬,銜接產業需求與未來運算最新趨勢。
修課條件:
只要具備 C 程式語言的設計基礎就可參加此課程
課程大綱:
一、基礎概念與 CUDA 入門
1.GPU 與 CUDA 平行運算概念入門
1.1NVIDIA GPU 架構介紹
1.2CUDA SDK、運算能力與產業應用範例
2.平行計算的核心概念:Thread, Block, Grid, Warp
2.1GPU 如何「分工合作」
2.2各式各樣的數據如何「平行分割」
2.3數據與運算的平行分配
3.基礎 CUDA 平行程式設計實作
3.1編寫簡單 CUDA 程式,感受 GPU 的加速魅力
二、CUDA 記憶體管理與效能分析
4. GPU 記憶體階層與優化策略
4.1Global, Constant, Shared 記憶體介紹
4.2實作:使用 Shared Memory 加速小範例
5.效能分析與優化工具
5.1Nsight System 與 Nsight Compute
5.2透過效能分析找出 CUDA 程式的瓶頸
6.基礎 CUDA 平行程式設計實作
6.1在平行程式中加入計時器評估效能
三、科學運算應用專題
7.應用專題:影像處理加速實作
7.1Image Sobel Filtering, De-noising, and Rotation
7.2CUDA Texture 及 Surface 記憶體的輔助加速方式
8.科學模擬與金融應用專題
8.1N Body 物理模擬與 Monte Carlo 選擇權平行運算
8.2Reduction Optimization 平行計算
8.3如何使用 GPU 平行化解決不同領域的計算問題
四、進階技術與未來趨勢
9.多 GPU 與 Streams 並行技術
9.1Multiple Streams 與 Multiple GPUs 基本操作
9.2GPUDirect Peer-to-peer Transfers 及 Unified Virtual Addressing
10.NVIDIA AI 超級運算與最新技術分享
10.1NVIDIA AI Supercomputer 架構與未來趨勢
10.2NVLink 高速互聯如何提升 AI 大語言模型 (LLM) 的訓練
10.3CUDA 在生成式 AI(例如 ChatGPT、LLM)背後所扮演的角色
1.GPU 與 CUDA 平行運算概念入門
1.1NVIDIA GPU 架構介紹
1.2CUDA SDK、運算能力與產業應用範例
2.平行計算的核心概念:Thread, Block, Grid, Warp
2.1GPU 如何「分工合作」
2.2各式各樣的數據如何「平行分割」
2.3數據與運算的平行分配
3.基礎 CUDA 平行程式設計實作
3.1編寫簡單 CUDA 程式,感受 GPU 的加速魅力
二、CUDA 記憶體管理與效能分析
4. GPU 記憶體階層與優化策略
4.1Global, Constant, Shared 記憶體介紹
4.2實作:使用 Shared Memory 加速小範例
5.效能分析與優化工具
5.1Nsight System 與 Nsight Compute
5.2透過效能分析找出 CUDA 程式的瓶頸
6.基礎 CUDA 平行程式設計實作
6.1在平行程式中加入計時器評估效能
三、科學運算應用專題
7.應用專題:影像處理加速實作
7.1Image Sobel Filtering, De-noising, and Rotation
7.2CUDA Texture 及 Surface 記憶體的輔助加速方式
8.科學模擬與金融應用專題
8.1N Body 物理模擬與 Monte Carlo 選擇權平行運算
8.2Reduction Optimization 平行計算
8.3如何使用 GPU 平行化解決不同領域的計算問題
四、進階技術與未來趨勢
9.多 GPU 與 Streams 並行技術
9.1Multiple Streams 與 Multiple GPUs 基本操作
9.2GPUDirect Peer-to-peer Transfers 及 Unified Virtual Addressing
10.NVIDIA AI 超級運算與最新技術分享
10.1NVIDIA AI Supercomputer 架構與未來趨勢
10.2NVLink 高速互聯如何提升 AI 大語言模型 (LLM) 的訓練
10.3CUDA 在生成式 AI(例如 ChatGPT、LLM)背後所扮演的角色
課程師資:
Frank資深顧問
授課經驗:臺灣大學計算機及資訊網路中心/工研院/資策會/創意電子/聯詠/聯陽/凌陽/友達
主要研究領域:Modern Artificial Intelligence application, Multi-core parallel processing and GPU massive processing, Image AI application, Edge AI and LLM application, Embedded SOC system, FPGA and Chip design。
學經歷:畢業於國立臺灣大學 電機系(博士),半導體公司晶片設計經理、中山科學研究院、科技公司副總工程師
授課經驗:臺灣大學計算機及資訊網路中心/工研院/資策會/創意電子/聯詠/聯陽/凌陽/友達
主要研究領域:Modern Artificial Intelligence application, Multi-core parallel processing and GPU massive processing, Image AI application, Edge AI and LLM application, Embedded SOC system, FPGA and Chip design。
學經歷:畢業於國立臺灣大學 電機系(博士),半導體公司晶片設計經理、中山科學研究院、科技公司副總工程師
主辦單位:
財團法人自強工業科學基金會
學員須知:
注意事項



