自強課程

課程名稱

【假日線上班】PyTorch深度學習模型全解析(從CNN到Transformer) 熱烈招生中全線上

💥從 CNN 到 Transformer，一次學會影像分類、分割、偵測與生成模型的 PyTorch 全流程實作！💥

📢早安鳥方案：會員於115/5/2前(含)報名，可享超值優惠價8500元(請記得加入會員喔)
📣舊生續報優惠：凡曾上過林哲聰老師Pytorch系列課程，即可再折500元💥~煩請來電或來信告知!!

📌每位學員必須有自己的Google 帳號以在Colab進行實作

✨課程亮點✨
✅ 影像任務全面進化：AlexNet → ResNet → ViT、FCN → DeepLab → SETR、YOLO → DETR
✅ 生成模型從 GAN 走向 Diffusion 與 Stable Diffusion 微調
✅ 探索多模態模型 CLIP、BLIP、LLaVA，讓模型「看懂」影像並回答問題
✅ PyTorch + Colab 完整實作，從訓練、微調到應用
✅ 一次搞懂電腦視覺的核心技術脈絡

課程代碼：

15W302

上課時間：

5/16、5/23，星期六，10:00-17:00，共二週12小時。

上課時數：

12 小時

上課地點：

網路線上

課程費用：

9500元 (符合超值優惠價格者需送出報名表後，系統發出報名成功回函確認金額。)

超值優惠：

VIP企業會員價：VIP企業會員可享優惠價格 (按我)
會員優惠價： 會員於開課前七天完成報名繳費者可享會員優惠價 9000 元
團報價方案：會員2人同行，可享同行價 8500 元(須於課前告知)
會員紅利折抵：本課程歡迎使用紅利折抵，最高可使用 100 點

課程目標：

📢 從 CNN 到 Transformer，全面掌握電腦視覺的技術變革！

過去十年，CNN 改變了電腦視覺的世界；如今 Transformer 正以驚人速度接棒，從影像分類、分割、偵測到多模態理解全面革新。本課程將帶你系統性解析這場「從局部卷積 ➝ 全域注意力」的技術轉型，並親手實作各種經典與前沿模型。

課程特色：

特色一、從卷積到注意力：從影像分類與影像分割出發
從 AlexNet、ResNet 到 Vision Transformer (ViT) 理解卷積與注意力架構的差異，並親手比較在 CIFAR-10 上的訓練結果。接著從 FCN 到 DeepLab、SETR，探討分割任務如何從局部特徵延伸至全域上下文建模。

特色二、偵測、生成與多模態：聚焦於物件偵測、生成模型與 Vision-Language Models (VLM)
(1)偵測任務：
從 YOLOv1–v13 的 anchor-based 設計，到 DETR、AnchorDETR、RT-DETR 的 set-based Transformer 架構，理解 DETR 如何以「object query」與「Hungarian matching」取代傳統 anchor。
(2)3D偵測模型（DETR3D、PETR）：
展示Transformer 如何應用於三維場景
(3)生成模型：
從 GAN (DCGAN,Pix2Pix, CycleGAN) 開始，介紹對抗訓練原理，再進入Diffusion Models，說明 DDPM、Palette、Stable Diffusion 與其微調技術（DreamBooth、LoRA、Textual Inversion）的原理與實作。
(4)多模態理解（Vision-Language Models, VLM）:
從 CLIP的對比式圖文對齊、到 BLIP2 的圖像描述與視覺問答（VQA），再到LLaVA、Gemma 的多模態對話系統，學生將學會如何讓模型「看懂」影像並以自然語言回答問題，體驗 Transformer 從影像感知邁向語意理解的最終形態。

修課條件：

瞭解深度學習基本原理、具備基礎Python以及PyTorch程式開發經驗。
歡迎：
➡ 想快速掌握 AI 影像模型演進脈絡的工程師/研究人員
➡ 想強化 PyTorch 實作能力的開發者
➡ 想接軌 Vision-Language 前沿技術的學習者

課程大綱：

🚀 Day 1-從卷積到注意力：影像分類與分割任務
從經典卷積神經網路到 Transformer 架構，理解影像分類與影像分割的技術演進與設計邏輯，並透過實作感受模型差異。
◼影像分類模型：AlexNet → VGG → ResNet → ViT
◼影像分割模型：FCN → DeepLab → SETR

🚀 Day 2-偵測、生成與多模態：從任務到整合應用
進階探討 Transformer 在物件偵測、生成式 AI 與多模態理解的應用，掌握最前沿的深度學習模型趨勢與實作。
◼2D 偵測模型：YOLOv1–v13 → DETR → AnchorDETR → RT-DETR
◼3D 偵測模型：DETR3D → PETR
◼生成模型：DCGAN → Pix2Pix → CycleGAN → Diffusion → Stable Diffusion 微調
◼多模態模型 (VLM)：CLIP → BLIP → LLaVA → Gemma

課程師資：

自強基金會林老師
現任瑞典Chalmers University of Technology博士後研究員

經歷
▻ 工研院機械所副研究員/研究員/資深研究員
▻ 馬來西亞偉特科技公司(ViTrox)研發顧問
▻ 馬來西亞10 EPOCH科技公司研發顧問
▻ 加州大學聖塔芭芭拉分校資工系訪問研究員

專長
電腦視覺、機器學習、深度學習及其在駕駛輔助系統以及自駕車之各種應用

主辦單位:

財團法人自強工業科學基金會

相關課程：

⭐若您想全面瞭解深度學習並涵蓋多種應用領域（分類、偵測、生成等）
🉑➡ 15W302【平日實體班】PyTorch深度學習模型全解析(從CNN到Transformer) ⬅🤳請點課程
⭐若您想全面掌握生成模型與多模態應用的實作能力
🉑➡ 15W303【平日實體班】PyTorch 影像生成與視覺語言模型實作 ⬅🤳請點課程

學員須知：

報名與繳退費方法｜常見問題與解決｜會員紅利積點活動辦法

注意事項

清華大學學生優惠方案：清華大學學生可享課程最低優惠價─VIP企業會員優惠價，完成報名後須來電告知修改費用(使用本優惠價須於報名同時檢附在學中有效的清華大學學生證，且不得開立抬頭「國立清華大學」以外的三聯式公司發票)。

若遇不可預測之突發因素，基金會保有相關課程調整、取消及講師之變動權。

無紙化環境，輕鬆達到減碳救地球，即日起16小時以上課程結業證書或未達16小時課程上課證明皆以電子方式提供。

使用VIP廠商優惠之學員，上課當日報到時須查核該公司識別證(相關證明資料)。

會員紅利折抵限以原價或會員優惠價再折抵，其他方案不適用。

課前請詳閱簡章之課程內容或利用課程諮詢電話。

課程嚴禁旁聽，亦不可攜眷參與。

優惠方案擇一使用。

線上報名