自強課程

課程名稱
【補助申請中】PyTorch深度學習模型全解析(從CNN到Transformer) <假日線上> 熱烈招生中 全線上
✨政府補助優惠方案申請中。✨
建議若有參加意願,可先報名搶名額(不需先付費),待確認通過計畫後會通知您調整後的費用!!

💥從 CNN 到 Transformer,一次學會影像分類、分割、偵測與生成模型的 PyTorch 全流程實作!💥
📌每位學員必須有自己的Google 帳號以在Colab進行實作

✨課程亮點✨
✅ 影像任務全面進化:AlexNet → ResNet → ViT、FCN → DeepLab → SETR、YOLO → DETR
✅ 生成模型從 GAN 走向 Diffusion 與 Stable Diffusion 微調
✅ 探索多模態模型 CLIP、BLIP、LLaVA,讓模型「看懂」影像並回答問題
✅ PyTorch + Colab 完整實作,從訓練、微調到應用
✅ 一次搞懂電腦視覺的核心技術脈絡
 課程代碼:
15W302
 上課時間:
5/16、5/23,星期六,10:00-17:00,共二週12小時。 
 上課時數:
12 小時
 上課地點:
網路線上
 課程費用:
9500元 (符合超值優惠價格者需送出報名表後,系統發出報名成功回函確認金額。)
 課程目標:
📢 從 CNN 到 Transformer,全面掌握電腦視覺的技術變革!

過去十年,CNN 改變了電腦視覺的世界;如今 Transformer 正以驚人速度接棒,從影像分類、分割、偵測到多模態理解全面革新。本課程將帶你系統性解析這場「從局部卷積 ➝ 全域注意力」的技術轉型,並親手實作各種經典與前沿模型。
 課程特色:
特色一、從卷積到注意力:從影像分類與影像分割出發
從 AlexNet、ResNet 到 Vision Transformer (ViT) 理解卷積與注意力架構的差異,並親手比較在 CIFAR-10 上的訓練結果。接著從 FCN 到 DeepLab、SETR,探討分割任務如何從局部特徵延伸至全域上下文建模。

特色二、偵測、生成與多模態:聚焦於物件偵測、生成模型與 Vision-Language Models (VLM)
(1)偵測任務:
從 YOLOv1–v13 的 anchor-based 設計,到 DETR、AnchorDETR、RT-DETR 的 set-based Transformer 架構,理解 DETR 如何以「object query」與「Hungarian matching」取代傳統 anchor。
(2)3D偵測模型(DETR3D、PETR):
展示Transformer 如何應用於三維場景
(3)生成模型:
從 GAN (DCGAN,Pix2Pix, CycleGAN) 開始,介紹對抗訓練原理,再進入Diffusion Models,說明 DDPM、Palette、Stable Diffusion 與其微調技術(DreamBooth、LoRA、Textual Inversion)的原理與實作。
(4)多模態理解(Vision-Language Models, VLM):
從 CLIP的對比式圖文對齊、到 BLIP2 的圖像描述與視覺問答(VQA),再到LLaVA、Gemma 的多模態對話系統,學生將學會如何讓模型「看懂」影像並以自然語言回答問題,體驗 Transformer 從影像感知邁向語意理解的最終形態。
 修課條件:
瞭解深度學習基本原理、具備基礎Python以及PyTorch程式開發經驗。
歡迎:
➡ 想快速掌握 AI 影像模型演進脈絡的工程師/研究人員
➡ 想強化 PyTorch 實作能力的開發者
➡ 想接軌 Vision-Language 前沿技術的學習者
 課程大綱:
🚀 Day 1-從卷積到注意力:影像分類與分割任務
從經典卷積神經網路到 Transformer 架構,理解影像分類與影像分割的技術演進與設計邏輯,並透過實作感受模型差異。
◼影像分類模型:AlexNet → VGG → ResNet → ViT
◼影像分割模型:FCN → DeepLab → SETR

🚀 Day 2-偵測、生成與多模態:從任務到整合應用
進階探討 Transformer 在物件偵測、生成式 AI 與多模態理解的應用,掌握最前沿的深度學習模型趨勢與實作。
◼2D 偵測模型:YOLOv1–v13 → DETR → AnchorDETR → RT-DETR
◼3D 偵測模型:DETR3D → PETR
◼生成模型:DCGAN → Pix2Pix → CycleGAN → Diffusion → Stable Diffusion 微調
◼多模態模型 (VLM):CLIP → BLIP → LLaVA → Gemma
 課程師資:
自強基金會 林老師
現任瑞典Chalmers University of Technology博士後研究員

經歷
▻ 工研院機械所副研究員/研究員/資深研究員
▻ 馬來西亞偉特科技公司(ViTrox)研發顧問
▻ 馬來西亞10 EPOCH科技公司研發顧問
▻ 加州大學聖塔芭芭拉分校資工系訪問研究員

專長
電腦視覺、機器學習、深度學習及其在駕駛輔助系統以及自駕車之各種應用
  主辦單位:
財團法人自強工業科學基金會
 相關課程:

⭐若您想全面瞭解深度學習並涵蓋多種應用領域(分類、偵測、生成等)
🉑➡ 15W302【補助申請中】PyTorch深度學習模型全解析(從CNN到Transformer)<假日線上> ⬅🤳請點課程
⭐若您想全面掌握生成模型與多模態應用的實作能力
🉑➡ 15W303【輔助申請中】生成式影像與多模態AI:從Diffusion到視覺語言模型<假日線上> ⬅🤳請點課程
  注意事項


📌課程費用包含:講義及稅。《不提供午餐》
📌計畫補助課程不適用於其他基金會優惠方案及不可使用紅利點數折抵費用。
📌計畫補助課程《確定開課》/《線上課程講義寄出》後,若因故無法上課,則不予退費。

🔥🔥《企業內訓應援》
歡迎填寫🎯訓練心願清單《請點🎯》 !
我們將根據您的回饋來設計具體可行的課程方案,
是您達成培訓目標最強有力的後盾!😊
✨政府補助優惠方案推動中。✨

  • 若遇不可預測之突發因素,基金會保有相關課程調整、取消及講師之變動權。
  • 無紙化環境,輕鬆達到減碳救地球,即日起16小時以上課程結業證書或未達16小時課程上課證明皆以電子方式提供。
  • 本課程不適用廠商VIP折扣優惠
  • 課前請詳閱簡章之課程內容或利用課程諮詢電話。
  • 課程嚴禁旁聽,亦不可攜眷參與。
  • 優惠方案擇一使用。
  • 課程查詢或相關作業時程,請洽以下聯絡窗口。
    聯絡資訊