自強課程

課程名稱
【平日實體班】PyTorch深度學習模型全解析(從CNN到Transformer) 熱烈招生中
💥從 CNN 到 Transformer,一次學會影像分類、分割、偵測與生成模型的 PyTorch 全流程實作!💥

📢早安鳥方案:會員於115/1/4前(含)報名,可享超值優惠價8500元(請記得加入會員喔)
📣舊生續報優惠:凡曾上過林哲聰老師Pytorch系列課程,即可再折500元💥~煩請來電或來信告知!!
📌每位學員必須有自己的Google 帳號以在Colab進行實作

✨課程亮點✨
✅ 影像任務全面進化:AlexNet → ResNet → ViT、FCN → DeepLab → SETR、YOLO → DETR
✅ 生成模型從 GAN 走向 Diffusion 與 Stable Diffusion 微調
✅ 探索多模態模型 CLIP、BLIP、LLaVA,讓模型「看懂」影像並回答問題
✅ PyTorch + Colab 完整實作,從訓練、微調到應用
✅ 一次搞懂電腦視覺的核心技術脈絡
 課程代碼:
15W302
 上課時間:
115/ 1/22、1/29,每週四,09:30-16:30,共二週12小時。 
 上課時數:
12 小時
 課程費用:
9500元 (符合超值優惠價格者需送出報名表後,系統發出報名成功回函確認金額。)
 超值優惠:
  • VIP企業會員價:VIP企業會員可享優惠價格 (按我)
  • 會員優惠價: 會員於開課前七天完成報名繳費者可享會員優惠價 9000 元
  • 團報價方案:會員2人同行,可享同行價 8500 元(須於課前告知)
  • 會員紅利折抵:本課程歡迎使用紅利折抵,最高可使用 100 點
 課程目標:
📢 從 CNN 到 Transformer,全面掌握電腦視覺的技術變革!

過去十年,CNN 改變了電腦視覺的世界;如今 Transformer 正以驚人速度接棒,從影像分類、分割、偵測到多模態理解全面革新。本課程將帶你系統性解析這場「從局部卷積 ➝ 全域注意力」的技術轉型,並親手實作各種經典與前沿模型。
 課程特色:
特色一、從卷積到注意力:從影像分類與影像分割出發
從 AlexNet、ResNet 到 Vision Transformer (ViT) 理解卷積與注意力架構的差異,並親手比較在 CIFAR-10 上的訓練結果。接著從 FCN 到 DeepLab、SETR,探討分割任務如何從局部特徵延伸至全域上下文建模。

特色二、偵測、生成與多模態:聚焦於物件偵測、生成模型與 Vision-Language Models (VLM)
(1)偵測任務:
從 YOLOv1–v13 的 anchor-based 設計,到 DETR、AnchorDETR、RT-DETR 的 set-based Transformer 架構,理解 DETR 如何以「object query」與「Hungarian matching」取代傳統 anchor。
(2)3D偵測模型(DETR3D、PETR):
展示Transformer 如何應用於三維場景
(3)生成模型:
從 GAN (DCGAN,Pix2Pix, CycleGAN) 開始,介紹對抗訓練原理,再進入Diffusion Models,說明 DDPM、Palette、Stable Diffusion 與其微調技術(DreamBooth、LoRA、Textual Inversion)的原理與實作。
(4)多模態理解(Vision-Language Models, VLM):
從 CLIP的對比式圖文對齊、到 BLIP2 的圖像描述與視覺問答(VQA),再到LLaVA、Gemma 的多模態對話系統,學生將學會如何讓模型「看懂」影像並以自然語言回答問題,體驗 Transformer 從影像感知邁向語意理解的最終形態。
 修課條件:
瞭解深度學習基本原理、具備基礎Python以及PyTorch程式開發經驗。
歡迎:
➡ 想快速掌握 AI 影像模型演進脈絡的工程師/研究人員
➡ 想強化 PyTorch 實作能力的開發者
➡ 想接軌 Vision-Language 前沿技術的學習者
 課程大綱:
🚀 Day 1-從卷積到注意力:影像分類與分割任務
從經典卷積神經網路到 Transformer 架構,理解影像分類與影像分割的技術演進與設計邏輯,並透過實作感受模型差異。
◼影像分類模型:AlexNet → VGG → ResNet → ViT
◼影像分割模型:FCN → DeepLab → SETR

🚀 Day 2-偵測、生成與多模態:從任務到整合應用
進階探討 Transformer 在物件偵測、生成式 AI 與多模態理解的應用,掌握最前沿的深度學習模型趨勢與實作。
◼2D 偵測模型:YOLOv1–v13 → DETR → AnchorDETR → RT-DETR
◼3D 偵測模型:DETR3D → PETR
◼生成模型:DCGAN → Pix2Pix → CycleGAN → Diffusion → Stable Diffusion 微調
◼多模態模型 (VLM):CLIP → BLIP → LLaVA → Gemma
 課程師資:
自強基金會 林老師
現任瑞典Chalmers University of Technology博士後研究員

經歷
▻ 工研院機械所副研究員/研究員/資深研究員
▻ 馬來西亞偉特科技公司(ViTrox)研發顧問
▻ 馬來西亞10 EPOCH科技公司研發顧問
▻ 加州大學聖塔芭芭拉分校資工系訪問研究員

專長
電腦視覺、機器學習、深度學習及其在駕駛輔助系統以及自駕車之各種應用
  主辦單位:
財團法人自強工業科學基金會
 相關課程:

⭐若您想全面瞭解深度學習並涵蓋多種應用領域(分類、偵測、生成等)
🉑➡ 15W302【平日實體班】PyTorch深度學習模型全解析(從CNN到Transformer) ⬅🤳請點課程
⭐若您想全面掌握生成模型與多模態應用的實作能力
🉑➡ 15W303【平日實體班】PyTorch 影像生成與視覺語言模型實作 ⬅🤳請點課程
  注意事項
  • 清華大學學生優惠方案:清華大學學生可享課程最低優惠價─VIP企業會員優惠價,完成報名後須來電告知修改費用(使用本優惠價須於報名同時檢附在學中有效的清華大學學生證,且不得開立抬頭「國立清華大學」以外的三聯式公司發票)。
  • 若遇不可預測之突發因素,基金會保有相關課程調整、取消及講師之變動權。
  • 無紙化環境,輕鬆達到減碳救地球,即日起16小時以上課程結業證書或未達16小時課程上課證明皆以電子方式提供。
  • 使用VIP廠商優惠之學員,上課當日報到時須查核該公司識別證(相關證明資料)。
  • 會員紅利折抵限以原價或會員優惠價再折抵,其他方案不適用。
  • 課前請詳閱簡章之課程內容或利用課程諮詢電話。
  • 課程嚴禁旁聽,亦不可攜眷參與。
  • 優惠方案擇一使用。
  • 課程查詢或相關作業時程,請洽以下聯絡窗口。
    聯絡資訊