課程名稱: 大數據(Big Data)資料分析師人才養成班(自備NB)
上課時間: 107/3/10(六)至107/8/18(六),每週六9:00~16:00,共120小時 (3/17, 3/31,4/7,6/16停課)
課程代碼: 07C002
主辦單位: 財團法人自強工業科學基金會
上課地點: 自強基金會台北分部(台北市博愛路80號3樓)
課程費用: 總費用36,000元,會員優惠價32,000元
諮詢專線: 02-23113316分機2287 林小姐 hClin@tcfst.org.tw

代碼 課程名稱 課程時間 時數 原價 優惠價  
07C002 大數據(Big Data)資料分析師人才養成班(自備NB) 3/10-8/18 120 36,000 32,000
07C002-1 單元一:大數據分析必備基礎 5/5-6/02 30 9,000 8,500
07C002-2 單元二:大數據分析語言- R語言 3/10-4/28 30 9,000 8,800
07C002-3 單元三:大數據分析工具- ElasticSearch 6/09-7/14 30 9,000 8,800
07C002-4 單元四:大數據分析平台--Hadoop 實機建置與資料管理實務 7/21-8/18 30 9,000 8,800
若遇不可預測之突發因素,基金會保有相關課程調整、取消及講師之變動權。

報名資格&修課條件: 1. 無需任何背景,只需大專畢業,對從事巨量分析與程式開發工作有興趣者
  2. 自備NB(Windows作業系統,64位元。例 windows7記憶體最好8gb以上)

本課程特色: 1. 以目前主流Linux系統操作與Java程式應用教學
  2. 大數據分析語言- R語言
  3. 大數據分析工具–ElasticSearch
  4. 大數據分析平台 – Hadoop
  5. 本班以實務開發為導向,聘請業界專家授課,建構完整的專案實作經驗課程,由淺入深、循序漸進,理論與實作並重,培育學員有效提升學習技巧與效率
  6. 完整有系統課程規劃:課程結合實作及案例,讓學員學習無障礙


師資介紹:
  • 江義華老師(教學經驗超過20年以上,同時是多家廠商聘請之專業技術顧問)
    專長:嵌入式系統開發、多套自動化系統及驅動程Driver、WEB-ERP系統、ERP系統
  • Tony老師(業界師資實務經驗超過10年以上)
    經歷: 曾任遠傳電信 技術副理六年 亞洲資採礦
    專長: 數據分析、資料探勘
  • 賈斯丁老師(業界師資實務經驗超過10年以上)
    經歷:遠傳電信 大數據平台架構師
    專長 : 大數據平臺架構,Java程式開發
  • 吳碧梅老師(業界師資實務經驗超過10年以上)
    經歷:上上群科技股份有限公司
    專長:大數據及實機開發

課程大綱:
【代碼07C002-1】單元一:大數據分析必備基礎(30hr)
上課時間:2018/5/5(六)~6/2(六),每週六,9:00~16:00共30小時
課程介紹:
Elasticsearch 是一個分散式的大數據搜尋引擎,現今的大數據運算的關鍵技術,利用熱門的 Hadoop 之分散式檔案系統 HDFS 與 Hive 來快速建構出數據儲存環境,及以 Hive 實作完成數據分析報表, 同時結合 Elasticsearch  大數據分析工具完成即時數據查詢,這樣可透過 Hadoop 及結合 Elasticsearch 來進行大數據的處理、分析與應用。而這 Hadoop 大數據分析平臺與 ElasticSearch 大數據分析工具是使用 Java 所撰寫實現的,而 Hadoop 中分散式存儲技術,一般是運行在 Linux 平臺上。所以也必須掌握 Linux。
課程特色:
Hadoop 屬於 Apache 基金會的頂級開源計畫之一, Hadoop 是用 Java 實現的。所以最好是熟悉 Linux 環境下程式設計。
1. Hadoop 是由 Java 語言編寫的,想要深入學習 Hadoop 必須熟練掌握 Java。

2. Hadoop 中 HDFS 是分散式存儲。一般運行在 Linux 平臺上。所以也必須掌握 Linux。
課程大綱:
1. 關連式資料庫核心技術
2. Java程式設計
- 認識 Java 環境、開發工具與第一支 Java 程式
- Java 的 Application 程式架構
- Java 程式語言基礎
- Java 之物件導向設計基礎、字串與陣列
- 物件導向技術概念
- 詳述宣告類別及定義建構其成員
- Java 的繼承
- Java 例外處理
3. Linux系統操作與管理
- 首次登入與線上求助
- 用戶及用戶組管理命令
- 進程及任務管理命令
- 檔案權限與目錄配置
- 檔案與目錄管理
- 壓縮指令的應用
- 網路設定與管理
 

課程大綱:
【代碼07C002-2】單元二:大數據分析語言-R語言(30hr)
上課時間:2018/3/10(六)~4/28(六),每週六,9:00~16:00共30小時(3/17, 3/31,4/7停課)
課程介紹:
上一波人類在通用技術上的革新就是工業革命,而最近人工智慧(A.I. Artificial Intelligence)火紅的程度被譽為是下一波的進化革命,但目前台灣企業想要將AI技術商業化並創造價值實為一艱難課題,因此本課程以R語言為技術落地工具,協助學員進入人工智慧與機器學習領域,為自己培養創造價值的能力。
課程特色:
R語言是簡單、成熟且進入門檻低的直譯式語言,非常適合初學者在許多領域上使用,尤其在大數據分析上提供許多方便且多樣性的工具套件包進行分析。在本課程中將帶領學員在Windows上安裝R語言並說明軟體功能與程式撰寫技巧,另外課程內容包含淺層資料分析技術與火紅的深度學習技術,使學員充分了解實務上如何應用演算法來解決商業問題。
課程大綱:
- 大數據介紹與資料科學導論
- 你的行業有大數據嗎?
- R的介紹與安裝
- R快速入門
- R程式設計基礎
- 函式與物件
- 資料結構(vector、data frame...)
- R的輸入與輸出(csv檔、txt檔、MySql資料庫...)
- 自訂函式UDF(User Define Function)
- R與敘述統計
- 基礎繪圖(Graphics)
- R與假設檢定
- 高階視覺化工作包(Google地圖、文字雲...)
- 進階資料分析:數據探勘(Data Mining)方法論與應用
- CRISP-DM與時窗(Time Windows)介紹
- 分群演算法:K-means 介紹、實作
- 分類演算法:KNN、Decison Tree與Logit介紹與實作
- 預測演算法:簡單迴歸與多元回歸介紹與實作
- 關聯演算法:Apriori介紹與實作
- 模型實務案例分享
 

課程大綱:
【代碼07C002-3】單元三:大數據分析工具- ElasticSearch (30hr)
上課時間:2018/6/9(六)~7/14(六),每週六,9:00~16:00共30小時(6/16停課)
課程介紹:
處理大數據時儲存與分析數據平台的選擇與使用一直都是資料科學家的第一個重要的課題。在面對大數據時選擇合適的大數據工具平台,可以讓您快速的儲存資料、資料增加時可以經過簡單的方式擴充數據平台;並在最短的時間開始了解您的數據、視覺化資料,進而分析並應用資料。本課程利用Elasticsearch + Logstash + Kibana = ELK 作為大數據平台,30小時的課程將會逐步說明如何利用ELK來達成數據生命週期的各項應用。
課程特色:
本課程利用Elasticsearch + Logstash + Kibana = ELK 作為大數據平台,30小時的課程將會逐步說明如何利用ELK來達成數據生命週期的各項應用。
課程大綱:
- 大數據與數據生命週期,ELK介紹與安裝
- ELK叢集建立與資料視覺化
- 使用ELK 分析log資料與告警系統
- 應用ELK Graph進行文字探勘
- 使用ELK Timelion進行時間序列分析
- 使用ELK ML進行機器學習分析應用
 

課程大綱:
【代碼07C002-4】單元四:大數據分析平台– Hadoop
上課時間:2018/7/21(六)~8/18(六),每週六,9:00~16:00共30小時
課程介紹:
培養學員具有Hadoop 實際安裝與操作的能力.透過自造Hadoop 迷你刀鋒的教學環境, 讓參訓學員瞭解正確的觀念與方法, 並且能夠在實機操作體驗中驗證課程所學,將開發出的設備應用在大數據的分析應用上,可以不用花大錢就可以進行數據的匯整與分析。
課程大綱:
- 認識 Big Data 生態系統
- 認識與設定 迷你 Big Data Appliance
- 認識 Hadoop 叢集系統架構
- 設定與管理 HDFS 分散檔案系統
- YARN 及MapReduce 運作架構
- 設定與管理 YARN 分散運算系統
- 建立 Secondary
- Name Node
- 設定 Data Node 白名單及硬碟空間配置
- 設定 Rack Awareness
- 設定 Node Manager
- 白名單
- 認識與設定 Pig
- Pig 實務應用分
- 認識與設定 Hive
- Hive 資料倉儲實務應用