課程代碼: 07C060
課程名稱: 大數據(Big Data)資料分析師人才養成班[自備NB]
上課時間: 107/10/6(六)至108/4/13(六),每週六,9:00~16:00,共120小時(12/22,12/29,1/19,2/2,2/9,3/2停課)
上課單位: 財團法人自強工業科學基金會
上課地點: 自強基金會台北分部(台北市博愛路80號3樓)
課程費用: 總費用36,000元,會員優惠價3,2000
諮詢專線: 02-23113316分機2287 林小姐 hClin@tcfst.org.tw
代碼 課程名稱 日期 時數 原價 優惠價  
07C060 大數據(Big Data)資料分析師人才養成班[自備NB]
(C060-1+C060-2+C060-3+C060-4)
10/6至108/4/13 120 36,000 32,000
07C060-1 單元一:大數據分析必備基礎 10/6至11/13 30 9,000 8,800
07C060-2 單元二:大數據分析語言-R語言 11/10至12/8 30 9,000 8,800
07C060-3 單元三:大數據分析工具-ElasticSearch 12/15108/2/16 30 9,000 8,800
07C060-4 單元四:大數據分析平台-Hadoop 實機建置與資料管理實務 108/3/9至4/13 30 9,000 8,800
※ 若遇不可預測之突發因素,基金會保有相關課程調整、取消及講師之變動權

報名資格&修課條件: 無需任何背景,只要你大專畢業,對從事巨量分析與程式開發工作有興趣者
  自備NB(Windows作業系統,64位元。例如 windows7記憶體最好8gb以上)
課程特色: 以目前主流Linux系統操作與Java程式應用教學
  大數據分析語言- R語言
  大數據分析工具–ElasticSearch
  大數據分析平台 – Hadoop
  本班以實務開發為導向,聘請業界專家授課,建構完整的專案實作經驗課程,由淺入深、循序漸進,理論與實作並重,培育學員有效提升學習技巧與效率
  完整有系統課程規劃:課程結合實作及案例,讓學員學習無障礙

師資介紹: Tony老師(業界師資實務經驗超過10年以上)
  經歷:曾任遠傳電信 技術副理六年、亞洲資採礦
  專長:數據分析、資料探勘
  賈斯丁老師(業界師資實務經驗超過10年以上)
  經歷:遠傳電信 大數據平台架構師
  專長:大數據平臺架構,Java程式開發
  梅老師(業界師資實務經驗超過10年以上)
  經歷:上上群科技股份有限公司
  專長:大數據及實機開發

課程大綱:
【代碼07C060-1】單元一:大數據分析必備基礎(30hr)
上課時間:2018/10/6(六)~11/3(六),每週六,9:00~16:00,共30小時
課程介紹
Elasticsearch 是一個分散式的大數據搜尋引擎,現今的大數據運算的關鍵技術,利用熱門的 Hadoop 之分散式檔案系統 HDFS 與 Hive 來快速建構出數據儲存環境,及以 Hive 實作完成數據分析報表, 同時結合 Elasticsearch  大數據分析工具完成即時數據查詢,這樣可透過 Hadoop 及結合 Elasticsearch 來進行大數據的處理、分析與應用。而這 Hadoop 大數據分析平臺與 ElasticSearch 大數據分析工具是使用 Java 所撰寫實現的,而 Hadoop 中分散式存儲技術,一般是運行在 Linux 平臺上。所以也必須掌握 Linux。
課程特色
Hadoop 屬於 Apache 基金會的頂級開源計畫之一, Hadoop 是用 Java 實現的。所以最好是熟悉 Linux 環境下程式設計。
1. Hadoop 是由 Java 語言編寫的,想要深入學習 Hadoop 必須熟練掌握 Java。
2. Hadoop 中 HDFS 是分散式存儲。一般運行在 Linux 平臺上。所以也必須掌握 Linux。
課程大綱
1. 關連式資料庫核心技術

2. Java程式設計
Java導論
基本運算符號
條件與迴圈控制
大量資料處理
物件導向觀念
圖形化介面設計

3. Linux系統操作與管理
首次登入與線上求助
用戶及用戶組管理命令
進程及任務管理命令
檔案權限與目錄配置
檔案與目錄管理
壓縮指令的應用
網路設定與管理

 

【代碼07C060-2】單元二:大數據分析語言-R語言(30hr)
2018/11/10(六)~12/8(六),每週六,9:00~16:00,共30小時
課程介紹
上一波人類在通用技術上的革新就是工業革命,而最近人工智慧(A.I. Artificial Intelligence)火紅的程度被譽為是下一波的進化革命,但目前台灣企業想要將AI技術商業化並創造價值實為一艱難課題,因此本課程以R語言為技術落地工具,協助學員進入人工智慧與機器學習領域,為自己培養創造價值的能力。
課程特色
R語言是簡單、成熟且進入門檻低的直譯式語言,非常適合初學者在許多領域上使用,尤其在大數據分析上提供許多方便且多樣性的工具套件包進行分析。在本課程中將帶領學員在Windows上安裝R語言並說明軟體功能與程式撰寫技巧,另外課程內容包含淺層資料分析技術與火紅的深度學習技術,使學員充分了解實務上如何應用演算法來解決商業問題。
課程大綱
大數據介紹與資料科學導論 基礎繪圖(Graphics)
你的行業有大數據嗎? R與假設檢定
R的介紹與安裝 高階視覺化工作包(Google地圖、文字雲...)
R快速入門 進階資料分析:數據探勘(Data Mining)方法論與應用
R程式設計基礎 CRISP-DM與時窗(Time Windows)介紹
函式與物件 分群演算法:K-means 介紹、實作
資料結構(vector、data frame...) 分類演算法:KNN、Decison Tree與Logit介紹與實作
R的輸入與輸出(csv檔、txt檔、MySql資料庫...) 預測演算法:簡單迴歸與多元回歸介紹與實作
自訂函式UDF(User Define Function) 關聯演算法:Apriori介紹與實作
R與敘述統計 模型實務案例分享

 

【代碼07C060-3】單元三:大數據分析工具- ElasticSearch (30hr)
2018/12/15(六)~2019/2/16(六),每週六,9:00~16:00,共30小時
課程介紹
處理大數據時儲存與分析數據平台的選擇與使用一直都是資料科學家的第一個重要的課題。在面對大數據時選擇合適的大數據工具平台,可以讓您快速的儲存資料、資料增加時可以經過簡單的方式擴充數據平台;並在最短的時間開始了解您的數據、視覺化資料,進而分析並應用資料。本課程利用Elasticsearch + Logstash + Kibana = ELK 作為大數據平台,30小時的課程將會逐步說明如何利用ELK來達成數據生命週期的各項應用。
課程特色
本課程利用Elasticsearch + Logstash + Kibana = ELK 作為大數據平台,30小時的課程將會逐步說明如何利用ELK來達成數據生命週期的各項應用。
課程大綱
大數據與數據生命週期,ELK介紹與安裝
ELK叢集建立與資料視覺化
使用ELK 分析log資料與告警系統
應用ELK Graph進行文字探勘
使用ELK Timelion進行時間序列分析
使用ELK ML進行機器學習分析應用

 

【代碼07C060-4】單元四:大數據分析平台– Hadoop (30hr)
2019/3/9(六)~4/13(六),每週六,9:00~16:00,共30小時(2/2&2/9停課)
課程介紹
培養學員具有Hadoop 實際安裝與操作的能力。透過自造Hadoop 迷你刀鋒的教學環境,讓參訓學員瞭解正確的觀念與方法,並且能夠在實機操作體驗中驗證課程所學,將開發出的設備應用在大數據的分析應用上,可以不用花大錢就可以進行數據的匯整與分析。
課程大綱
認識 Big Data 生態系統 設定 Data Node 白名單及硬碟空間配置
認識與設定 迷你 Big Data Appliance 設定 Rack Awareness
認識 Hadoop 叢集系統架構 設定 Node Manager
設定與管理 HDFS 分散檔案系統 白名單
YARN 及MapReduce 運作架構 認識與設定 Pig
設定與管理 YARN 分散運算系統 Pig 實務應用分享
建立 Secondary 認識與設定 Hive
Name Node Hive 資料倉儲實務應用