NT$700
課程資訊
適合對象
✔ 系統架構師或系統網路管理人員
✔ 商業資料分析部門主管及相關人員
你可以學到
| 我將學習什麼?
✔ 使用Spark MLlib分析真實資料,立即應用於日常工作上
✔ 機器學習及MLlib介紹
✔ 清楚釐清:資料型態及讀取資料
✔ 學習K-means分群模型 (K-means Clustering)、Logistic 分類模型 (Logistic Regression)
課程介紹
| 為什麼我該學Spark?
在熟悉Hadoop基礎概念後,若想要深入學習大數據,那你的下一步絕對要學Spark!就讓我們在這堂課程中,用Spark玩轉資料,挑戰背後無限商機!並讓您透過此課程輕鬆進入大數據分析領域。
根據104人力銀行近年預測指出,5大資料經濟職務需求趨勢(如下圖所示),可以意識到Spark技術已成為大數據分析領域不可或缺的新核心,讓我們一起為自己打造未來,奠定大數據技術的穩固基石吧!
| 課程內容
本課程內容涵蓋:
1.機器學習
2.資料處理
3.資料分析
於本堂Spark第三部曲: MLlib完成資料挖掘與機器學習實戰中,我們將透過深入淺出的方式了解機器學習原理,使用Spark MLlib分析真實資料,學習之後能立即應用於日常工作上。
| Spark三部曲完整學程,由淺入深學習
●Spark首部曲:實務基礎入門篇
●Spark第二部曲: SQL輕鬆處理半結構化資料技巧
●Spark第三部曲: MLlib完成資料挖掘與機器學習實戰
學習前基本能力
✔ Linux指令
✔ 需略懂Python、Scala
學習前準備
課程資訊
關於講師
Bryan Yang
●經歷:
-曾任職於電信及顧問業
-現任資深資料工程師
-現活躍於Spark台灣社群,致力於推廣Spark技術與商業應用整合
Definition and termiology
Categories of machine learning
Machine learning piplines
What is MLlib and content
Why MLlib?
Data type
Import and process data for MLlib
Descriptive Statistic
Quiz
Introduction to correlation
Quiz
Introduction to K-means
Understading the demo data
Analysis data using K-means
Quiz
Introdution to logistic regression
Uderstading the demo data and preprocess
Build a prediction model
Quiz
Intro to ALS
Import data and ETL
Build a recommendation system
Quiz
學習附件
關於講師
Bryan Yang
●經歷:
-曾任職於電信及顧問業
-現任資深資料工程師
-現活躍於Spark台灣社群,致力於推廣Spark技術與商業應用整合