NT$1,200
最新討論

課程資訊
適合對象
✔ 系統架構師或系統網路管理人員
✔ 商業資料分析部門主管及相關人員
你可以學到
✔ 了解Spark核心基礎與環境建置
✔ 學習Scala語言
✔ 實作Streaming
課程介紹
| 為什麼我該學Spark?
在熟悉Hadoop基礎概念後,若想要深入學習大數據,那你的下一步絕對要學Spark!就讓我們在這堂課程中,用Spark玩轉資料,挑戰背後無限商機!並讓您透過此課程輕鬆進入大數據分析領域。
根據104人力銀行預測指出,2018年5大資料經濟職務需求趨勢(如下圖所示),可以意識到Spark技術已成為大數據分析領域不可或缺的新核心,讓我們一起為自己打造未來,奠定大數據技術的穩固基石吧!
| 初學者免擔心!我們將從Spark基礎開始
●此學程重點包含:
1.了解Spark核心基礎與環境建置
2.學習Scala語言以掌握Spark精髓
3.從資料收集開始,實作Streaming串流分析。
1.Spark基於記憶體運算,相較於Hadoop上的MapReduce效能快上許多,課程中會介紹Spark整體架構設計原理以及如何建置Spark環境;最後,當然不會錯過Spark中最基礎也是最重要的資料結構-RDD,我們將一起學習什麼是RDD,以及又該如何最有效率地操作RDD。
2. Scala作為Spark的原生語言,了解Scala一些基本語法,有助於理解Spark的操作。在這個課程中我們將介紹Scala一些特點,包括OO及FP的實現以及Scala的編譯器-SBT。
3.Spark Streaming是Spark延伸的API,具備可擴展,高吞吐及容錯的流式處理架構。在這堂課,將會學到Streaming架構,DStream的操作,以及與Kafka的整合。
Spark將Hadoop Ecosystem的元素統合,透過簡潔語法完成Map Reduce,並在同一套件中完成資料串流;利用簡單API完成Machine Learning,Hadoop的MapReduce在執行完工作後,會將中介資料存放到磁碟中。Spark使用記憶體內運算技術,能在資料尚未寫入硬碟時即在記憶體內分析運算。且執行程式的運算速度能做到比Hadoop MapReduce快上100倍,即便是在硬碟執行程式時,Spark也能快上10倍速度。
Spark允許用戶將資料加載至叢集記憶體內存,並多次對其進行查詢,非常適合用於機器學習演算法。國際大廠包括 AWS IBM SAP皆將Spark作為底層技術來使用,學習本課程有助於將 Hadoop Ecosystem 轉移到Spark系統中,Spark 較容易上手以及豐富生態系,讓使用者可以更專精處理數據。
| Spark三部曲完整學程,由淺入深學習
●Spark首部曲:實務基礎入門篇
●Spark第二部曲: SQL輕鬆處理半結構化資料技巧
●Spark第三部曲: MLlib完成資料挖掘與機器學習實戰
學習前基本能力
基礎物件導向概念
具備基本網路概念
學習前準備
課程資訊
關於講師

Mark Yang
●現任手機資料分析工程師,為HadoopCon2015的講者,目前常出沒於Spark台灣社群,致力於推廣Spark技術與Scala。
學習附件
購買此課程後,才能使用留言功能
目前尚無任何討論主題
成為第一個發問的人!在問答中找到學習的捷徑。關於講師

Mark Yang
●現任手機資料分析工程師,為HadoopCon2015的講者,目前常出沒於Spark台灣社群,致力於推廣Spark技術與Scala。