TibaMe
系統初始化失敗,請重新整理頁面
若持續無法載入頁面,請 聯絡客服

Erica Li

Spark第二部曲: SQL輕鬆處理半結構化資料技巧

NT$650
人工智慧資料處理

利用Spark SQL的特性,做出商業智慧報表不再難!TibaMe的Spark第二部曲: SQL輕鬆處理半結構化資料技巧,課程中將帶領你學習:取得資料、資料前處理基本功,並透過了解SQL、DataFrame的優點,並利用課堂中所學實作製作商業智慧報表。

NT$650

目前尚無任何課程公告
講師將會在這發佈與課程相關的公告或是通知課程內容更新的公告。

最新討論

課程的投影片
沈佩璇 · 2020/08/23 18:05
查看更多討論

課程資訊

default clock課程時長 1 小時 13 分
default video課程共 6 單元 20 小節
default download2 個可下載的 學習資源
icon_info_certificate提供完訓證書
default plan提供制定 學習計畫建議學習 3 週 (每週 2 小時)

適合對象

✔ 對大數據處理、分析、應用有興趣者
✔ 系統架構師或系統網路管理人員
✔ 商業資料分析部門主管及相關人員

你可以學到


| 本門課程:Spark二部曲將帶領你學習

✔ 取得資料、資料前處理基本功
✔ 了解SQL、DataFrame的優點
✔ 利用SQL語言與DataFrame的優勢,製作商業智慧報表

課程介紹

| 為什麼我該學Spark?

在熟悉Hadoop基礎概念後,若想要深入學習大數據,那你的下一步絕對要學Spark!就讓我們在這堂課程中,用Spark玩轉資料,挑戰背後無限商機!並讓您透過此課程輕鬆進入大數據分析領域。
根據104人力銀行預測指出,20185大資料經濟職務需求趨勢(如下圖所示),可以意識到Spark技術已成為大數據分析領域不可或缺的新核心,讓我們一起為自己打造未來,奠定大數據技術的穩固基石吧!



|資料串接好簡單!讓我們用Spark SQL製作商業報表

利用Spark SQL與各式資料串連,不論是HDFS、本機系統或是Hadoop Hive資料表,透過取得資料、資料前處理、利用SQL語言與DataFrame的優點,製作商業智慧報表,甚至了解Spark SQL效能調整的功能設定,讓你輕鬆掌握Spark SQL的精髓

Spark SQL, a powerful integration between SQL and Python/Scala/Java. Spark SQL makes our analyst life simpler and faster! In this lecture, you will learn how to load data from structured sources, connect RDD with SQL language, and SQL performance tuning.

| Spark三部曲完整學程,由淺入深學習
Spark首部曲:實務基礎入門篇
Spark第二部曲: SQL輕鬆處理半結構化資料技巧
Spark第三部曲: MLlib完成資料挖掘與機器學習實戰

學習前基本能力

✔ Hadoop HDFS、Hive experiense操作基礎
✔ Linux操作基礎
✔ TSQL操作基礎
✔ Python、Scala基礎

學習前準備

✔ 無


課程資訊

default clock課程時長 1 小時 13 分
default video課程共 6 單元 20 小節
default download2 個可下載的 學習資源
icon_info_certificate提供完訓證書
default plan提供制定 學習計畫建議學習 3 週 (每週 2 小時)

關於講師

Erica Li

經歷:
●醫院臨床試驗統計分析師
●電子商務資料採礦分析師
●行銷顧問資料工程師
●現活躍於Spark台灣社群,致力於推廣Spark技術與商業應用整合。

More than four years of experience in data mining of e-Commerce and big data related issue. Deeply enjoy the learning aspects of sharing my personal experience with technologies in the Big Data world.
1. 認識 Spark SQL
5 小節
video common icon

Introduction to SparkSQL

video common icon

Initialize SparkSQL with SQLContext

quiz common icon

Start SparkSQL

video common icon

From SchemaRDD to DataFrame

video common icon

Phases of Query Planning

2. Spark SQL 支援的資料來源
2 小節
video common icon

Data sources

quiz common icon

Data sources API

3. 資料匯入與匯出
8 小節
video common icon

Input - connected with local system

試看
video common icon

Input - connected with HDFS

03:34
video common icon

Input - connected with Hive

video common icon

Output

video common icon

Dataframe

video common icon

Dataframe operations(1)

video common icon

Dataframe operations(2)

quiz common icon

Dataframe operations examples

4. UDF(User Defined Functions)的使用
1 小節
video common icon

Create your first user defined functions

5. 效能調校 (Performance Tuning)
2 小節
video common icon

Performance tuning in SparkSQL

quiz common icon

Performance options

6. 注意事項 (Tips)
2 小節
video common icon

Tips

video common icon

Review of SparkSQL

學習附件

file-icon
SparkSQL_code.zip
8.92 KB
stage arrow to bottom
file-icon
README.zip
6.86 KB
stage arrow to bottom

購買此課程後,才能使用留言功能

沒有回應的問題

目前尚無任何討論主題

成為第一個發問的人!在問答中找到學習的捷徑。

關於講師

Erica Li

經歷:
●醫院臨床試驗統計分析師
●電子商務資料採礦分析師
●行銷顧問資料工程師
●現活躍於Spark台灣社群,致力於推廣Spark技術與商業應用整合。

More than four years of experience in data mining of e-Commerce and big data related issue. Deeply enjoy the learning aspects of sharing my personal experience with technologies in the Big Data world.
立即加入成為Line官方好友
become line friend
返回主選單
課程類型
影音課程
直播課程
實體課程
返回主選單
返回主選單
返回主選單
返回主選單