AI/Big Data資料分析師養成班學員專題作品
樂泊—即時空房及住宿者評論分析
專題目標
由於目前市場上的訂房網站眾多,本組想解決消費者須於各大訂房網站間來回查詢與挑選理想住宿場所之麻煩,並依據使用者需求,「推薦」該地區當下「即時空房」的住宿地點,並營造出住宿管家氛圍的網站,目標為讓使用者更便利獲得所需住宿相關資訊。
使用技術
→完全自動化
使用MongoDB進行分析資料的儲存,並運用Docker解決環境的問題,將文字探勘的爬蟲程式架設於AWS雲端運算服務EC2上,擷取資料並匯入本地端資料庫,且用crontab定時執行ShellScript腳本,達到完全「自動化」。
→使用者查詢系統
在AWS上架設平台跳板機配置進行管理,最小化應用系統的安全風險,有利於提升整體架構之安全性。此外,運用Django連接MySQL資料庫提供使用者查詢,並呈現在網頁之上。
→住宿適合度推薦
上述所使用文字探勘的爬蟲技術,於各大住房網站、BBS上,擷取飯店住宿資料做為資訊來源。並依據其住客留下的飯店評論進行NLP。將評論有相關性之特徵進行各種監督型或非監督型“機器學習演算法”做分群分類後,取其特徵值做為各地區或是飯店相關標籤進行住宿適合度推薦。
→管家機器人
其中也加入了圖資相關資訊,給予該飯店或是地區之文字雲訊息,使用者可以簡單了解該飯店之相關評論,還提供飯店近期相關新聞做為參考。並貼心架設「管家機器人」進行飯店周邊地點相關推薦,所為宗旨為,讓使用者享受每次的住宿體驗,達到「樂泊」的目的。