NT$1,580
最新討論
課程資訊
適合對象
建議具備 Python 等相關基礎知識又同時擁有以下身份的你
- 需要從事文字探勘研究的學生與研究人員
- 從事資料分析相關領域,想精進文字探勘技術的工作者
- 對於文字探勘技術有興趣
你可以學到
關聯分析常被拿來做文件分類,甚至於論文抄襲依據的一種技術,以上這些技術往往都是以詞彙向量化加上深度學習分類器為基礎,而意見分析,則是電商自動化客群意見反饋整理,最有效的方法;事件偵測則是在群媒體上面做文章和詞性分類,找出已經或可能會發生的事情,做到防範未然或者及時反應。
學會文字探勘,讓資料與數據的能見度提高
利用各種文本分析技術像是自然語言處理、機器學習、深度學習......等 ,針對文字類型資料進行分析,讓你有如掌握一本精選工具書,藉由其中的幾項觀念與技術,體驗到文字探勘與自然語言處理(NLP)的奧妙。在大數據時代中,這些繁雜的文字資料猶如滔天巨浪將人吞噬,甚至覺得浪費許多時間在處理這些資料,面對以下的問題,你是否也感到相當頭痛?
遇到大量資料卻抓不到真正的重點 資料來源太混亂,不知道該如何處理
統整出資訊,卻不知道該如何應用 數據繁雜,無法簡單地傳達資訊
滿滿的文字類型資料
課程介紹
踏上「文字探勘與自然語言處理」旅程前的貼心小提醒
對於想要學會「文字探勘與自然語言處理」的你,緯育 TibaMe 在此提供一個貼心小建議:學習前建議至少具備「Python 撰寫能力」、「機器學習基礎觀念」兩項先備知識,可以幫助你更容易學習
免費試閱搶先看
學習前基本能力
- 需具備 Python 程式基礎能力,包含:變數宣告、基本型別特性(int, str, float, boolean, list, dict)、迴圈及流程控制、函數(方法)定義、物件導向概念,知道物件(類別)的特性、例外處理
- 具備基礎終端機指令概念、網路爬蟲的相關知識、機器學習與深度學習的基礎概念
上述的先備知識與能力都還不太會怎麼辦?
建議可針對自己的需求來選擇適合的課程,以下三門基礎課程供你參考
學習前準備
學習用的筆電或桌電、電腦和穩定網路
學習環境建置
- 可以下載並安裝 Anaconda,包括 Python 3 和 Jupyter,在自己環境內編譯執行,需考量自身電腦是否有足夠 GPU / TPU 運算能力。
- 課程中會使用到 Google Colab,需有 Google Account 與 Google Drive。
瞭解更多機器學習的資訊
緯育 TibaMe 精選部落格文章【AI60問】帶你探索更多機器學習的新知 https://blog.tibame.com/?cat=1196
學習時遇到挫折好焦慮啊,可是又不敢發問嗎?
免煩惱!在緯育 TibaMe 的「課程討論區」歡迎提問,不用擔心自己是否會問錯問題,只要你是認真學習且積極發問的態度,獲取的知識都是屬於你自己的寶藏哦,而且還能幫助討論區的其他同學一起互相觀摩、學習,共同提升學習成效,一舉多得!
還有其他對於 緯育 TibaMe 的問題?
歡迎點選 FAQ ,你將可以得到更多解答哦!
課程資訊
關於講師
李厚均
經歷|
▹ TibaMe AI/Big Data 資料分析師養成班 Python 課程專業講師
▹ 臺積電、中華電信、富邦銀行、新思科技等知名企業擔任內訓 AI 講師與顧問
▹ 受邀超過 30 個以上單位擔任講師進行演講及授課
▹ 四零四科技 AI Lab 工程師
▹ 國立臺灣大學電子所碩士畢業
專長|
▹ 人工智慧及資料分析
▹ 擅長影像辨識
▹ 金融數據分析
自然語言處理概論
NLP 的應用
NLP 開源程式碼介紹
安裝環境建置
實作練習:環境操作示範
語法分析
語意分析
語法與語意技巧
實作練習(上):語法與語意技巧
實作練習(下):語法與語意技巧
文字探勘的流程
文字探勘模型介紹
文字探勘的模型範例
實作練習:文字探勘模型應用
文字探勘中的分詞技術
常見分詞套件介紹
分詞與建立詞庫
實作練習:分詞與建立詞庫
網站概念與網頁結構
新聞網站分析
新聞爬蟲
實作練習:新聞爬蟲
觀察與檢視來源資料
資料擷取與資料清洗
繪製文字雲
實作練習:新聞文字雲
CoLab 架構介紹
Colab 基礎使用
Colab 上傳檔案
實作練習:Colab 應用
何謂 WordNet
WordNet 初體驗
實作練習:WordNet 應用
中文 WordNet 介紹
字詞拆分(tokenize)與 N-gram 模型
詞性標註語詞義分析介紹
字詞拆分與詞性標註
實作練習:字詞拆分與詞性標註
Gensim 介紹
Gensim 訓練詞向量
Gensim 進行文字類推
實作練習:Gensim 應用
SpaCy 介紹
安裝 SpaCy
利用 SpaCy 進行 NLP 處理
實作練習:SpaCy 應用
利用 NN 處理 NLP
類神經網路演算法
使用 NN 處理 NLP
實作練習:垃圾郵件分類
詞意與詞庫
分布假說
詞向量空間
Word2Vec 介紹
使用 Word2vec 建立模型
使用 Word2vec 理解內容
實作練習:Word2Vec 應用
RNN 介紹
在自然語言處理 Lab 中執行 RNN 範例
實作練習:使用 RNN 實作簡易文本分類
梯度爆炸與梯度消失
LSTM 介紹
在自然語言處理 Lab 中執行 LSTM 範例
討論與改良 LSTM
實作練習:使用 LSTM 實作 IMDB 文本分類
Seq2Seq 介紹
在自然語言處理 Lab 中執行 Seq2Seq 範例
Seq2Seq 的優缺點
實作練習:Seq2Seq 模型應用
Attention 介紹
在自然語言處理 Lab 中執行 Attention 範例
Attention 小結
實作練習:Attention 應用
BERT 介紹
在自然語言處理 Lab 中執行 BERT 簡單範例
BERT 應用說明
實作練習:BERT 應用
GPT-2 介紹
在自然語言處理 Lab 中執行 GPT-2 簡單範例
實作練習:使用 GPT-2 產生文章
學習附件
購買此課程後,才能使用留言功能
目前尚無任何討論主題
成為第一個發問的人!在問答中找到學習的捷徑。關於講師
李厚均
經歷|
▹ TibaMe AI/Big Data 資料分析師養成班 Python 課程專業講師
▹ 臺積電、中華電信、富邦銀行、新思科技等知名企業擔任內訓 AI 講師與顧問
▹ 受邀超過 30 個以上單位擔任講師進行演講及授課
▹ 四零四科技 AI Lab 工程師
▹ 國立臺灣大學電子所碩士畢業
專長|
▹ 人工智慧及資料分析
▹ 擅長影像辨識
▹ 金融數據分析