TibaMe
系統初始化失敗,請重新整理頁面
若持續無法載入頁面,請 聯絡客服

李厚均

成為 AI 科學家|用文字探勘與自然語言處理萃取文字數據精華,逐步成為數據統整大師

NT$1,580
人工智慧技術應用

此門線上課程,將從環境建置與安裝開始,帶你認識「文字探勘與自然語言處理(NLP)」的基本概念與應用,並利用多個實作練習,舉例像是:「文字雲應用」、「字詞拆分」、「垃圾郵件分類」等等,幫助你累積大量經驗值!

NT$1,580

目前尚無任何課程公告
講師將會在這發佈與課程相關的公告或是通知課程內容更新的公告。

最新討論

新聞爬蟲實作資料夾是亂碼
貓斯拉 · 2023/10/01 15:50
14.Word2Vec後兩節一直卡頓
geo · 2023/07/16 20:27
5-4 實作練習:新聞爬蟲、10-4 實作練習:Gensim 應用,此2節播放有多處卡頓,再請修正囉
阿澤 · 2023/04/29 23:55
多篇文章如何變成一個模型
Tim · 2023/04/12 18:39
請問一下什麼是 Chunking?
李秉錡 · 2023/03/05 21:42
查看更多討論

課程資訊

default clock課程時長 3 小時 52 分
default video課程共 20 單元 80 小節
default download21 個可下載的 學習資源
icon_info_certificate提供完訓證書
default plan提供制定 學習計畫建議學習 8 週 (每週 2 小時)

適合對象

  建議具備 Python 等相關基礎知識又同時擁有以下身份的你

  • 需要從事文字探勘研究的學生與研究人員
  • 從事資料分析相關領域,想精進文字探勘技術的工作者
  • 對於文字探勘技術有興趣

你可以學到

  文字探勘與自然語言處理(NLP)的常見應用

關聯分析常被拿來做文件分類,甚至於論文抄襲依據的一種技術,以上這些技術往往都是以詞彙向量化加上深度學習分類器為基礎,而意見分析,則是電商自動化客群意見反饋整理,最有效的方法;事件偵測則是在群媒體上面做文章和詞性分類,找出已經或可能會發生的事情,做到防範未然或者及時反應。


 
 學會文字探勘,讓資料與數據的能見度提高

利用各種文本分析技術像是自然語言處理、機器學習、深度學習......等 ,針對文字類型資料進行分析,讓你有如掌握一本精選工具書,藉由其中的幾項觀念與技術,體驗到文字探勘與自然語言處理(NLP)的奧妙。在大數據時代中,這些繁雜的文字資料猶如滔天巨浪將人吞噬,甚至覺得浪費許多時間在處理這些資料,面對以下的問題,你是否也感到相當頭痛?

 遇到大量資料卻抓不到真正的重點     資料來源太混亂,不知道該如何處理        

 統整出資訊,卻不知道該如何應用     數據繁雜,無法簡單地傳達資訊 

 滿滿的文字類型資料 



課程介紹


  踏上「文字探勘與自然語言處理」旅程前的貼心小提醒

對於想要學會「文字探勘與自然語言處理」的你,緯育 TibaMe 在此提供一個貼心小建議:學習前建議至少具備「Python 撰寫能力」、「機器學習基礎觀念」兩項先備知識,可以幫助你更容易學習

   免費試閱搶先看

學習前基本能力

  學習文字探勘之前,需要有什麼先備知識嗎?
  • 需具備 Python 程式基礎能力,包含:變數宣告、基本型別特性(int, str, float, boolean, list, dict)、迴圈及流程控制、函數(方法)定義、物件導向概念,知道物件(類別)的特性、例外處理
  • 具備基礎終端機指令概念、網路爬蟲的相關知識、機器學習與深度學習的基礎概念

  上述的先備知識與能力都還不太會怎麼辦?

建議可針對自己的需求來選擇適合的課程,以下三門基礎課程供你參考

學習前準備

  學習用的筆電或桌電、電腦和穩定網路

  學習環境建置

  • 可以下載並安裝 Anaconda,包括 Python 3 和 Jupyter,在自己環境內編譯執行,需考量自身電腦是否有足夠 GPU / TPU 運算能力。
  • 課程中會使用到 Google Colab,需有 Google Account 與 Google Drive。

  瞭解更多機器學習的資訊

緯育 TibaMe 精選部落格文章【AI60問】帶你探索更多機器學習的新知 https://blog.tibame.com/?cat=1196



  學習時遇到挫折好焦慮啊,可是又不敢發問嗎?

免煩惱!在緯育 TibaMe 的「課程討論區」歡迎提問,不用擔心自己是否會問錯問題,只要你是認真學習且積極發問的態度,獲取的知識都是屬於你自己的寶藏哦,而且還能幫助討論區的其他同學一起互相觀摩、學習,共同提升學習成效,一舉多得!

  還有其他對於 緯育 TibaMe 的問題?

歡迎點選 FAQ ,你將可以得到更多解答哦!

課程資訊

default clock課程時長 3 小時 52 分
default video課程共 20 單元 80 小節
default download21 個可下載的 學習資源
icon_info_certificate提供完訓證書
default plan提供制定 學習計畫建議學習 8 週 (每週 2 小時)

關於講師

李厚均

課程講師:李厚均

經歷|
▹ TibaMe AI/Big Data 資料分析師養成班 Python 課程專業講師
▹ 臺積電、中華電信、富邦銀行、新思科技等知名企業擔任內訓 AI 講師與顧問
▹ 受邀超過 30 個以上單位擔任講師進行演講及授課
▹ 四零四科技 AI Lab 工程師
▹ 國立臺灣大學電子所碩士畢業

專長|
▹ 人工智慧及資料分析
▹ 擅長影像辨識
▹ 金融數據分析
1. 文字探勘基礎理論
5 小節
試看
video common icon

自然語言處理概論

02:52
試看
video common icon

NLP 的應用

01:41
video common icon

NLP 開源程式碼介紹

video common icon

安裝環境建置

video common icon

實作練習:環境操作示範

2. 文字探勘技術
5 小節
video common icon

語法分析

video common icon

語意分析

video common icon

語法與語意技巧

video common icon

實作練習(上):語法與語意技巧

video common icon

實作練習(下):語法與語意技巧

3. 文字探勘模型與應用
4 小節
video common icon

文字探勘的流程

video common icon

文字探勘模型介紹

video common icon

文字探勘的模型範例

video common icon

實作練習:文字探勘模型應用

4. 分詞技術介紹
4 小節
video common icon

文字探勘中的分詞技術

video common icon

常見分詞套件介紹

video common icon

分詞與建立詞庫

video common icon

實作練習:分詞與建立詞庫

5. 網路爬蟲應用
4 小節
video common icon

網站概念與網頁結構

video common icon

新聞網站分析

video common icon

新聞爬蟲

video common icon

實作練習:新聞爬蟲

6. 文字雲應用
4 小節
video common icon

觀察與檢視來源資料

video common icon

資料擷取與資料清洗

video common icon

繪製文字雲

試看
video common icon

實作練習:新聞文字雲

05:16
7. Colab 環境建置介紹
4 小節
video common icon

CoLab 架構介紹

video common icon

Colab 基礎使用

video common icon

Colab 上傳檔案

video common icon

實作練習:Colab 應用

8. WordNet
4 小節
video common icon

何謂 WordNet

video common icon

WordNet 初體驗

video common icon

實作練習:WordNet 應用

video common icon

中文 WordNet 介紹

9. NLP 字詞處理
4 小節
video common icon

字詞拆分(tokenize)與 N-gram 模型

video common icon

詞性標註語詞義分析介紹

video common icon

字詞拆分與詞性標註

video common icon

實作練習:字詞拆分與詞性標註

10. Gensim
4 小節
video common icon

Gensim 介紹

video common icon

Gensim 訓練詞向量

video common icon

Gensim 進行文字類推

video common icon

實作練習:Gensim 應用

11. SpaCy
4 小節
video common icon

SpaCy 介紹

video common icon

安裝 SpaCy

video common icon

利用 SpaCy 進行 NLP 處理

video common icon

實作練習:SpaCy 應用

12. 類神經網路(NN)在 NLP 的應用
4 小節
video common icon

利用 NN 處理 NLP

video common icon

類神經網路演算法

video common icon

使用 NN 處理 NLP

video common icon

實作練習:垃圾郵件分類

13. 自然語言的分散式表示
3 小節
video common icon

詞意與詞庫

video common icon

分布假說

video common icon

詞向量空間

14. Word2Vec
4 小節
video common icon

Word2Vec 介紹

video common icon

使用 Word2vec 建立模型

video common icon

使用 Word2vec 理解內容

video common icon

實作練習:Word2Vec 應用

15. RNN
4 小節
video common icon

RNN 介紹

video common icon

在自然語言處理 Lab 中執行 RNN 範例

video common icon

實作練習:使用 RNN 實作簡易文本分類

video common icon

梯度爆炸與梯度消失

16. LSTM
4 小節
video common icon

LSTM 介紹

video common icon

在自然語言處理 Lab 中執行 LSTM 範例

video common icon

討論與改良 LSTM

video common icon

實作練習:使用 LSTM 實作 IMDB 文本分類

17. Seq2Seq
4 小節
video common icon

Seq2Seq 介紹

video common icon

在自然語言處理 Lab 中執行 Seq2Seq 範例

video common icon

Seq2Seq 的優缺點

video common icon

實作練習:Seq2Seq 模型應用

18. 認識 Attention
4 小節
video common icon

Attention 介紹

video common icon

在自然語言處理 Lab 中執行 Attention 範例

video common icon

Attention 小結

video common icon

實作練習:Attention 應用

19. BERT
4 小節
video common icon

BERT 介紹

video common icon

在自然語言處理 Lab 中執行 BERT 簡單範例

video common icon

BERT 應用說明

video common icon

實作練習:BERT 應用

20. GPT-2
3 小節
video common icon

GPT-2 介紹

video common icon

在自然語言處理 Lab 中執行 GPT-2 簡單範例

video common icon

實作練習:使用 GPT-2 產生文章

學習附件

file-icon
程式碼範例檔.zip
124.10 MB
stage arrow to bottom
file-icon
Module1_文字探勘基礎理論.pdf
1.71 MB
stage arrow to bottom
file-icon
Module2_文字探勘技術.pdf
604.73 KB
stage arrow to bottom
file-icon
Module3_文字探勘模型與應用.pdf
221.22 KB
stage arrow to bottom
file-icon
Module4_分詞技術介紹.pdf
689.88 KB
stage arrow to bottom
file-icon
Module5_新聞爬蟲實作.pdf
1.95 MB
stage arrow to bottom
file-icon
Module6_新聞文字雲.pdf
759.81 KB
stage arrow to bottom
file-icon
Module7_Colab環境建置介紹.pdf
418.72 KB
stage arrow to bottom
file-icon
Module8_WordNet.pdf
437.46 KB
stage arrow to bottom
file-icon
Module9_NLP字詞處理.pdf
536.71 KB
stage arrow to bottom
file-icon
Module10_Gensim.pdf
318.13 KB
stage arrow to bottom
file-icon
Module11_SpaCy.pdf
915.57 KB
stage arrow to bottom
file-icon
Module12_類神經網路(NN)在NLP的應用.pdf
1.97 MB
stage arrow to bottom
file-icon
Module13_自然語言的分散式表示.pdf
211.49 KB
stage arrow to bottom
file-icon
Module14_Word2Vec.pdf
597.12 KB
stage arrow to bottom
file-icon
Module15_RNN.pdf
554.81 KB
stage arrow to bottom
file-icon
Module16_LSTM.pdf
527.37 KB
stage arrow to bottom
file-icon
Module17_Seq2Seq.pdf
301.02 KB
stage arrow to bottom
file-icon
Module18_Attention實戰.pdf
1.67 MB
stage arrow to bottom
file-icon
Module19_BERT.pdf
555.98 KB
stage arrow to bottom
file-icon
Module20_GPT-2.pdf
487.81 KB
stage arrow to bottom

購買此課程後,才能使用留言功能

沒有回應的問題

目前尚無任何討論主題

成為第一個發問的人!在問答中找到學習的捷徑。

關於講師

李厚均

課程講師:李厚均

經歷|
▹ TibaMe AI/Big Data 資料分析師養成班 Python 課程專業講師
▹ 臺積電、中華電信、富邦銀行、新思科技等知名企業擔任內訓 AI 講師與顧問
▹ 受邀超過 30 個以上單位擔任講師進行演講及授課
▹ 四零四科技 AI Lab 工程師
▹ 國立臺灣大學電子所碩士畢業

專長|
▹ 人工智慧及資料分析
▹ 擅長影像辨識
▹ 金融數據分析
立即加入成為Line官方好友
become line friend
返回主選單
課程類型
影音課程
直播課程
實體課程
返回主選單
返回主選單
返回主選單
返回主選單