數位人文 | 網路爬蟲、分析與視覺化

課程設計:古佳怡老師 fa018@gl.ck.tp.edu.tw


課程簡介:
本課程旨將資訊與人文結合,利用程式,讓學生從零開始,自動化爬取網路資料並進行處理,最後則將處理完的資料做視覺化分析。
本課程架構為,先讓學生觀察目標網頁的結構(e.g.,蘋果即時新聞),再藉由python與套件requestbeatifulsoup撰寫網路爬蟲,爬取特定內容的資料。待爬取完成後,讓學生體驗jiebasnownlp進行斷詞、關鍵字提取、情感分析等文本探勘過程。最後則將探勘結果利用Matplotlib繪製為圖表,讓學生能夠進行觀察與分析。

課程投影片:
網路爬蟲、分析與視覺化
範例程式碼

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *