台灣政經傳播研究中心(Taiwan Institute for Governance and Communication Research, TIGCR)於11月19日星期五早上9:30二度辦理「大數據工作坊」,報名人數倍增,講師和與學員互動氣氛熱絡。課程第一部分由本中心博士後研究員洪國智博士講授「應用大數據分析於政治科學研究」,介紹人工智慧與大數據概論,並以TIGCR相關研究為案例。洪博士提到,因為現代儲存成本愈來愈低、網際網路基礎建設增加,上網設備愈來愈多元,各個領域都開始重視大數據的資料蒐集與分析。在案例部分,主要是以文字探勘技術為核心,說明「TIGCR YouTube 政論節目留言資料詞頻分析及建立藍綠政黨情感傾向辭典」和「應用社群媒體資料與情感分析於選舉結果預測」兩個案例,帶領大家深入了解實際的研究方法與成果。
圖左:講師洪國智博士講授課程。(照片來源:台灣政經傳播研究中心)
洪博士在分享尾聲表示,以政治領域來說,語料庫很缺乏,研究者往往需要自己建立研究方法並建立資料的標記。雖然這次的課程簡單介紹「藍綠極性」、「選舉研究」之案例,但是大數據與政治相關研究並不僅限於此領域,並鼓勵學員發展自己有興趣的研究題目。
介紹TIGCR YouTube與Facebook爬蟲專案,讓學員能自行蒐集有興趣的研究資料
第二部分課程,由講師劉家銘向學員講授「TIGCR 新版YouTube爬蟲程式專案介紹與應用」。本專案與去年的成果相比進行了一次改版。架構上可藉由YouTube頻道的「播放清單ID」獲得相關影片資料,再透過「影片ID」獲得任一個影片的所有留言資料,藉此取得單一YouTube頻道所有影片的基本資料與影片留言資料。針對實作部分,劉家銘表示在運用爬蟲程式時必須清楚取得資料的結構,並且用自身的需求及專業能力去解讀分析,以此鼓勵與會學員將個人專長與爬蟲結合應用。
圖左:講師劉家銘指導學員軟體操作。(照片來源:台灣政經傳播研究中心)
第三部分課程,由講師范姜峻浩講授「TIGCR Facebook爬蟲程式專案介紹與應用」。除講述程式架構外,在實作教學部分,以蔡英文、柯文哲粉專為範例,讓學員透過爬蟲取得貼文資料。講師范姜峻浩並介紹幾個應用上的案例,例如可以幫助粉專找出最佳的發文時間等。另外,由於FB目前針對爬蟲程式有座許多限制(如對流量上的控制),故時間點過久的貼文資料可能無法順利透過爬蟲取得。因此建議與會者在進行研究時,應盡快確認要爬蒐的對象,定期蒐集資料。
圖左:講師范姜峻浩向學員講解爬蟲程序。(照片來源:台灣政經傳播研究中心)
與會者大合照。(照片來源:台灣政經傳播研究中心)
2021大數據工作坊學員積極提問,與講師應答熱絡。與會者對本次工作坊內容安排表示受益良多。
工作坊影片請點擊連結:https://youtu.be/_6wU_fYgOqk