中心公告

工作坊 2021/11/25
2021大數據工作坊:理論與實作結合,參與者滿載而歸

台灣政經傳播研究中心(Taiwan Institute for Governance and Communication Research, TIGCR)於11月19日星期五早上9:30二度辦理「大數據工作坊」,報名人數倍增,講師和與學員互動氣氛熱絡。課程第一部分由本中心博士後研究員洪國智博士講授「應用大數據分析於政治科學研究」,介紹人工智慧與大數據概論,並以TIGCR相關研究為案例。洪博士提到,因為現代儲存成本愈來愈低、網際網路基礎建設增加,上網設備愈來愈多元,各個領域都開始重視大數據的資料蒐集與分析。在案例部分,主要是以文字探勘技術為核心,說明「TIGCR YouTube 政論節目留言資料詞頻分析及建立藍綠政黨情感傾向辭典」和「應用社群媒體資料與情感分析於選舉結果預測」兩個案例,帶領大家深入了解實際的研究方法與成果。

圖左:講師洪國智博士講授課程。(照片來源:台灣政經傳播研究中心)

洪博士在分享尾聲表示,以政治領域來說,語料庫很缺乏,研究者往往需要自己建立研究方法並建立資料的標記。雖然這次的課程簡單介紹「藍綠極性」、「選舉研究」之案例,但是大數據與政治相關研究並不僅限於此領域,並鼓勵學員發展自己有興趣的研究題目。

介紹TIGCR YouTube與Facebook爬蟲專案,讓學員能自行蒐集有興趣的研究資料

第二部分課程,由講師劉家銘向學員講授「TIGCR 新版YouTube爬蟲程式專案介紹與應用」。本專案與去年的成果相比進行了一次改版。架構上可藉由YouTube頻道的「播放清單ID」獲得相關影片資料,再透過「影片ID」獲得任一個影片的所有留言資料,藉此取得單一YouTube頻道所有影片的基本資料與影片留言資料。針對實作部分,劉家銘表示在運用爬蟲程式時必須清楚取得資料的結構,並且用自身的需求及專業能力去解讀分析,以此鼓勵與會學員將個人專長與爬蟲結合應用。

圖左:講師劉家銘指導學員軟體操作。(照片來源:台灣政經傳播研究中心)

第三部分課程,由講師范姜峻浩講授「TIGCR Facebook爬蟲程式專案介紹與應用」。除講述程式架構外,在實作教學部分,以蔡英文、柯文哲粉專為範例,讓學員透過爬蟲取得貼文資料。講師范姜峻浩並介紹幾個應用上的案例,例如可以幫助粉專找出最佳的發文時間等。另外,由於FB目前針對爬蟲程式有座許多限制(如對流量上的控制),故時間點過久的貼文資料可能無法順利透過爬蟲取得。因此建議與會者在進行研究時,應盡快確認要爬蒐的對象,定期蒐集資料。

圖左:講師范姜峻浩向學員講解爬蟲程序。(照片來源:台灣政經傳播研究中心)


與會者大合照。(照片來源:台灣政經傳播研究中心)

2021大數據工作坊學員積極提問,與講師應答熱絡。與會者對本次工作坊內容安排表示受益良多。

工作坊影片請點擊連結:https://youtu.be/_6wU_fYgOqk

研討會 2021/09/11
「2021調查研究方法與應用」學術研討會圓滿落幕

本中心與中央研究院調查研究專題中心,在9月2-3日合辦「2021 調查研究方法與應用」學術研討會。本次研討會有鑑於時代發展與社會結構轉變,衍伸出許多新興的應對資料蒐集方法。以「調查方法的挑戰與新興議題」為主題,特別邀請相關領域的重量級學者德國University of Munich Dr. Frauke Kreuter,以視訊連線方式進行專題演講,講題為「Combining Data from Multiple Sources: Examples from Economic and Public Health Research Studies」,其內容聚焦於資料蒐集方法的近期發展與未來趨勢,精彩的演講獲得與會者熱烈迴響。

研討會開場,由中央研究院人文社會科研究中心蕭高彥主任、中央研究院政治學研究所吳重禮所長,以及中央研究院社會學研究所陳志柔所長開幕致詞,表示因應防疫採線上會議,吸引超過600位專家學者、各大專院校師生踴躍報名。為期兩天的研討會依論文主題,規劃為九個場次,邀集從事調查方法研究、意見探勘與情感研究以及資料蒐集方法研究的相關專家學者與會發表。


9月3日論壇:新冠疫情下的調查因應策略視訊會議圖

2019年底開始,全球新冠疫情持續蔓延,使諸多國家的面訪調查計畫面臨嚴峻的挑戰。為此,本次研討會特別規劃一場「新冠疫情下的調查因應策略」論壇,邀請到 World Association for Public Opinion Research (WAPOR) Asia President Dr. Yashwant Deshmukh、Australian National University Dr. Jill Sheppard、中國人民大學社會與人口學院王衛東教授,以及本中心黃紀主任。在論壇上,黃紀主任帶來的主講題目為「Conducting Survey during the COVID-19 Pandemic: Experience of TIGCR-PPS 2021」。4位學者聚焦分享在後疫情時代,執行調查研究的應對策略與實務經驗。本場論壇內容豐富,線上問答熱烈,與會者表示獲益良多。

中心副主任張卿卿教授為會議閉幕致詞

最後,由本中心副主任張卿卿教授為會議閉幕致詞,首先感謝主辦單位中央研究院調查研究專題中心團隊,以及本中心成員俞振華教授籌備本次研討會。研討會平均每個場次皆超過200位線上聽眾熱情參與,並期許與會者透過學術交流碰撞出智慧火花。本次研討會於110年9月3日順利圓滿結束。

工作坊 2021/05/05
應用TIGCR釋出研究資料 進行實務工作坊:Panel Data Analysis

本中於4月28日周三下午1點半,以線上教學的方式舉行【2021 TIGCR 調查資料分析實務工作坊:Panel Data Analysis】。本次工作坊由國立政治大學政治學系蔡宗漢教授、國立臺北大學公共行政暨政策學系蔡奇霖助理教授主講,使用TIGCR在2018-2019年釋出的一般民眾定群追蹤調查資料(TIGCR-PPS 2018)(TIGCR-PPS 2019)、文官定群追蹤網調資料(TIGCR-TGBS 2018)(TIGCR-TGBS 2019),分析台灣民眾、政府文官的立場等重要研究議題。

首先,由國立政治大學政治學系蔡宗漢教授分享Panel Data的資料分析方法。蔡教授說明追蹤資料除了可以得到不同受訪者之間的差異比較,還可以得到同一位受訪者在不同時間點對同一個議題在想法上的改變。因此,相較於單一波次的調查資料,追蹤資料可以得到更多的觀察值。另外,在分析模型使用上,解說兩種變異值,一種是不同人的差異,稱為組間效果(Between Effect);另一種則是相同受訪者在不同時間的差異,稱為組內效果 (Within Effect)。於此,蔡教授使用隨機效果模型(Random Effects Models)來分析TIGCR 2018、2019年的追蹤資料,納入分析的自變項包括對台灣整體經濟評估、對蔡英文總統在兩岸關係相關施政上的評價、對蔡英文總統整體施政的評價、政黨傾向等,檢視這些變項對台灣人民統獨立場變化的解釋效果。


圖1. Random Effect Model分析各項變項對台灣人民統獨立場之影響
(照片提供:台灣政經傳播研究中心)

分析結果顯示,對台灣整體經濟的評估有解釋效果。相對於經濟評估低者,經濟評估較高者較偏向台灣獨立,在此同時,對於台灣經濟評估越表樂觀者越可能偏向獨立。對蔡英文總統總體施政滿意度方面,對蔡英文總統施政表現越表肯定者越可能偏向獨立,但組間效果顯示肯定施政表現者相對地會較可能偏向支持統一。會發生這樣的差異,源於模型的估計值出現了一正一負的狀態。另外,對蔡英文總統在兩岸關係施政狀況的評價也有解釋效果。具體而言,越肯定蔡英文總統在兩岸關係上的作為者越可能偏向獨立,在此同時, 相對於不認同蔡總統在兩岸關係上的作為者,予以肯定者較可能偏向獨立。

課程最後,蔡教授表示區分組內效果與組間效果的變異值,可以有更多彈性空間來進行資料分析,而不受到分析模型的條件侷限。

接著,由國立臺北大學公共行政暨政策學系蔡奇霖助理教授帶領聽眾們探討如何在線性多層次模型和結構方程式模型的架構下進行定群追蹤調查的資料分析。

圖2. 主題二內容介紹 (照片提供:台灣政經傳播研究中心)

 

此次內容聚焦在定群追蹤資料分析(Panel Data Analysis)的兩個常見統計方法:固定效果模型與隨機效果模型。蔡教授使用TIGCR的調查資料實際進行統計軟體的演釋,讓內容變得更具體。(TIGCR於2018至2019年對民眾的訪問調查資料)

定群追蹤資料分析具有定群與追蹤的兩項特徵,也就是對同一群受訪者在不同的時間點重複進行訪問。因此定群追蹤資料不僅具有橫斷面單一時間資料的優點,同時也兼具縱貫面時間序列資料的優點,也因為資料具有時間這個面向,所以定群追蹤資料可以用來做趨勢的分析,也可以用來做受訪者對過去與現在觀點之對照。


圖3. 固定效果模型與隨機效果模型之比對(照片提供:台灣政經傳播研究中心)

固定效果模型與隨機效果模型都有運用定群追蹤資料的優勢,讓迴歸截距項(Linear Regression)可以因人而異,但是兩個模型估計截距的方式不同。粗略來說,固定效果模型將各個截距項視為未知但固定的參數去估計;隨機效果模型則是將截距項視為潛在的隨機變項。但最關鍵的不同點還是:固定效果模型會將因人而異卻不因為時間而異的個人特質從資料中排除,譬如省籍,每個受訪者的省籍不同,且省籍並不會因時間改變;而隨機效果模型則克服了這點,可以分析像省籍這種因人而異卻不因時間而異的自變項。

另外,蔡教授帶領聽眾了解各種模型的演釋,從中作出總結:定群追蹤資料的調查可以在多層次模型和結構方程式的架構下來進行更有彈性的分析。但教授也提醒大家,隨著方法變得更有彈性,研究者本身也有義務讓自己的統計模型與研究問題與理論更為貼近,而不是隨意設定或是濫用。因為過度複雜的模型容易失去意義或是遇到模型無法辨識和數值演算不穩定的問題。

此次工作坊透過蔡宗漢教授以及蔡奇霖助理教授的分享,讓參與學員透過工作坊影片,認識如何運用定群追蹤調查資料(TIGCR 資料庫)搭配模型演釋以及分析軟體Stata,來有效地進行數據分析。

工作坊影片請看以下連結:https://youtu.be/713ITz2W1S8