本中於4月28日周三下午1點半,以線上教學的方式舉行【2021 TIGCR 調查資料分析實務工作坊:Panel Data Analysis】。本次工作坊由國立政治大學政治學系蔡宗漢教授、國立臺北大學公共行政暨政策學系蔡奇霖助理教授主講,使用TIGCR在2018-2019年釋出的一般民眾定群追蹤調查資料(TIGCR-PPS 2018)(TIGCR-PPS 2019)、文官定群追蹤網調資料(TIGCR-TGBS 2018)(TIGCR-TGBS 2019),分析台灣民眾、政府文官的立場等重要研究議題。
首先,由國立政治大學政治學系蔡宗漢教授分享Panel Data的資料分析方法。蔡教授說明追蹤資料除了可以得到不同受訪者之間的差異比較,還可以得到同一位受訪者在不同時間點對同一個議題在想法上的改變。因此,相較於單一波次的調查資料,追蹤資料可以得到更多的觀察值。另外,在分析模型使用上,解說兩種變異值,一種是不同人的差異,稱為組間效果(Between Effect);另一種則是相同受訪者在不同時間的差異,稱為組內效果 (Within Effect)。於此,蔡教授使用隨機效果模型(Random Effects Models)來分析TIGCR 2018、2019年的追蹤資料,納入分析的自變項包括對台灣整體經濟評估、對蔡英文總統在兩岸關係相關施政上的評價、對蔡英文總統整體施政的評價、政黨傾向等,檢視這些變項對台灣人民統獨立場變化的解釋效果。
圖1. Random Effect Model分析各項變項對台灣人民統獨立場之影響
(照片提供:台灣政經傳播研究中心)
分析結果顯示,對台灣整體經濟的評估有解釋效果。相對於經濟評估低者,經濟評估較高者較偏向台灣獨立,在此同時,對於台灣經濟評估越表樂觀者越可能偏向獨立。對蔡英文總統總體施政滿意度方面,對蔡英文總統施政表現越表肯定者越可能偏向獨立,但組間效果顯示肯定施政表現者相對地會較可能偏向支持統一。會發生這樣的差異,源於模型的估計值出現了一正一負的狀態。另外,對蔡英文總統在兩岸關係施政狀況的評價也有解釋效果。具體而言,越肯定蔡英文總統在兩岸關係上的作為者越可能偏向獨立,在此同時, 相對於不認同蔡總統在兩岸關係上的作為者,予以肯定者較可能偏向獨立。
課程最後,蔡教授表示區分組內效果與組間效果的變異值,可以有更多彈性空間來進行資料分析,而不受到分析模型的條件侷限。
接著,由國立臺北大學公共行政暨政策學系蔡奇霖助理教授帶領聽眾們探討如何在線性多層次模型和結構方程式模型的架構下進行定群追蹤調查的資料分析。
圖2. 主題二內容介紹 (照片提供:台灣政經傳播研究中心)
此次內容聚焦在定群追蹤資料分析(Panel Data Analysis)的兩個常見統計方法:固定效果模型與隨機效果模型。蔡教授使用TIGCR的調查資料實際進行統計軟體的演釋,讓內容變得更具體。(TIGCR於2018至2019年對民眾的訪問調查資料)
定群追蹤資料分析具有定群與追蹤的兩項特徵,也就是對同一群受訪者在不同的時間點重複進行訪問。因此定群追蹤資料不僅具有橫斷面單一時間資料的優點,同時也兼具縱貫面時間序列資料的優點,也因為資料具有時間這個面向,所以定群追蹤資料可以用來做趨勢的分析,也可以用來做受訪者對過去與現在觀點之對照。
圖3. 固定效果模型與隨機效果模型之比對(照片提供:台灣政經傳播研究中心)
固定效果模型與隨機效果模型都有運用定群追蹤資料的優勢,讓迴歸截距項(Linear Regression)可以因人而異,但是兩個模型估計截距的方式不同。粗略來說,固定效果模型將各個截距項視為未知但固定的參數去估計;隨機效果模型則是將截距項視為潛在的隨機變項。但最關鍵的不同點還是:固定效果模型會將因人而異卻不因為時間而異的個人特質從資料中排除,譬如省籍,每個受訪者的省籍不同,且省籍並不會因時間改變;而隨機效果模型則克服了這點,可以分析像省籍這種因人而異卻不因時間而異的自變項。
另外,蔡教授帶領聽眾了解各種模型的演釋,從中作出總結:定群追蹤資料的調查可以在多層次模型和結構方程式的架構下來進行更有彈性的分析。但教授也提醒大家,隨著方法變得更有彈性,研究者本身也有義務讓自己的統計模型與研究問題與理論更為貼近,而不是隨意設定或是濫用。因為過度複雜的模型容易失去意義或是遇到模型無法辨識和數值演算不穩定的問題。
此次工作坊透過蔡宗漢教授以及蔡奇霖助理教授的分享,讓參與學員透過工作坊影片,認識如何運用定群追蹤調查資料(TIGCR 資料庫)搭配模型演釋以及分析軟體Stata,來有效地進行數據分析。
工作坊影片請看以下連結:https://youtu.be/713ITz2W1S8