2021~2022上半年衛福部臉書輿情資料收集分析
<要點>
- 民調顯示,受台灣COVID-19新冠疫疫情影響,民眾對政府的不滿度有持續升高的現象。然而觀察衛福部臉書貼文資訊,難以得到一樣的結論。貼文的情感反應或留言主要受相關疫情事件或貼文內容影響;COVID-19確診數的變化與貼文相關情感反應相關性並不高。
- 我們使用詞頻分析,來快速了解不同時間點的貼文、留言關注議題為何、情緒反應為何。例如大部份按「怒」比例高的貼文中,包含「個案」、「境外」、「移入」等詞彙;不過當2021年開放施打新冠疫苗時,出現「接種」、「疫苗」的貼文有較高的按「怒」比例;我們亦透過中文情感詞彙本體來了解留言中在不同時間點的情緒面向,以及各個情緒類別中較常出現的詞彙。
<前言>
COVID-19新冠疫情自2019年爆發以來,對全球民眾影響甚鉅,防疫政策的推動也影響民眾對執政者的滿意度。以台灣的情況來說,在疫情爆發初期,由於嚴格管控的防疫追蹤隔離,疫情並沒有大規模爆發。根據TIGCR多年期研究規劃中的2020年民眾定群追蹤面訪調查,民眾當年對蔡英文政府處理新冠疫情的滿意度[1]達到94.6%。不過,在2021年中後,隨著社區傳播案例增加[2]等原因,我們發現民眾對政府滿意度下降,不滿意度提高。在2021年TIGCR民眾定群追蹤網路調查中,民眾對政府在五月新冠肺炎疫情爆發後的整體表現,感到不滿意的比例達到了30.4%。且在這次調查中,有參與2020年面訪調查並滿意政府表現的受訪者中,有28.6%在這次回答轉為不滿意。
進入2022年,新冠疫情出現變種病毒Omicron案例。由於現有疫苗保護力有限,台灣的新冠確診人數在2022年四月中後開始暴增(圖1)。根據2022年六月TVBS民意調查中心所公布的《蔡英文連任2周年滿意度民調》,蔡英文的滿意度跌破4成,為連任以來的低點,不滿意度則近5成;且政府新冠疫情處理滿意度,由2021年的61%,下滑至38%,減少23個百分點。
圖 1:新冠疫情COVID-19國際累計確診數與台灣累計確診數發展圖[3]
<資料分析的目標>
上述各類調查資料中顯示以民調為基礎的政府滿意度變化。與民調相比,TIGCR大數據小組感興趣的是這樣的變化是否也呈現在社群媒體上。根據台灣傳播調查資料庫研究,在疫情期間,民眾減少出門後,有約75%的民眾會在休閒時間使用社群媒體,並有52%會透過社群媒體了解疫情資訊[4]。因此,大數據小組收集分析了2021年至2022六月年衛福部(衛生福利部)臉書粉專的貼文資料與2022年的部分留言資料,設立以下研究目標:(1)從社群媒體內容中,觀察民眾對疫情的不滿反應是否具有趨勢,其趨勢是否與民調類似;(2)民眾在社群媒體上所展現的留言分享數及各種情感反應[5];是否與疫情確診數相關;(3)透過人工檢視貼文與留言內容,以及自動詞頻分析,了解相關民眾對於疫情政策不滿、恐懼等情感反應之主要源由為何。上述目標的主要研究方法,乃透過統計衛福部臉書貼文內容的互動,包含情感反應變化(臉書的表情反應按鈕)、留言數、分享數等進行時間軸分析及對貼文與留言進行詞頻分析等。
<衛福部貼文的情感反應趨勢變化>
針對研究目標的第一、二點,我們主要統計了分析了衛福部貼文的情感反應變化。並繪製不同度量趨勢圖,包含情感反應、留言數、分享數等。由於不同度量之間相差甚大,為方便觀察比較趨勢變化,我們以百分比(每週或每日總計/時間區間內總計)來做計算[6],繪製折線圖做視覺化,相關圖表可在公開的Tableau頁面中檢視[7]。圖2為按「讚」數、按「怒」數、留言數三種統計資訊等資訊之折線圖;在圖2可看出於2021年五到八月、2022年一月初,2022三月中至五月初,民眾在衛福部臉書「讚」「怒」留言比例較高。不過整體而言,這三個度量的變化趨勢類似,顯示民眾可能是因不同疫情事件或特定貼文(例如資料中,留言數最高的貼文是2021年一月8日一篇抽獎貼文)才會較積極在衛福部粉專表達情感或留言,長期來看,民眾按怒的比例並沒有持續的升高。故我們認為,僅觀察衛福部臉書的情感趨勢變化或其他統計資料,難以得到類似於民調的結果,亦即民眾近期因新冠疫情對蔡政府施政不滿意度升高的結論。
<衛福部貼文的情感反應趨勢變化與新增確診人數比較>
圖2中亦結合貼文統計資訊與新冠每日新增確診數,以雙Y軸來呈現。由於2022年四月中台灣Omicron案例爆發,從圖2我們可推測隨疫情升溫,民眾更關心疫情,按「怒」或「讚」數在有增加的情況。我們將2022年部分情感反應百分比擷取出來製作成圖3,並改以每日統計來呈現。由圖3可發現雖然隨疫情升溫,民眾按「怒」、「難過」比例略提高,但主要的情感反應集中在數個貼文上;如5/7及5/15兩則貼文按怒比例極高,而在1/22與3/27的貼文有極高的按「難過(嗚)」數比例。
圖 2:衛福部粉專2021至2022年六月每周新增確診人數和按讚、怒反應數與留言數(百分比)趨勢圖
圖 3:衛福部粉專2022年一至六月每日新增確診人數和按讚、怒情感反應數(百分比)趨勢圖
若以2022年的貼文資料,以每日為單位與確診人數進行相關係數分析;其相關係數熱圖如圖4;結果顯示新增確診數與臉書互動統計數之相關係數並不高。故雖然2020年Omicorn疫情爆發,民眾有較多擔心及不滿情緒,並表達於衛福部粉專,但長期而言這些情感反應等統計資訊與確診數相關性不大。不過有趣的是,從相關係數來看,留言數和情感反應總計、分享數、按讚數、按加油數相關係數相當高(0.84、0.74、0.76、0.76),情感反應總計與按讚、加油數的相關係數高達0.97和0.73;由此可推估在衛福部的貼文中,高留言數的貼文亦常有高情感反應、高分享數、按讚數高、加油數高的結果。可見在疫情期間,民眾多數仍願意支持並分享衛福部公布的相關資訊。
圖 4:每日新增確診人數與衛福部臉書粉專貼文統計相關係數熱圖
<民怨擔心從何來?>
我們進一步檢視前述所提按怒或嗚數比例較高的的貼文內容與相關反應。5/7的衛福部貼文[8],民眾按怒的數量(1667個怒)跟怒的比例(32%)都是最高的。該貼文說明5/8後的政策轉向,包含取消隔離者的電子圍籬、密切接觸只限於親友,且職場與學校由單位自主應變。由於此貼文實質上宣告防疫政策從細微的治理轉變為共存模式,許多民眾無法接受這樣的政策,將不滿透過臉書反應。而5/15的衛福部貼文[9],按怒數量為第二高(761個怒)。其內容是每日的疫情案例統整匯報,當天的確診數字與死亡數字並無特別極端,但由於當時才剛發生基隆市2歲男童因染疫去世的事件。從留言中,能看出民眾以這件事為出發點,發洩不滿,並質疑共存政策是否正確。另外按「嗚」比例最高的貼文出現在1/22與3/27。該兩則貼文皆為本土案例暴增(約前一日四倍),民眾感到憂心。由此可見,如前所述,民眾情感反應的變化,主要仍是受不同貼文內容或相關疫情事件所影響。
<衛福部貼文詞頻分析>
除了人工檢視某些高情感反應的貼文資訊,我們亦可透過詞頻分析,較快速的了解「疫情民怨」問題來源。我們使用所蒐集的貼文資訊,統整出30篇按怒比例高的貼文,再使用TF-IDF[10]對留言內容做詞頻分析。我們列出排名前九高的關鍵詞並製作詞彙分布圖(圖5)。由圖可看出「個案」、「防疫」、「境外」、「移入」、「病例」等關鍵詞出現在多篇貼文中。這些貼文主要是衛福部每日的疫情彙整。另外,由於此分布圖的詞頻乃依時間點排序,從圖中我們亦發現從2021年六月後的貼文有較多提及「接種」、「疫苗」且在2021年六到十月居多,可推測當時針對預約施打疫苗的相關措施有不少民怨。
圖 5:2021年至2022年六月的衛福部貼文中,憤怒比例最高的30則貼文留言TF-IDF詞彙分布圖
<留言情感詞頻分析>
除透過臉書原有的按鈕觀察使用者情感反應的互動情況,我們希望對留言內容做情感詞詞頻分析。這部分我們為分析出更多不同的情感反應,使用了大連理工大學情感詞彙本體;其詞彙共分為「樂好怒哀懼惡驚」七類詞。但由於有些中國用詞並不適用於衛福部的貼文留言文本,以及有些詞在文本中並不含有正面情感(如:高端、健康、第一線、專家、宣導、大型等),或在文本中多為連接詞(如:才能)。故我們移除不適用的詞語,並修改或新增較幾個適用於衛福部貼文留言文本的情感詞語(如「假消息」、「只會」、「幹」、「蛆」、「綠共」。辭典原有27466字,目前修改後為27294字)。
由於收集留言與計算詞頻需求比較高的電腦資源。在初步的研究工作中,我們以2022年一月到五月每周的貼文留言中位數,隨機選取每周貼文較高的兩則及較低的兩則貼文留言,共15676則留言進行情感詞詞頻分析,透過此分析可了解不同時間點民眾留言的內容及未表露在臉書情感反應的情感分布趨勢。目前研究發現,主要的留言關鍵詞類別為「好(尊敬、讚揚、相信等)」、「惡(煩悶、憎惡、貶責等)」兩類為主。這是由於,大連理工大學情感詞彙本體各類詞彙數量不一所致。部分類別如「怒」、「驚」兩類的詞彙原本就較少(1.38%與0.81%),故詞頻分析出來的結果也較少。雖然詞頻分布受原有詞彙比例影響,但若觀察詞頻在不同時間點的變化,可發現四月疫情爆發後,留言中的負面情緒詞頻較以往高出許多(圖6)。表1列出在詞頻分析中,主要情感分類關鍵詞出現的比例以及前五名的關鍵詞。從表中可見我們新增的詞彙例如「只會(惡)」、「幹(惡)」有極高的詞頻。
圖 6:2022年一至五月衛福部貼文部分留言詞頻分析
表 1 使用情感詞彙本體對衛福部粉專留言進行七類詞頻分析[11]
類別 | 樂 | 好 | 怒 | 哀 | 懼 | 惡 | 驚 |
詞彙比例 | 10.65% | 39.40% | 1.45% | 5.47% | 8.76% | 33.44% | 0.84% |
前五關鍵詞 |
安全 平安 快樂 新年 哈哈 |
辛苦 加油 謝謝 希望 感謝 |
爆發 假消息 抗議 活該 羞辱 |
住院 不足 傷害 災難 傷亡 |
感染 病例 恐慌 小心 厲害 |
不是 嚴重 幹 擔心 只會 |
原來 奇怪 好奇 驚人 低估 |
<小結>
在本文中,我們透過收集衛福部臉書相關貼文內容的互動及留言內容,進行統計分析及詞頻分析。初步的研究成果如下:
- 根據民調顯示,受台灣COVID-19新冠肺炎疫情升溫影響,民眾對政府的不滿意度有持續升高的現象。然而觀察衛福部貼文情感反應的相關趨勢發現,民眾情感反應主要受相關疫情事件或貼文內容影響;例如政策轉向為共存模式、染疫者病逝等。僅從情感趨勢變化難以得到跟民調一樣的結論,且貼文情感趨勢變化或其他統計資訊(留言數、分享數)與新增確診數長期而言,並無明顯相關。
- 除了人工檢視有強烈情感反應的相關貼文及留言,我們使用詞頻分析,來快速了解這些貼文、留言貼文關注議題為何。例如在按「怒」比例高的貼文中,主要包含「個案」、「防疫」、「境外」、「移入」、「病例」等詞彙,而這些詞彙主要出現於每日疫情彙整,可推測疫情彙整是民眾主要關注的重點貼文。不過當2021年開放施打疫苗時,出現「接種」、「疫苗」的貼文有較高的按「怒」比例,可推測當時針對預約施打疫苗的相關措施有不少民怨。而我們亦透過中文情感詞彙本體來了解留言中在不同時間點的情緒面向,以及各個情緒類別中較常出現的詞彙。
備註:可以至本中心資料庫下載大數據小組研究資料:
[1] 回答為非常滿意及還算滿意者。
[2] 例如2021年4月20日華航諾富特飯店事件、5月15日北巿萬華事件,6月初苗栗科技廠移工群聚。
[3] Source: https://covid19.mohw.gov.tw/ch/sp-timeline0-205.html
[4] https://crctaiwan.dcat.nycu.edu.tw/ResultsShow_detail.asp?RS_ID=150
[5] 共有七類,包含按讚數(like)、怒(angry)、嗚(難過、sorry)、哇(wow)、哈(haha)、加油(support)、大心(love)。
[6] 我們亦嘗試以每日個別情感反應/每日總情感反應的百分比繪圖,然而發現此種計算方式並沒有明顯的趨勢變化,故並未將圖表附於本文中。
[7] https://public.tableau.com/app/profile/.66553993/viz/2022covid-19/week
[8] https://www.facebook.com/mohw.gov.tw/posts/367300045436382
[9] https://www.facebook.com/mohw.gov.tw/posts/373378501495203
[10] TF-IDF是一種詞頻統計方法,用以評估一字詞對於一個檔案集或一個語料庫中的其中一份檔案的重要程度。字詞的重要性隨著它在檔案中出現的次數成正比增加,但同時會隨著它在語料庫中出現的頻率成反比下降。
[11] 此表僅依據主要情感分類統計,未統計輔助情感分類。