有了MAXQDA 2020,分析Twitter數據比過去都更快更容易!讓我們用六個簡單的步驟來分析Twitter數據。
什麼是社交媒體分析?
眾所周知,社交媒體在現代社會和學術界發揮著重要作用。但事實上,這個說法還略為含蓄了些。有鑒於社交媒體的重要性、普及度和大數據,現在各領域的研究人員都在為科學和實用目的對社交媒體資料進行分析。社交媒體,不僅被學術研究人員用來分析社會趨勢和行為,也幫助企業來蒐集和分析有關其績效和銷售回報的客觀回饋;甚至連政治人物也使用社交媒體來傳達對於重要議題的理解並即時調查民意。
然而,在擁有眾多優勢的同時,分析Twitter數據(或任何社交媒體資料)的最大挑戰之一是,作為一個相對較新穎的研究領域,其資料性質不太一致,因此缺乏其他類型研究所擁有的具體理論背景。例如,Twitter的用户資料既包含有量化資料(推文頻率、按讚次數等),也包含質性資料(推文內容、主題標籤的意涵等),因此需要使用混合方法進行研究。
然而,這些挑戰可以在未來被克服,因为研究人員將使用跨學科方法來開發出新的理論,進而發展和適應這些快速變化的社交媒體數據。非常幸運的是,MAXQDA提供了一系列用於量化和質性資料分析的工具,有助於使社交媒體研究變得更加容易入手。
社會交體的分析階段
社交媒體分析的過程通常分為三個階段:擷取─理解─呈現。這些階段相互銜接,但分析過程通常不是線性的,我們最好把它想像成一個循環的歷程。
為了讓您能夠更仔細地認識社交媒體分析過程的每個階段,我們用MAXQDA來一起分析一些最新的Twitter數據:在這個示例當中,我們將分析一個最近對所有人來說都很重要的話題及其相關推文,也就是許多人都在家工作的這段時期都會遇到的一個話題:工作與生活平衡。具體來說,我們導入了過去7天裡帶有#WorkLifeBalance(「#工作與生活平衡」)標籤的所有推文。
如何用MAXQDA 2020分析Twitter數據
MAXQDA具有多種多樣的功能,可幫助您分析Twitter數據,這些功能在社交媒體分析過程的三個階段都將非常好用。當然,每個階段所採取的分析步驟將取決於研究者的方法框架和分析目標,但如果您是社交媒體分析的新手,我們建議從以下方法開始:
- 將Twitter數據導入MAXQDA
- 對導入的推文進行自動編碼
- 依相關性篩選分類後的數據資料
- 分析導入推文的情緒用詞
- 展示情緒用詞的詞頻
- 展示可視化分析結果
擷取
在第一個階段,研究者必須確定社交媒體平臺上有哪些數據資料與研究項目有關。請記住:社交媒體分析是一個循環的過程,並非在這第一個階段蒐集到的所有數據在後續階段都是有用的。反之,接下來的階段可能會發現在此「擷取」階段未蒐集到足夠的數據資料,這可能需要研究者繼續擴大其數據資料蒐集工作。
當然,在您開始進行第一個步驟之前,請確保您有一個Twitter帳戶和MAXQDA許可證。如果您還沒有MAXQDA許可證,請下載14天的免費試用版來開始進行測試:
步驟一:將Twitter數據導入MAXQDA
MAXQDA的Twitter分析功能使您可以快速且輕鬆地將Twitter數據資料直接導入到您的專案項目當中。首先,打開您已有的MAXQDA項目(或創建一個新項目),點擊「導入」標籤下的「Twitter數據」標誌,在開啟的對話視窗點選「連接Twitter」功能,將您的專案項目連結到Twitter。
然後,您可以在「複雜搜索」欄位當中搜尋相關推文,在這些欄位設置特定的詞彙、短句、標籤、作者、語言等篩選條件,並針對您的研究項目感興趣的資訊創建一個搜索查詢。
讓我們輸入#WorkLifeBalance(「#工作與生活平衡」)標籤,並將時間框架設置為過去7天,然後點擊「搜索」以縮小參數範圍。接著,我們會看到一個預覽視窗,裡面有前100筆搜索結果。如果您對於這些預覽的搜索參數感到滿意,則可以開始導入數據。目前最多可將10,000條推文導入您的項目檔案當中。在「文件列表」視窗中會自動創建一個新的文件組,其中每1,000條推文會產生一個表格文件如下:
當您按兩下新文件時,Twitter數據將以表格形式顯示在「文件瀏覽器」視窗中,該表格包含關於推文本身(日期、語言、標籤等)和推文作者(暱稱、地點、時區、追蹤者數量等)的必要資訊。現在,所有數據都已經導入,就可以開始分析您的資料了,就是如此簡單!
理解
在導入資料後,社交媒體分析的下一個步驟是根據您研究項目的方法論來對數據資料進行理解。在「理解」階段,研究者必須選擇出與研究問題最相關的數據並著手分析它。
如果您是質性分析(QDA)的新手,或者想要在學習自動編碼之前先複習一下資料編碼的操作,請點擊這裡以快速瞭解用MAXQDA進行質性分析的過程:
步驟二:對導入的推文進行自動編碼
由於Twitter導入的數據資料通常非常龐大,我們建議您從自動編碼開始,以加快您的分析過程,而無須瀏覽數以千計的推文或是進行手動編碼!
進行自動編碼時,MAXQDA允許每次可編碼多達100位作者和100個標籤的Twitter數據。在完成Twitter數據導入後,會自動出現一個設置自動編碼的對話視窗。另外,您可以隨時透過「分析>Twitter>自動編碼推文」這個路徑來開啟自動編碼功能。
首先,選擇您想進行自動編碼的文件,然後選擇要編碼的標籤、作者和∕或其他資訊。在此示例當中,我們對標籤和作者暱稱進行自動編碼。當您點擊篩選類別時,將打開一個帶有主題標籤或作者暱稱的新對話視窗,您可以從中選擇相關的標籤。其後,只需回到自動編碼視窗,點擊「自動編碼」按鈕,就可以開始這個編碼過程。
一個帶有日期的新代碼「自動編碼Twitter資料」的新代碼將被插入代碼列表的頂端,其子代碼「推文標籤」和「推文作者」將會按詞頻自動降冪排序。一旦您的資料被導入並自動編碼之後,它將顯示在您的MAXQDA專案項目當中,如下圖所示:
在上圖的示例當中,您可以清楚地看到左下方的新代碼和右側的自動編碼的推文。所有的推文都被分配了代碼「工作和生活平衡」,因為這是我們導入的主題。但您也可以看到其他在Twitter上正在討論的幾個更具體的問題,例如「在家工作」、「生產力」和「心理健康」。到目前為止,我們可以從數據資料當中得到第一個結論是,有幾個主題與「工作和生活平衡」有關。
步驟三:篩選數據
現在您的Twitter數據已經被導入並自動編碼,您可以將其完全匯入到您的研究專案項目當中。您可以使用與其他研究資料相同的方法來進行分析,如文字檔、採訪記錄、照片、影片等。而且,您還可以隨時返回並檢索帶有特定主題的推文:使用MAXQDA的簡單檢索編碼功能來查詢帶有特定標籤或由特定作者撰寫的推文。
下一步是使用「Twitter分析」窗口來篩選Twitter數據,進入:分析> Twitter >分析推文,選擇所有您想包括在分析當中的Twitter檔案。結果將顯示於表格當中,其中包括關於作者和推文的資訊(例如:推文被轉發頻率或推文收到的贊數)。在左邊的篩選面板中,您可以根據最常使用的詞彙、標籤、語言、來源等來排列推文。
使用這個篩選工具,您可以對進行數據自動編碼後的早期觀察進一步探索。例如,我們現在可以透過日期和時間對數據資料進行排序,測試某個話題在特定新聞週期中的流行程度。我們還可以基於某個標籤來篩選資料,然後按照轉發數量的降冪來對表格進行排序,以分析某些話題的關聯性。或者,我們可以篩選出最常使用的詞彙,然後根據回覆數量對表格進行排序,以測試哪些話題是最有爭議性、最容易引發熱烈討論的。有無窮無盡的各種可能性,完全可以根據您的研究問題來調整,所有的選擇權皆在您手中!
步驟四:對Twitter數據進行情感分析
使用MAXQDA 2020.4.0,您可以對Twitter資料進行情感分析!使用情感分析,可以快速感知個人對某個議題的情緒、感受和觀點。 其核心構念是根據情感的極性對大量的非結構化資料進行分類,並將其歸類為正面、負面或中性。
透過使用情感標籤對Twitter數據資料進行自動編碼,您可以迅速瞭解公眾對特定研究主題的情感狀態,例如「工作與生活平衡」。在進行情感分析之後,每條推文都可以得到一個情感標籤和分數。
展示
在社交媒體分析的最後「展示」階段,研究者總結其評估過程,並將前兩個階段的資料收集和分析結果可視化。如果您是第一次使用MAXQDA的可視化工具,可以看一下這個影片,瞭解一下您選擇的眾多選項:
步驟五:創建頻率表和圖表
當您根據研究專案的相關標準完成推文篩選後,MAXQDA將為您提供許多令人興奮的選項,以展示您的研究結果。為了顯示我們在上一階段所看的分析測試結果,我們現在將創建頻率表和圖表。在「分析推文」視窗上面的工具列上點擊「統計資料」,就可以進行頻率分析。
在視窗上方的箭頭使您能夠在各種不同的頻率表格式間進行切換。如果您點擊左上角的圖表符號,該表將顯示為柱狀圖(垂直或水準)或圓餅圖。這是絕佳的可視化工具,幫助您輕鬆分析Twitter數據!現在,您可以清楚地顯示各種不同圖形,而不必手動用其他軟體(如Excel或PowerPoint)來導入數據並創建圖表。只需將您的結果匯出為圖像或PDF檔案,然後將其直接放入報告當中即可!
步驟六:用文字雲來可視化數據
有了MAXQDA,您現在可以創建設計屬於自己的文字雲,以適合您的文稿風格。MAXQDA的文字雲功能包括星形、金字塔形或是Twitter鳥形圖案等,有無限的可能性。您可以使用內部定義的佈局和配色方案,也可以添加自己的佈局和配色方案,以更深入地瞭解Twitter資料,並以有趣的方式展示它們。
這個可視化工具是詞頻分析的完美下一步,尤其是在處理大量數據資料時,例如本示例查找到的數千條推文。只需點擊MAXQDA的文字雲圖示,就可以創建出如下的文字雲:
如果您想從您的文字雲當中排除無關緊要的詞或不重要的詞,則可以創建一個這些詞的「非索引列表」(有些地方也被譯為「停止列表」)。最簡單的方法是在「開始」選項中打開「字元頻率」功能。在顯示的表格中,按兩下特定單詞前面的綠色圖示,它就會被放入非索引列表,不會再出現在文字雲當中。
好了,我們完成了!透過六步驟得到了公眾對工作和生活平衡的印象。現在,您可以輕鬆而清晰地呈現分析結果。您的工作和生活平衡情況如何?發Twitter給@verbisoftware或使用標籤#MAXQDA,讓我們知道您的Twitter資料分析結果如何!
關於使用MAXQDA進行社交媒體研究的其他資源:
參考文獻:
- Fan, W., Gordon, M. D.: The Power of Social Media Analytics. Association for Computing Machinery. In: Communications of the Acm. June 01, 2014.
- Segerberg, A., Bennett, W. L.: Social Media and the Organization of Collective Action: Using Twitter to Explore the Ecologies of Two Climate Change Protests. In: The Communication Review. Washington, 2011.
- Ganis, M., Kohirkar, A.: Social media Analytics: Techniques and insights for Extracting Business Value Out of Social Media. In: IBM Press. New York, 2015.
- Zeng, D., Chen, H., Lusch, R., Li, S. H.: Social media analytics and intelligence. In: IEEE Intelligent Systems, 25(6). 2010.
這篇文章是從2018年10月發布的原始版本更新而來的。本文譯者為李佩珊,來自臺灣,目前為中學輔導教師並在大學兼任助理教授,研究興趣為學生輔導與諮商、教育心理、師資培育、危機溝通等。