美國「社會概況調查資料瀏覽平台 (GSS Data Explorer)」介紹



林雅琪
[原文刊載於SRDA學術調查研究資料庫通訊第56期,2016.3]
一、背景與目的
問卷調查為瞭解社會概況、人民意見的方法之一,而長期性的調查不但能作為觀察社會長期變遷趨勢的依據,對於研究者而言更是相對寶貴的研究資源。其中,在美國由芝加哥大學的獨立研究機構NORCNational Opinion Research Center)負責資料蒐集、NSFNational Science Foundation)資助的長期調查計畫-「社會概況調查」 General Social Survey,以下簡稱為GSS[1]),從1972年開始即透過問卷調查的方式,蒐集美國當代社會資料以瞭解相關態度、行為及屬性的變化趨勢及原因,並將調查資料公開,作為社會科學等領域研究者的免費研究分析資源。
和我們台灣的「社會變遷基本調查」(Taiwan Social Change Survey,以下簡稱TSCS)相同的是,TSCSGSS兩者均加入最大的國際社會調查組織-ISSP[2]International Social Survey Program),該組織是由各國進行社會調查的單位組成,至今已有美國、法國、日本、台灣等50多個國家加入,每年各國會針對共同關注的議題建立題組、並進行調查訪問,例如:公民權、健康、環境、宗教、社會網絡等跨國調查題組[3]
而隨著調查年度增加,累積的問卷題目、變項數、成功樣本數等研究資料量愈來愈可觀,至2014年止GSS資料庫有高達5,629個變項及問卷題目,使得使用者在搜尋資料時可能花費較多的時間。另外,當資料量日益增加,如沒有人將資料進一步分析,轉化成有價值的知識或研究著作,如此儘管有再大量的調查資料仍舊是一些數據。有鑑於此,NORC持續開發、提升其功能,並於20151218日起推出了社會概況調查資料瀏覽平台(GSS Data Explorer[4],讓使用者容易搜尋及取得資料、出版品與相關研究資源、並能直接在平台上線上分析、下載資料、將資料共享給其他使用者等功能,讓使用者更容易使用GSS所蒐集的調查資料。本文將介紹GSS Data Explorer的功能及特性、利用圖解說明方式,示範各項功能的使用流程與操作結果,提供給可能需要利用GSS資料的使用者、或對GSS Data Explorer有興趣者作為參考。
二、功能與特色
GSS Data Explore主要有四大特色:變項搜尋與儲存、資料分析、資料擷取、專案工作區,而資料視覺化(Visualize Data)功能目前尚在建置中。各項特色概述如下:
l   變項搜尋與儲存(Search and Save Variables):使用者可以透過變項搜尋,尋找所需的調查題目、變項等相關調查資料,並能進而將選取的變項加入變項購物車(Variable Cart)。
l   資料分析(Analyze Data):在簡易操作的介面上,對已儲存在變項購物車中的變項或自行新增選取的變項,進行交叉、多層次、相關、迴歸等資料分析。
l   資料擷取(Extract Data):提供不同輸出格式及資料檔(SASSPSSStataR),讓使用者自行選擇欲下載的擷取資料格式。
l   專案工作區(Project Workspaces):在專案工作區中,使用者可以儲存歷次搜尋結果、儲存的變項及資料分析、擷取的紀錄。另外,經由專案設定,可以將專案中既存資料與其他擁有MyGSS帳號的使用者共享。
雖然任何使用者均能瀏覽變項和題目、儲存變項,然而如需分析資料、建立專案,甚至將專案分享給其他人,則必須要有MyGSS帳號,因此建議有上述需求的使用者,可以先申請MyGSS帳號,帳號申請流程為:至註冊頁面[5]上填寫資料,再至電子信箱收取確認信完成註冊步驟,隨後即可輸入帳號及密碼進行登入。以下為GSS Data Explorer各項功能的使用流程及操作結果:
(一)  變項搜尋與儲存(Search and Save Variables
透過「主題」、「調查年度」或「關鍵字」,逐步限縮查詢的範圍,進而搜尋合適的題目、變項以及出版品。其中,當使用者所輸入的關鍵字,和GSS資料庫的變項名稱或是調查題目相同時,即符合搜尋條件。
「假設我們想要瞭解過去十年「收入(income)」跟「幸福(happiness)」之間的關係,該透過哪些步驟來搜尋到需要的資料?」本文將以此假設來示範:首先,在關鍵字中輸入「income」,再篩選2004-2014調查年度,結果顯示有51個變項符合搜尋條件。使用者可以藉由瀏覽變項說明(Description)或調查題目(Survey Questions),從中尋找真正需要的變項。假設我們需要的是受訪者個人收入資料,瀏覽變項說明得知「rincome」這個變項符合需求,點選變項左邊購物車符號,即可把「rincome」儲存至變項購物車(如圖一)。



 圖一 變項搜尋與儲存功能[6]


(1)輸入關鍵字
(2)篩選調查年度
(3)符合搜尋條件筆數,依變項/問卷題目,瀏覽詳細資料
(4)儲存變項
(5)點擊變項瀏覽詳細資訊
(6)綠色方格表示篩選的調查年度中,哪些年有調查資料


以上範例是我們很明確的知道需要哪些變項,透過關鍵字搜尋即可快速找到所需的變項,然而,當不確定需要哪些變項時,則可以從主題來搜尋,勾選有興趣的主題。假設對於老年主題有興趣,則勾選「Aged」主題,再從中尋找需要的變項(如圖二)。瀏覽與儲存變項方式請參考圖一。


 
圖二 主題搜尋功能

(1)點選「加號」
(2)勾選主題類別



然而,如果從變項說明或調查題目尚無法確定「rincome」是否符合我們需求時,也可以點擊「rincome」這個變項,進一步瀏覽該變項的原始問卷題目和選項、不同調查年度的次數分配結果等詳細資料,再決定是否需要儲存此變項。此外在搜尋結果頁面,亦提供該變項歸類於哪一個主題、有哪些其他相關的變項等資訊(如圖三)。相同地,可以參考上述說明來搜尋與儲存「happiness」這個變項。


圖三 瀏覽詳細資料頁面
(二)  專案工作區(Project Workspaces
使用專案工作區功能,需要先登入MyGSS帳號,專案工作區不但可以幫助使用者儲存搜尋及資料分析等歷程紀錄,並能經由專案設定來選擇不公開(Private)、共享(Shared)或是公開(Public)的狀態。
共享是藉由E-mail方式邀請其他MyGSS帳號的使用者加入,共享的使用者可以瀏覽、新增以及編輯專案內容,此功能對於需要共同研究的研究者們相對便利,亦能促進使用GSS資料作為課堂教學;和共享不同的是,只要知道公開專案連結者均可以瀏覽公開的專案,但對於專案內容不能編輯或新增。然而,不論是共享或公開的專案,都只有最初建立專案的使用者才有權限去變更專案設定的狀態。此外,如對於下載資料的格式有特別偏好,也可以在此先進行設定,上述的設定功能在專案建立後亦能隨時變更。以下是建立新專案、專案設定的流程(如圖四、圖五)。


 專案建立完成後,即可新增搜尋、儲存變項等資料流程,如需移除已儲存的變項,點選右上角變項購物車則可以移除,而從右列可以瀏覽專案工作的時間紀錄。此外,因使用者可以建立兩個以上的專案,因此在進行儲存變項等工作前,需事先選定特定專案(如圖六)。




(1)選擇在此專案中進行工作
(2)點選加號進行變項搜尋與儲存
(3)點選後彈出購物車清單,移除不需要的變項
(4)點選新增資料分析
(5)專案工作時間紀錄



(三)  資料分析(Analyze Data
使用者可以從變項購物車中已儲存的變項或自行新增變項(在線上對變項重新編碼),直接在簡易操作的介面上進行交叉、多層次、相關、迴歸之資料分析。另外,系統會提供預設的相關分析方法、設定權值變項及抽樣設計的類型,然而使用者也可以依研究需求自行選擇合適的選項。
針對上述已經儲存到專案工作區的「rincome」跟「happiness」這兩個變項,如何進行相關分析?首先,從圖六專案工作區的分析區塊新增分析,選擇欲分析之類型後按下一步,再針對分析的內容,例如:建立分析資料之名稱、選擇調查年度、篩選特定的選項、是否需排除遺漏值等設定,待設定完成後點選建立分析,即開始進行線上相關分析(如圖七、八)。
 
圖七 資料分析設定功能(一)

(1)選取資料分析類型後
(2)點選下一步開始進行設定





圖八 資料分析設定功能(二)

(1)為要分析的資料命名及說明
(2)勾選要分析的調查年度
(3)將要分析的變項,從右方拖曳至此
(4)勾選需要分析變項的哪幾個選項
(5)依研究需求自行選擇:相關分析的方法、設定權值變項、抽樣設計
(6)勾選是否需排除遺漏值
(7)自行建立新變項(重新編碼)如圖九
從上述設定中,如仍無法滿足研究所需的選項分類,則可以從「CREATE YOUR OWN」功能,透過點選或輸入語法的方式對變項進行重新編碼。以下假設我們需要將「rincome」從原本12個分類(Lt $1000$1000 to 2999$3000 to 3999$25000 or more),重新編碼成2個分類(小於等於$24999、大於$25000),該如何用點選方式來設定。而當成功新增變項後,在變項購物車中即會出現有「   」符號的變項,表示該變項是被重新編碼過的。(如圖九)。



圖九 新增變項功能




(1)輸入新增的變項名稱與變項說明
(2)選擇用點選或語法方式做設定
(3)將要重新編碼的變項,從右方拖曳至此
(4)點選重新編碼條件
(5)為重新編碼的選項輸入數值說明
(6)點選後,繼續重新編碼
(7)以上設定完成請點選新增變項
(8)完成後,在變項購物車即會出現被重新編碼的新增變項「rincome_3

分析完成,除了提供分析結果外,並可以檢視分析前所做的設定,而分析結果提供表格、圖表等不同格式供使用者選擇下載。以下為相關分析結果頁面、可以選擇要匯出PDF檔或是R程式碼。如分析完成後,需變更設定或調整分析的變項,只要點選右上方,即可重新編修設定、並重新分析,例如「happiness」在之前設定中沒有排除遺漏值,即可透過重新編修設定、再次取得相關分析結果(如圖十)。另外,亦可以針對每一筆分析資料作評論、註解的功能(如圖十一)。


圖十 資料分析結果與匯出功能

    已完成的分析,可從專案工作區的Analyses區塊查看內容。如要重新編修、刪除,或註解分享此分析內容,點選標題列的數字,即可進入下方畫面。




圖十一 資料分析評論

(1)由左至右分別為:編修、刪除、註解
(2)註解填寫完畢按此儲存



(四)  資料擷取(Extract Data
GSS資料庫有超過5000個變項、40年以上的調查資料。雖然網頁上仍提供快速下載[7]Quick Downloads)全部資料檔的功能,但因下載全部的資料需要耗費很多時間,建議使用者事先利用擷取工具(Extract tool),篩選出自己需要的變項後再進行資料下載。資料擷取同樣可以從專案工作區中進入來建立,依照設定步驟進行(如圖十二)。




(1)為擷取資料命名
(2)從已加入變項購物車的變項選取或回到搜尋頁面搜尋,選擇要下載的變項
(3)篩選特定選項
(4)篩選需要的年份、欲下載的格式
(5)按此確認下載,下載完成後會顯示可下載的箭頭圖示
(6)下載壓縮檔
然而,由於從資料擷取流程下載的資料,並不是系統檔(如SPSSSAV系統檔、STATADTA系統檔),因此使用資料前需自行利用下載的欄位定義程式來讀取原始資料。例如,需要SPSSSAV資料檔,則需利用下載的GSS.sps修改檔案存取的路徑後再讀取GSS.dat
(五)  其他功能
除上述特性與功能之外,在GSS Data Explorer上亦可透過「主題」、「調查年度」或「作者」,逐步限縮查尋的範圍,進而搜尋合適的出版品[8],包含:過錄編碼簿、問卷、報告書、衍生著作等不同類型的相關資源。使用者可以選擇在線上瀏覽,或是直接下載整份文件(如圖十三)。






(1)輸入關鍵字
(2)篩選年度
(3)輸入作者
(4)選擇出版品類型
(5)符合搜尋條件筆數
(6)點擊瀏覽文件全文

三、結語
GSS Data Explorer設計了簡易操作的介面、並整合了資料搜尋、分析、專案工作區等功能,協助使用者在大量的資料中更有效率的搜尋、取得所需的變項與相關資源。而持續開發中的視覺化功能亦值得期待,我們將持續關注GSS Data Explorer的現況,如有最新的發展,將為大家作介紹。



[1] 有關GSS介紹,可參考SRDA學術調查研究資料庫通訊第27期「長期系列調查資料的加值應用—以1972-2006 年美國社會概況調查資料(GSS)串連為例」一文,下載網址:https://srda.sinica.edu.tw/publish/emagzinecont/37
[2] ISSP,網址為http://www.issp.org/
[3] ISSP各題組調查結果,http://zacat.gesis.org/webview/index.jsp,請點選ISSP再點選by Module Topic
[4] GSS Data Explorer,網址為https://gssdataexplorer.norc.org/
[6] 本文圖片擷取自GSS Data Explorer官網:https://gssdataexplorer.norc.org/
[7] 快速下載全部資料檔之連結:https://gssdataexplorer.norc.org/pages/show?page=gss%2Fgss_data
[8] 相關出版品搜尋之連結:https://gssdataexplorer.norc.org/documents

留言

這個網誌中的熱門文章

使用Python進行資料整理 – 初探Pandas

SAS、SPSS、STATA 統計軟體檔案格式轉換介紹

資料整理與檢誤經驗談—以SPSS程式進行邏輯檢查