東京大學社會科學研究所 附屬社會調查與資料庫研究中心 日本社會科學資料庫介紹



陳運陞[1]
[原文刊載於SRDA學術調查研究資料庫通訊第44期,2013.3]
一、歷史沿革
  東京大學社會科學研究所是由法學、社會學、經濟學以及政治學四個研究部門所組成的研究機構,該所的主要活動包括進行綜合的研究計畫、執行調查(如社會調查與社群調查),以及建置研究相關的設施,如圖書館與資料庫等。而調查檔案資料庫的建立,是日本學界調查研究的一項重要進展。
  社會調查與資料庫研究中心成立的需求有兩個層面,一個是在西方國家中,資料庫做為社會科學研究與教育的重要素材已行之有年,在社會調查中心出現之前,日本並無相關的組織;另一方面則與過往日本學術界的體制有關,根據調查中心前田幸男教授的介紹,過往日本大學的人員配置中,並沒有在體制內的檔案保存機構,也沒有全職工作人員的制度,雖然在60-90年代,曾經有過幾次進行體制化建構的提議,但最終都沒有實踐。在欠缺制度化的檔案保存機構情況下,使得許多日本曾經進行的調查研究所收集的原始資料逐漸散佚。檔案沒有機構化保存的後果,更形成了調查研究上的惡性循環:缺乏健全的機構保存檔案,使調查的結果缺乏公信力,而難以取得研究經費;進而導致調查數據無法有系統地被保存與流通;調查資料保存與流通不便利,又造成調查數據不受研究者注意,最後這些負面的形象最後又會導致將檔案體制化的困難。
鑑於這些因素,東京大學社會科學研究所於1996年成立了附屬單位:日本社會研究資料中心。該中心建構並負責日本社會科學資料庫(Social Science Japan Data Archive,以下簡稱SSJDA)的運作,其成立的主要目的在收集、保管關於統計調查以及社會調查的問卷資料與調查方法等資訊。19984月起,SSJDA為了提供學術目的研究所需,將原始資料提供給校內外的教員與學生使用,並且舉辦研討會讓資料分析與計量研究方法更為普及。
  除了保管與流通資料之外,該中心也展開與國際調查研究交流的活動。19999月因應國內大學所需,加盟美國政治與社會研究校際聯盟(Inter-university Consortium for Political and Social Research: ICPSR),設立ISPSR國內利用協議會。並透過與ICPSR以及IFDO (International Federation of Data Organizations)的架構與美國和歐洲進行跨國合作,並邀請歐美國家的學者進行交流。
在與歐美的學術界互動的同時,社會研究資料中心也積極地與位處東亞的資料中心展開亞際間互動交流,2006年參與東亞社會調查計畫(East Asia Social Survey: EASS);2008年則以「東亞各資料庫與前景:整合性的資料收集、流通與分享」為主題舉行跨國的座談會。並與中央研究院人文社會科學研究中心調查研究專題中心進行相互的訪問。而在2012年,該中心也訪問了韓國社會科學資料庫中心(Korean Social Science Data Archive: KOSSDA)
  20094月,日本社會研究資料中心根據先前累積的實務成果正式改組為社會調查暨資料庫研究中心(Center for Social Research and Data Archives),其主要目標是透過中心建立的SSJDA資料庫,擴大日本與東亞間調查資料的保存與流動,提供研究者存取已經制度化的調查資料以進行研究;目前資料庫對學界公開釋出,利於二次分析的學術調查檔案已經越來越多,年輕一代的日本社會學者也開始將調查資料的二手分析做為他們研究策略選項之一,同時研究者們也被期待當執行完自己策畫的調查後,能將他們的調查資料回饋給資料庫,成為使資料庫更加完整的助力。
二、社會調查暨資料庫研究中心的組織架構
  社會調查暨資料庫研究中心由調查基礎研究、社會調查研究、計量社會研究,與國際調查研究四個部門所構成。調查基礎研究部門是與各種調查機關連結,收集大量的原始資料,建構並負責SSJDA資料庫運作,並將資料提供給全國的大學、研究機關、及研究者共同利用,同時負責維護與開發資料庫的線上系統。換句話說,也就是進行與調查資料保存相關的基礎設施建構與研究開發;社會調查部門主要致力於調查研究的實行,一方面進行獨立的日本生命歷程長期調查(Japan Life Course Panel Survey),一方面與大阪商業大學合作,實施日本版的社會基本調查(Japan General Social Survey),並透過SSJDA提供這些優質的調查檔案;計量社會研究部門是通過資料分析研究會與研討會,如每年召開的「分析研究會」、「計量分析研討會」等,達成共同研究與培育年輕研究者的目標;國際調查部門是與全球,特別是亞際間的資料庫合作,以及將SSJDA國際化為目標,引進Nesstar線上分析系統,並進行後設資料管理軟體EDO(Easy DDI Organizer)的開發。
  目前SSJDA的主要人員編制共13名,包括中心執行長、若干位教員以及研究人員(博士後層級),研究人員負責中心日常庶務,如資料申請、資料庫及網站維護等,同時也負責研發資料管理與流通的工具。另有一位全職的資料庫管理者,以及數位負責文件處理或資訊工作的職員。

   資料庫的主要功能,是將統計調查與社會調查的個案問卷資料收集、存放與保管,並防止資料散失,同時將這些資料提供為學術研究使用。並透過不同機關與研究者在其專業領域上的調查與資料收集,來活化既存資料檔案的使用,進而防止資源浪費與開展新興研究課題,最終以擴大日本境內公開的問卷資料質量為目標。
  至2011年為止,SSJDA累計提供1,812組資料檔案,並已公開1,424組資料檔案,累計發表169篇論文。蒐羅資料主題包括:資訊、通訊技術與大眾傳媒;經濟、產業、經營;法律;醫療保健;社會福利;國際關係、外交;政治、行政、選舉;雇傭與勞動;社會與文化;環境;安全,犯罪與災害等。
三、資料的性質與政策
   資料庫所存放的資料來源,主要來自於研究者、政府機關、勞工團體、以及企業的研究部門。資料庫保存的資料,大多是採機率抽樣方式所進行的調查。
除此之外,依據資料寄存者的資料所能提供的研究價值,資料庫也接受其他非機率抽樣的資料,像是定額抽樣或網路調查;同時,資料庫也保存並釋出一些由新聞媒體,如NHK、朝日新聞社等單位執行的民意調查資料。然而,中心並不會收集總體資料(加總後的數據)、質化資料、以及非數據資料,同時目前並無蒐集官方統計數據資料的規畫。
  近來隱私意識抬頭,造成受訪者對於提供個人資料的問卷調查感到不安而拒絕受訪的情形日益增多,因此對資料保管採取隱私謹慎的態度,有助於提升受訪者的受訪意願以及調查的成功率,為此,SSJDA對資料存取的規範十分重視與謹慎,除了遵循日本相關數據法令的規範外,本資料庫中關於受訪者的特定資訊並不會被公開;而資料庫的使用目的限定於學術範圍,不受理營利目的的使用申請;使用者也只限於研究者、研究生與指導老師帶領的大學生。在申請使用存取資料權限上,SSJDA大多採取了較為嚴謹的人工方式,雖然耗時但較能保護資料免於侵犯隱私的情形。
  另外,為了防範誤讀資料而引導至錯誤結論的發生,資料庫會提供關於問卷資料的必要資訊,以利使用者深入理解調查方法與內容,再進行分析。此外資料庫也整理使用上的注意事項,以及調查報告提供給使用者,並且回答使用者的相關疑問。
    由於SSJDA的建置,使得日本社會科學研究的體制化逐漸步上軌道,然而仍有種種因素影響調查資料的保存與流通。一方面日本文部科學省(MEXT)以及日本社會科學院都沒有要求研究者有必須將調查資料公開的義務,調查資料公開與否,是由調查計畫的主持人決定;另一方面,目前資料的描述(後設資料)與數據既沒有硬性規定的統一格式,也沒有學院或專門機構的背書。此外,資料保存與流通的長期性規範也未明確制定,有些計劃主持人也會自行架設網站提供資料數據,這些因素的存在,恰恰正凸顯了SSJDA此一體制化的資料保存與流通機構之必要性。
    SSJDA在接受研究單位要求寄存檔案的委託後,將資料經過一定程序處理後,才會將調查資料公開。處理資料的流程包含整理資料相關文件,如資料檔案是否附有足夠的後設資料、問卷和報告書;同時確認複製計畫主持人之報告書不會產生侵權的疑慮。同時也必須確認檔案產生的次數分配是否與報告書紙本一致,並且移除個人資訊及其他敏感訊息,再將資料檔轉換成便於保存和流通的統一格式。
  接著是製作關於資料檔案的後設資料,包括摘要(介紹抽樣設計、有效問卷、計畫主持人等),並且校對中心所做的後設資料與資料檔案的一致性,最後經由計畫主持人確認後,將檔案公開釋出。

四、SSJDA資料的取得方式
   透過使用DDI(Data Documentation Initiative)此一國際標準的後設資料規範,SSJDA提供充分的後設資料,以利於檢索並了解資料梗概。資料檢索方式可透過資料摘要、捐贈者名稱、調查對象、主要調查事項,以及關鍵字等資訊進行檢索,也可以透過調查執行年與調查主題作為過濾來進行。檢索結果的內容包括調查相關訊息(摘要、資料捐贈者、調查方法與時間等),以及問卷次數分配。研究者必須先透過資料檢索尋找預備使用的資料,再向SSJDA提出申請。在申請之前,申請者必須確認自己是否符合並遵守利用條件。條件包括申請者的身分須為大學或公立機關研究者,或是由教授指導的學生;用途限於學術研究,而學生的申請者必須以畢業學位論文撰寫的用途為限,學生的資料使用期限僅到申請後隔年的331日止;另有一部分資料可供作為大學老師授課用途。民間的研究機構只有該單位已在SSJDA寄存檔案的條件下,才能夠申請利用
  欲申請資料的研究者必須透過紙本的申請方式,將申請書與回郵信封寄往該中心,申請者的申請書面資料會被轉往計畫主持人處,以取得計畫主持人的對申請者一年使用期限的許可。又由於資料庫的營運建立在資料寄託者、資料利用者與資料庫之間的互信關係之上,因此申請者申請時須簽署遵守資料使用相關規範的承諾。資料與後設資料將會被燒錄成光碟後寄返申請者處,在達一年期限後,申請人必須繳交報告書,以及使用資料結果的出版物,並且在論文記載調查主題與資料捐贈者。隨後申請者必須銷毀光碟並刪除電子檔案或申請權限的展延。
  為了因應逐年增加的申請要求,20094月起透過SSJDA Direct(問卷資料下載系統)替一些經常被使用的資料群組開放了直接線上申請與下載的功能,在SSJDA Direct系統上公開的資料可經由這套系統直接的申請、取得使用憑證、下載資料與上傳使用報告;然而不在此系統內的檔案仍須透過傳統方式申請取得。另外,原本資料庫於2005年開放了線上分析系統(SPSS web-base),但由於硬體因素的關係,線上分析的系統將由Nesstar取代。
  Nesstar線上分析系統,是由歐洲社會科學資料庫協會 (Council of European Social Science Data Archives: CESSDA )2000年前後進行的計畫,利用此系統,使用者能夠快速瀏覽資料、次數分配表與進行交叉分析等,同時由於Nesstar儲存格式的標準化,也可作為國際共用的資料標準化平台,將網際網路的便利性應用在資料的流通與分享上。目前,CESSDA已經利用Nesstar系統將歐洲重要資料庫的資料進行串聯與整合。SSJDA冀望能在未來能以CESSDA的整合經驗為基礎,讓Nesstar也成為一個東亞亞際間調查資料的交流平台,包含在未來成立與KOSSDA以及SRDA資料庫的整合計畫。目前,SSJDANesstar線上分析系統已在201211月進行試營運,已開放三組調查資料供使用,分別是日本社會基本調查(JGSS)的日文版與英文版,以及日本生命歷程追蹤調查(JLPS),並預計2013年能開始完全運作。
   目前,SSJDA的主要展望除了亞際間的合作交流,與透過資料的保存與流通逐步的提升資料收集的質量,還包括設計EDO軟體,以協助調查執行以及後設資料的建置,並將EDO以開放原碼軟體(Open Source Software)的形式出版,以推廣更多的運用,並取得更多的回饋,並且藉由資料捐贈者與研究者的回饋,進一步完善SSJDA資料庫。
  
參考文獻
User’s Guide: SSJDA Direct. Tokyo: Institute of Social Science, the University of Tokyo, 2012.04.
Social Science Japan data Archive. Tokyo: Institute of Social Science, the University of Tokyo, 2012. Print.
Social Science Japan data Archive. Institute of Social Science, the University of Tokyo, 2010. Web. 12 Mar 2013. http://ssjda.iss.u-tokyo.ac.jp/
SSJDA Direct. Institute of Social Science, the University of Tokyo, 2009. Web. 12 Mar 2013. https://ssjda.iss.u-tokyo.ac.jp/Direct/
SSJDANesstar. Institute of Social Science, the University of Tokyo, 2007. Web. 12 Mar 2013. https://nesstar.iss.u-tokyo.ac.jp/webview/
“Research & Development.” CESSDA. Council of European Social Science Data
Archives, 2012. Web. 12 Mar 2013. http://www.cessda.org/about/research/


[1] 本文作者就讀於國立交通大學社會與文化研究所博士班,目前為中央研究院人社中心調查研究專題中心博士班獎助學生

留言

這個網誌中的熱門文章

使用Python進行資料整理 – 初探Pandas

SAS、SPSS、STATA 統計軟體檔案格式轉換介紹

資料整理與檢誤經驗談—以SPSS程式進行邏輯檢查