摘 要:地图抽样法以住宅类建筑为载体,将各类建筑物绘制在图纸上并对实际住户进行编号形成抽样框,因而不同于依靠户籍、门牌等信息编制样本框,是目前世界上公认的、较为精确的抽样方法。当然,地图抽样法也存在着前期资料收集与人员培训不充分、地图绘制过程中信息确认不足、样本框审核效率不高等问题,需要我们加强绘图员的甄选与培训,注意对社区边界以及各类建筑物的确定以及空户的排查,从而增强地图抽样法的实施效果,更好的发挥地图抽样法的效用。
关键词:地图抽样法;抽样调查;中国综合社会调查
地图抽样法是中国综合社会调查(简称“CGSS”)项目结合我国国情从国外引进的一种更为精确的抽样方法,它通过对某个社区展开实地绘图确定抽样框及样本,并据此开展入户访谈,是确保入户访谈科学性和有效性的重要保证,因而越来越为各高校及科研院所所认同。
一、地图抽样法的实施
入户访谈作为一种社会调查方法首先必须要确定抽样框,并对抽样框进行抽样以获取相应的样本。但是,由于我国流动人口众多,人户分离现象较为普遍、门牌地址信息不完备等因素的存在,使得以往那种利用村(居)委会提供的户籍资料难以准确地确定抽样框、进行抽样。基于此,地图抽样方法在实地绘图的基础上以住宅户为基本抽样单元确定样本框,利用户籍、门牌等信息作为补充,从而形成一种较为新颖的抽样方法 [1]。地图抽样法在实施过程中它可分为初级、二级和三级等三个层次的抽样单元及其实施步骤。
初级抽样单元是指被抽中的各县级行政单位,主要根据其经济社会发展的典型性并结合经济社会各项发展指标随机抽取。例如在CGSS项目中,福建省选取的初级抽样单元分别是面临工业转型的永安市(县级市)、提出建设国际旅游岛的东山县和作为“福州后花园”的永泰县。云南省抽取的寻甸县、巧家县、剑川县以及新平县这些地方在经济发展、自然资源、文化旅游、交通条件等方面各有特色。初级抽样单元确定之后,要通过电话联系、查阅相关文献与资料,进一步确定每个县的二级抽样单元——村(居)委会样本数。为了保证访谈对象的城乡均衡分布,通常确定2个农村村委会和2个城市居委会进行实地绘图。各个村(居)委会的绘图完成后要对实有住户进行编号并从中随机抽取75户作为可供入户访谈的三级抽样单元。
在上述三个环节中,二级抽样单元的确定最为复杂,因为它是抽选访谈对象的核心。这个环节要求我们以村(居)委会为载体明确样本框所涉及到的行政区域并收集全部抽样单元。也就是要绘制出所有住宅类建筑物信息。这一环节包括五个步骤:
第一步,确定绘图边界。行政边界是确定样本框、抽取样本的重要依据,如果样本框边界无法确定就需要更换村(居)委会。绘图正式开始前通常请熟悉村(居)委会的人员带领绘图员绕村(居)行政区划边界一周,用手持GPS设备分别采集村(居)东、南、西、北四个方向及端点的经纬度,依此确定社区地理区域,同时依据社区的地理情况和道路分布特点确定总图和分图 [2]。
第二步,绘制出建筑物。各类建筑物是确定样本的依据与载体,也是样本框全面准确的重要保证。确定好社区地理范围之后,绘图员要在村(居)委会相关工作人员的配合下准确区分出住宅类建筑物和非住宅类建筑物。在此基础上准确地绘出每一栋房屋的方位、大致形状与楼层数,以便后期抽样使用。在此过程中,遗漏住宅类建筑物则无法准确地确定样本框。反之,如果将一些无人居住的非住宅类建筑物绘成住宅类建筑则会增加无效样本。因此,这个阶段是地图抽样法中最为繁琐、最为重要的一个基础性环节。
第三步,对样本进行编号。编号是抽样的重要一环,要根据道路、总图以及分图顺序画出最为便捷的行走路线,即最优路线,然后按照所确定的最优路线的顺序为住宅建筑物编号,以便将来入户访谈时访问员能够便利地找到被访户。
第四步,制作住户清单列表,也就是确定二级抽样单位中样本总体 [3]。住户清单列表构成了样本总体,也是进行抽样、确定被访户的直接依据。在单元楼、大宅院、土楼等多住户的建筑物内,一个建筑物编号目录下还需要设定多个住户编号加以区分。
第五步,抽取访谈样本。依据住户清单列表编号,结合随机数表抽取出备选样本。这些备选样本抽出后,还要进一步核查他们是否符合访谈要求,有没有重复或空户,否则还需要重新抽取替换样本。虽然最终只需要从三级样本单元中抽取25个住户作为访谈对象,但根据入户访谈对象的城乡差异,在实际抽样过程中,农村社区一般抽取50个备选样本,城市社区则抽取75个样本,省会城市则要抽取100个备选样本。
二、地图抽样法的实施特点
总体上看,依据住宅找人原理确定样本框寻求被访者的地图抽样法在实施过程中具有以三个方面的特点。
首先,它尽可能地找到所有样本,提高样本总量的准确性与可靠性。在以往依据户籍、门牌号码等信息确定样本框的抽样方式中,人口外出、异地居住、一户多宅等情况的存在使得实际住户与登记信息有很大的出入,导致将来找不到访谈对象或住宅中的住户并不是事先确定的访谈对象,进而降低了样本的信度和效度。地图抽样法以住宅类建筑物为抽样对象,只考虑住宅内有无住户,认为住宅体现着被访者的经济社会地位,只要住宅里的住户存在,样本的准确性就得到了保证,从而减少其它抽样方法中可能存在的失访现象,增加了样本的有效性。
其次,它尽可能地覆盖到流动人口,防止样本代表性不足。抽样调查要想保证科学与精确就必须要保证样本的准确性与代表性。在部分地区,如城中村、城乡结合部、建筑工地、简易工棚等流动人口居住密集区域,有的住户连暂住证都没有办理,当地社区人口管理信息系统并没有录入其信息。以往的抽样方法很难将这些样本纳入到样本框之中。而地图抽样法以住宅为媒介,根据建筑物寻找样本框就可以很自然地覆盖到这些群体。通过这样的方式进行抽样,保证了抽样的科学性以及样本在不同群体间的代表性。
最后,它能更好地用于长期跟踪访谈,确保入户访谈的延续性。相对于人口的频繁流动,住宅具有更大的稳定性与确定性,除非出现大规模的征地拆迁,数年内房屋一般不会迁移。这意味着一旦确定了住宅,也就确定了住宅中的住户作为访谈样本。即使该住宅中的个别成员外出务工、探亲访友以及房屋租售等,仍可以通过KISH表来确定该住宅内其他人员作为访谈对象,从而保证访谈的延续性,便于今后的回访与跟踪访谈。
三、地图抽样法在实际操作过程中存在的问题
当然,尽管地图抽样法能够克服其它抽样法难以克服的问题。但是,由于这个方法直接从国外移植过来,有些情况并不完全适合我国复杂的各地实情,加上绘图人员的绘图抽样水平参差不齐,因而在实际操作过程中也遇到了一些新的问题。
第一,资料收集与人员培训针对性不强。绘图抽样是一个程序繁琐、要求严格的社会调查方法,绘图员的选拔与培训尤为重要。虽然这种抽样方法对于地图绘制的要求低于专业性地图绘制,可是,对于非专业的绘图员来讲,识别、确认并在图纸上准确地画出村(居)各种住宅类建筑物难度依然较大。加上现有的绘图培训仅仅对一般绘图原理及技能进行培训,在试绘图中所选取的大都是边界清晰、社区内部建筑物布局比较简单、社区道路比较明晰的城市社区,而针对边界交错混杂的社区以及结构较为复杂的四合院、碉堡楼、土楼等建筑物的绘图培训不够。这样使得现有的绘图培训在实际绘图过程中难以真正发挥功效。
就资料收集来说,前期资料收集中存在着相关参考底图难以收集的问题。参考底图是绘制抽样地图的重要参考资料,它有助于绘图员精确定位村(居)边界,确定各种住宅类建筑。参考底图缺失或过于陈旧将不利于绘图工作的开展。在实际绘图过程中,有的村(居)委会无法提供任何参考底图,绘图员只能凭借指南针等简单工具进行绘图;有的仅能提供比较简单的行政区划图或者陈旧的底图;还有一些村(居)只能以卫星地图作为参考底图。所有这些情况无疑增加了绘图的难度。
第二,样本难以确认。地图抽样法以住宅类建筑物为抽样载体,它必须确定好二级抽样单元即村(居)委会的行政区域。然而,个别村(居)委会规划不完善,社区行政边界难以确认。有的居委会与近十个村(居)委会交界,不同村(居)委会人员混住现象非常普遍,甚至连社区工作人员也难以准确界定其辖区边界。这样,以绘图确定样本框就会受到很大的限制。另外,一些城市的临街建筑物在三层以下均没有住户,三层以上属于单元楼。不仅如此,个别结构复杂的单元楼通常要逐层核实才能确定具体单元数及住户数,因为同一栋楼中不同单元住宅结构会有所不同,甚至同一个单元不同楼层的住户数也不尽相同。这都会给样本的确定带来困难。
不仅如此,由于地图抽样法依据抽样图寻找被访者,因此,它除了要确认住户的准确地址之外,还必须排除住宅类建筑中的空户。但是,确认城市社区的空户相对较为复杂,有的新建住宅区内空户十分普遍,而且分布较为广泛,绘图员很难一一准确甄别。部分农村地区或者存在着类似于土楼的建筑物,或者在一些年代久远的老宅中建有新宅,这些连成一片的住宅也很难准确划分各个住户所属区域,也难以在图中标示出住户所处位置。此外,农村还普遍性地存在着一些周期性外出的住户,如陪读、进城务工等。这些都增加了空户确认的困难。
第三,抽样的科学性不足。地图抽样法运用随机数表确定二级抽样单元中的备选样本,同时借助于KISH表确定抽样户内的被访对象。CGSS项目最初根据样本总体数量和访谈样本数来计算抽样距离,然后以时间为起点确定三级抽样单元。然而,这种非概率抽样具有较大的随意性,加之在实际操作过程中计算抽样距离也容易出错。现在改用随机数表抽样法解决了老问题,但是也出现了新问题:CGSS项目中的随机数表分为A、B两种,对于住户数在1000户以内的村(居)委会采用A表,1000户以上、3000以下的则采用B表,大于3000户的要使用大社区分割法进行分割。可是,在某些规模较小的偏远农村,使用完4张随机数A表,重复若干随机数后才抽齐50户样本。也就是说,如果遇到规模较小的农村社区,随机数表也会因为样本总数过小而难以抽取足够样本。
此外,由于在抽样前就已经一次性地生成某个省份的所有随机数表,却没有规定在具体的二级抽样单元中应该使用哪一张随机数表。这就存在着对随机数表进行任意选择的可能,从而使样本的抽取存在了主观性与非概率性,降低了地图抽样法的概率性与客观有效性。
第四,样本框审核效率较低。地图抽样法规定绘图员完成所有分图的绘制之后才能依次确定最优路线、住宅类建筑物编号、列表清单以及抽样等工作。由于需要对所有分图中的住宅类建筑物进行连续编号,所以,它只能依照分图顺序依次编号、制表,这就意味着各个步骤只能历时性展开而不能共时性操作。同时,每一个编号和每一张列表都是作为连续编号序列的一部分,一旦出错则处于其后的其他所有编号与列表即告作废并最终导致整个抽样无效。因此,出错就意味着全部编号和制表重新开始,这必然导致样本框审核的效率较为低下 [4]。
四、地图抽样法的改进
要解决地图抽样法存在的这些问题,进一步提高地图抽样法的科学性,增强其实用性,我们认为可以从三个方面加以改进:
第一,加强绘图员的甄选与培训。绘图员是地图抽样法顺利实施的基础与保证,只有选拔那些有一定绘图基本功、责任心强、能够吃苦耐劳、从事野外作业的人员担任绘图员才能顺利开展培训。绘图员选拔完成后就应该对其进行重点培训,以确保其能够胜任绘图工作。另外,也要加强对参考底图辨识能力的培训,尤其要教会绘图员识别卫星地图和航拍图的方法,尽可能多地介绍各种住宅类建筑物的绘制,使绘图员对将来可能出现的各种困难有所准备。
第二,充分收集绘图资料。既要收集初级抽样单元所涉及到的有关村(居)人口规模、经济社会发展概况等信息,也要尽可能地收集与绘图相关的当地风土人情、住宅结构特征等信息。在这些工作中,尤其要特别注意参考底图的收集,如果参考底图无法通过村(居)委会获得,可以与市(县)规划、国土资源等相关部门联络寻求帮助,甚至可以与农林水等部门进行沟通。例如在福建某村绘图时,村、镇以及县国土等部门都没有参考底图,但是在该村一处宣传栏却发现了由县防汛部门张贴的防汛疏散图,此图对该村房屋及其它建筑物的标示相当清晰,对于该村的绘图抽样具有较高的参考价值。
第三,提高样本框确定的精确性。明确村(居)边界后,要进一步确定建筑物类型。如果村(居)边界不明确应当直接用备选村(居)进行替换,或者选取村(居)内边界比较清晰的部分作为绘图与抽样对象,从而避免行政边界不清带来的不确定性以及时间与精力上的浪费。建筑物类型要明确区分出非住宅类建筑、商住两用建筑以及纯住宅类建筑等各种情况。纯住宅类建筑自然成为抽样对象,商场、超市等非住宅类建筑一般没有常住人口居住其中,商住两用建筑往往底层是商用而楼上为居民,这类建筑中的住户同样需要标示出。这就是说,要确认建筑物结构及其人员居住情况。有人居住的要将其准确地标示在地图上,以便编号和抽样。城市社区沿街以及农村家族聚居地等结构复杂的建筑物在画图过程中必须准确了解其建筑结构及人员居住情况。同一楼栋的不同单元、同一单元的不同楼层之间结构不一样的住宅,则应该严格遵守从单元楼的最顶层开始逐层按照右手原则确认住宅户的规定,以避免主观判断上的失误 [5]。同时,也要通过观察电表、水表、阳台上晾晒的衣物等方式逐一排除空户。否则,空户被选作调查样本就如同根据户籍信息找不到户主一样,导致入户访谈无法进行。
总之,作为刚刚引进的、更为精确的抽样方法,只要我们密切注意城乡社区人口及建筑物差异性特征,严格按照地图抽样法的操作规程,结合中国各地村(居)实际加以优化和改进,它就能够满足入户访谈科学性的需要,弥补以往抽样方法的不足,提高样本框确定的精确性,促进社会调查研究手段与方法的更新。
参考文献:
[1] 中国人民大学中国调查与数据中心:《中国综合社会调查报告(2003-2008)》,中国社会科学出版社,2009。
[2] 风笑天:《现代社会调查方法》,华中科技大学出版社,2005。
[3] 中国人民大学中国调查与数据中心:《中国综合社会调查(CGSS)2010实地绘图抽样手册》(培训资料),2010。
[4] 水延凯:《社会调查案例教程》,中国人民大学出版社,2008。
[5] 郝大海《社会调查研究方法》,中国人民大学出版社,2009
[6] 徐丽等:《我国抽样调查方法的最新进展》,《统计与决策》,2010年第8期。
作者简介:高和荣(1969-),男,厦门大学公共事务学院教授,博士生导师;马敏(1984-),男,厦门大学公共事务学院硕士研究生,主要研究方向为社会建设。
原载:《中共福建省委党校学报》 2011年10期