摘要:社会科学必须以主体的身份,与统计学展开世界观与方法论层次上的对话。笔者提出一些质疑与建议:随机抽样的终端应该是某个层次上的整体而不是单独的个人;在末级抽样层次上,应该追求信息的相对饱和而不是对于本层的代表性;应该是社会分层属性的充分反映而不是“抽象的整体个人”的随机分布;应该进行年龄分层抽样来反映历史时段的差异而不是仅仅对于现在时点的数据进行各种回顾分析;应该要求统计学为我们提供系统论指导下的随机抽样方法。笔者试图以这些建议来化解随机抽样与非随机抽样之间的、定量调查与定性调查在抽样问题上的那些虚构的矛盾,从而体现社会科学在更高层次上的整合性。
关键词:随机抽样;社会调查;总体;代表性;抽样框;抽样单位
我国社会科学界的主流认识是:社会调查应该寻求对于总体的代表性,因此必须进行随机抽样(风笑天, 1987, 2005; 袁方、林彬, 1990; 高嘉陵, 1996;陶冶, 1997;郑杭生, 2001;胡仕勇、叶海波, 2003;李金昌, 2004) ,而随机抽样的原则与方法则全部来自于统计学,社会科学的分析与探讨仅限于如何更好地贯彻执行之(边燕杰等,2001) 。
笔者的问题是:这样做就足够了吗?(1) 随机抽样并不是一个纯技术手段,而是一种认识论与方法论。( 2)我们社会科学必须从这样一个高度上对它进行哪些反思?(3)促进它向什么方向发展?
一、抽样终端:从“单独个人”走向“社会基本单位”
目前中国几乎所有社会调查中的随机抽样,其终端都是具体的个人,就是一个人一个人地抽取样本。只要我们严格按照各种随机抽样方法操作,那么抽取的结果就足以代表某个总体;这一点在社会科学界从未遭到过质疑(陈膺强,1993; Joseph Maxwell, 1996;Marshall,MN1, 1996;谢俊贵, 2000;车文辉, 2002; 边燕杰、李路路、蔡禾, 2006) 。
这一统计学论断的背后的元假设是:每个个人都可以而且应该是孤独地存在的,因此把其中的一些人分别地抽取出来之后,并不会影响他们的特质。这些“单独的人”的相加结果仍然可以代表总体。这其实就是还原论(
这当然符合以物为主要对象的统计学的道理与逻辑。可是,它符合我们社会科学主张的“人是处于环境、关系与历史之中的”这个基本信念吗?
因此,笔者的疑问是:如果明明是不可能孤独存在的个人却被当作单独存在的物体来分别地抽取,那么无论抽样的结果如何随机,它所代表的,究竟是一个在生活中足够真实的、只能存在于环境、关系与历史之中的“社会人”的总体,还是一个具有无法测定的抽象性与虚拟性的“总人口”? 即使我们不厌其烦地进行过无数次随机抽样调查之后,我们对于任何“社会人”的了解恐怕也不会增加。
进一步说,定量研究的社会科学家最应该关心的,恐怕既不是“总人口”,也不是“社会人”的总体,而是“中国社会”(刘少杰, 1998; 王小章,2002;骆玲, 2005) 。可是目前中国社会科学界通行的随机抽样的方法却恰恰无法反映更无法代表这样一个总体,这不仅仅是因为它的终端根本就不是任何一个层次上的“社会”,更是因为“生物人”的简单相加无论如何也不是一个“社会”。
再进一步说,我们使用随机抽样调查数据进行相关分析所获得的结果,恐怕既不是“社会之间的关系”,也不是“社会中人与人的关系”,而是“单独人之间的关系”。
国内新近流行起来的多层次统计分析的技术( Goldstein H1, 1995; Judith D1 & John B1,2003) ,虽然可以帮助我们更多地了解所处的环境对于个人行为的影响,但是它仍然把个人作为抽样终端,所以仍然回答不了上述的疑问。换言之,如果不发展现有的随机抽样方法,那么再高级的统计技术也仍然无法弥补把“单独个人”错当作“社会中人”、把人的简单相加错当成“社会”这两大失误。
这其实是统计学的一个缺失,它还没有给我们社会科学家提供一个适用的工具,来反映我们所需要的“社会中人”与“社会”的可量化的抽样手段。但是反过来说,这也是因为我们社会科学的主流长期以来仅仅是跟着统计学的屁股跑(4) ,过于迷信随机抽样这个技术手段及其所谓的代表性,丧失了我们的主体性。结果,这两个学科共同陷入了固步自封。
我们为什么不可以按照家庭、亲友圈、社区、群体、阶层、民族等等人类社会的其他单位来进行随机抽样呢? 或者说,作为定量研究的社会科学家,我们认为究竟是什么样的基本单位共同组成了“中国社会”这个总体呢? 至少在社会科学界,笔者没有看到“所有个人直接组成社会”这样的论述,因此如果我们坚持随机抽样到个人,实在是没有什么意思。
国际上有一些学者在调查家庭情况的时候,把家庭作为抽样终端,然后抽取其中的一个人来表述整个家庭(而不是仅仅他自己)的情况。这并不仅仅是由于他们的研究目标是家庭,而在于他们落实了“家庭是社会的细胞”这一社会科学的经典命题。这启发我们应该努力去寻找更加合适的终端以及寻找它们的随机抽样方法。
就此,笔者贸然提出自己的一些建议,哪怕目前还做不到操作化也罢。
我们可以考虑把随机抽样的终端从“个人”扩大到各种层次上的“社会基本单位”,对某些“社会的总体”进行测量。沿着这样的视角,相信我们社会科学可以促进统计学去发展随机抽样的理论与方法,甚至社会科学自己领先一步也还是有可能的。
例如,如果我们希望调查“中国人的流动机制”这样一个问题,那么我们完全可以把随机抽样的终端确定为全国的数百个社区,在每个社区里不再随机抽取任何个人,也不再使用仅仅针对个人情况的问卷,而是使用专门为此而设计的问卷,找到数个“关键知情人”,请他们来讲述作为一个整体的这个社区的人口流动的机制。
这样,我们通过统计分析这数百个社区的资料,同样可以得出具有代表性的量化认知。只不过这时候的总体已经不再是“中国总人口(所有个人) ”,而是“中国的所有社区”。显然,后一个总体更加符合我们社会科学的研究需要。
二、抽样框:从追求代表性走向力争信息无限丰富
众所周知,中国目前现存的、足以据此划分人群的统计资料非常缺乏,再加上许多人群都是分散的或者隐蔽的,因此也就无法得到他们的抽样框, 无法对他们进行随机抽样(边燕杰等,2001) 。结果,我们现在所说的任何一个范围之内的随机抽样,实际上只不过是跟着现有的统计资料(例如人口普查数据)所拥有的那些指标走,其抽样结果及其代表性都是人口学意义上的各式各样的“总人口”,而不是社会学意义上的阶层、群体、人群。
这种情况往往被视为随机抽样方法的局限性,甚至被反过来认为是社会学家的局限性,认为社会学家应该努力去建立这样的按照人群来制定的抽样框。
可是,除了特定的人口学指标所代表的“总人口”之外,我们真的能够建立起对于任何一种符合社会科学定义的人群的抽样框吗? 作为中国社会学的主要分支学科之一的社会分层研究,重要的产出之一其实就是要确定各种人群的分类指标,而这些新指标一定是各种现存的人口学资料里所没有的。所以,如果我们希望使用随机抽样的方法来调查任何一种社会人群,那么在逻
辑上就讲不通。也就是说,虽然我们可以在人口学的抽样框中使用随机抽样调查来确定我们希望了解的某个人群的分类标准是什么,却无法根据这样的分类标准去建立一个抽样框再进行随机抽样去调查这个人群。例如,我们可以随机抽样地调查出“当今中国的工人”究竟应该如何划分,却无法随机抽样地去调查我们所划分出来的“当今中国的工人”。
即使将来的总人口统计资料中的可分类指标无限地丰富了,也仍然解决不了这个逻辑上的矛盾。其中的道理只有一个:社会科学所要研究的一切目标人群,都不是天然地、客观地存在着,也不是自发地、人口学意义上地产生出来,然后等着我们去调查。它们其实只不过是我们社会科学的研究成果所建构出来的。
因此,现有的统计资料其实根本无法给我们提供任何可用的抽样框。或者反过来说,只要我们仍然沿用目前的随机抽样的方法,那么社会科学就会永远跟着社会既有框架亦步亦趋。
最近在国际上出现而且正在引进中国的“被访者推动抽样方法”(5) ,就是试图解决“在没有抽样框的情况下如果抽取有代表性的样本”这个根本问题。
笔者不讨论这个具体抽样方法,而是从该方法中提出一个相反的思路:既然没有抽样框,那么我们社会科学家为什么一定要去追求“代表性”这个目标,而不是去寻求“某个研究对象的信息的无限丰富性”呢? 也就是说,对于我们社会科学来说,最重要的认知是什么? 仅仅是各种已知的情况在总体中究竟占了多大的比例,还是在总体中究竟存在着多少种与什么样的未知情况?(6)
前一个目标仅仅是“测量”,后一个目标却是“发现”。笔者以为,“发现”才是社会科学家更擅长完成的任务,也是社会科学区别于统计学的安身立命之本。
如果这一命题足以成立,那么我们社会科学家也许就可以这样做:在随机抽样的各个抽样层次中,坚持寻找抽样框,坚持使用随机抽样方法。但是在末端抽样层次上,我们改为使用“信息饱和”的抽样方法。(7)
随着电脑辅助调查方法的日臻成熟,使得这种抽样方法的可操作性极大地提高了。( 8)
例如,在全国调查中,我们可以坚持随机抽样到社区,但是在社区内却并不一定要随机抽样到个人,而是使用“最大差异”抽样法(9)来寻找被访者。如是,我们在数百个社区里所获得的信息,就足以汇总为具有全国地理分布代表性的“最丰富的信息”或者“相对饱和的信息”,而不仅仅是各种绝对数与比例。这,可能才是社会科学最需要的。
笔者在这里仅仅是提出一个新的思路,因此就不在操作的层次上展开了。
三、代表性:从“抽象人”走向“社会人”
“随机抽样足以代表总体”这个命题,其实是说,只有把所抽取的个人作为一个“抽象的人”(整体的计量单位)来统计的时候,这些人才能够代表总体。反之,如果我们把这些人进行任何一种分类,那么对于其中任何一个分类的统计结果就不再具有代表性了(卢山, 2004) 。
例如“性别”这个变量,在我们的随机抽样样本中与在中国总人口中,男女的比例都是大约各半。这当然足以代表中国总人口的状况。但是分别来看,其中的那大约50%的男人或者女人,却并不能代表中国所有的男人或者女人,因为我们并没有把男人与女人分开,单独地对每个性别进行随机抽样。
可是,社会科学里从来也不存在仅仅作为计量单位的“抽象的人”;从来都是把人进行各种分类之后再进行统计的。结果,当我们千辛万苦地做完随机抽样,追求到一个“总体代表性”之后却发现:不管我们说“男人是什么情况”还是“女人是什么情况”其实都是不具有代表性的,而且无论我们讨论哪个社会分层的情况都是这样的。那我们为什么还要费劲儿地进行随机抽样呢?
尤其是,我们社会科学研究的本质特征不是单变量统计,而是进行相关分析。( 10)那么,我们怎么能够认定我们所引入分析的那些相关变量中的各个分类也具有代表性呢? 例如,我们的统计结果是“农民的性别与是否进城打工存在着相关关系”(男农民进城打工的更多) ,可是这一发现却既不能代表“男农民”这个总体,也不能代表“进城打工者”这个总体。结果,我们根本就无法论证我们所发现的这种相关关系具有任何普适性。
统计学的解决方法是进行分层抽样。在社会科学可操作的意义上,就是在末端抽样层次(通常是社区)中,我们应该努力地按照社会学最珍视的“五朵金花”(性别、年龄、文化程度、职业、收入) ,尽可能多地进行分层抽样而不是简单随机抽样。
可是,且不谈操作可能性,问题在于,即使这样分层抽样出来的样本,也仍然是仅仅在“抽象人”的意义上具有代表性,只不过所代表的是一个分层的总体而不是更上一级的总体。可是在分层样本的任何行为或者事实的层次上,我们的调查结果仍然不具有代表性。也就是说,如果我们要调查的问题足够深入,又追求统计结果的代表性,那么我们就必须不断地分层下去,直到我们陷入“把调查目标作为自己的分层抽样指标”这样的泥坑为止。
总之,随机抽样其实只是使我们获得了调查地点的地理分布的随机性与该调查地点内的个人分布的随机性;可是在该调查地点内,我们社会科学所最需要的、调查样本的各种社会属性的代表性,却基本上无法获得。
因此,社会科学应该择其优而弃其劣。笔者提出一个新的思路,暂不做操作方法的展开。在一个相当小的末级抽样层次(例如万人口的社区)中,如果仅仅抽取很少的人(例如有的全国调查在每个社区仅抽取10人) ,那么我们采用细致的分层比例分配抽样法(11) 而不是随机抽样法,所损失的仅仅是“抽象人”对于末端抽样层次的完全代表性,所获得的却是具有分层属性的“社会人”的可保证数量,同时保留了调查地点的地理分布的随机性。
当然,统计学肯定有无数方法来论证这种抽样方法的“失”, (12) 但是社会科学也有充分的本学科理由来看重它的“得”。问题仅仅在于我们社会科学应该在这一点上与统计学展开充分对话,而不是削足适履。
四、代表什么? 从“总体”走向“整体”
随机抽样的最大作用,就是足以代表某个总体,可是笔者对它的根本质疑也是由此而生。这可以分为两个层次来看。
在技术的层次上,无论我们在上述的各个方面做出多么大的发展;我们所获得的所谓“总体状况”,其实还是把众多的局部情况进行相加而得到的。一切随机抽样技术与加权技术都不能改变这一性质。
可是,系统论认为“整体大于部分之和”,而且整体与部分之间的关系并不是简单相加,而是有机合成(贝塔朗菲, 1987; 黄欣荣, 2004 ) 。因此,如果说随机抽样的结果确实足以代表客观事物的某个总体的状况,那么把它运用于任何由人类及其活动所组成的总体的时候,难道就不需要任何修订吗? 或者说,如果系统论已经对随机抽样的理论根基提出了挑战,那么社会科学也就应该以反思与发展来代替对它的顶礼膜拜了。
进一步从认识论的层次来看,社会科学最需要研究的恐怕并不是任何一种统计学意义上的总体,而是某个作为社会存在的整体。这仅仅是因为前者往往并不真实存在而仅仅是研究者的建构产物(13) ,而后者却是社会科学最主要的研究对象(14) 。
随着“整体研究”的视角在我国得到越来越多的介绍与提倡(郇建立, 2001;王宁, 2002;刘中起、风笑天, 2002;刘军, 2006;刘水林, 2006;张天上, 2006) ,我们社会科学不得不从系统论的高度来反思随机抽样。
社会科学家应该清醒地意识到:如果统计学暂时还不能给我们拿出一个系统论指导下的、足以反映整体状况(而不仅仅是总体)的随机抽样方法来(杨心恒、顾金土, 2000) ,那么我们也就不应该简单地排斥各种非随机抽样方法。我们恰恰应该反过来好好研究一下:非随机抽样中究竟蕴含了一些什么值得发掘的内容? 它的抽样结果固然与“总体”无关,但是是否却有可能与“整体”有关呢?
例如,在关于“典型抽样”的争论中,我们社会科学不应该再把随机抽样奉为唯一的判断标准(王宁, 2002) ,而是应该深入讨论一下: 如果“典型”确实是出于对“整体”的准确认识而选定的,那么它对于“整体”的表现性是否反而更强一些呢? 这种“表现性”是否可以进一步建构为“对于整体(而不是总体)的质的代表性”呢? 如果回答都是肯定的,那么我们就可以进一步研究典型抽样与随机抽样之间的关系,无论是把两者组合、结合、整合还是融合,或者论证出其不可能,都将是社会科学的原创性的贡献。
五、小结与引申
本文不是为了颠覆,而是为了深入;说白了其实就是一句话: 我们不是随机抽样方法的奴隶,而是它的园丁。
从技术的层次上说,社会科学应该创造出符合自己需要的新方法;从认识论的层次上,我们则应该把随机抽样灌输给我们的还原论的世界观与方法论,努力推向整体论与系统论的新阶段(15) 。笔者的价值取向也已经在本文中表露无遗:社会科学应该作为主体,发出基于自己立场与利益的“非科学的”声音。
操作的困难其实并不是一个真问题。如果我们具有了清晰的认识,那么总会朝着那个方向迈出一步的。
归根结底,笔者所设想的一切技术上的发展方向,其实都潜含着这样一个意思:
虽然统计学有充足的理由把随机抽样视为不可分割的一竿子插到底的连贯过程(李金昌,2004) ,但是社会科学也有充分的理由与需求把它分而治之。也就是说,以末段抽样层次为界,前此的随机抽样保证了样本的地理分布的随机性,而此后的非随机抽样则保证了社会科学足以收集到自己所最需要的信息。这样划分的两阶段抽样方法,不但不是水火不相容的,而且可能是最符合我们社会科学的理念与需求、最足以表现社会科学特色的一种途径。
由此引申出笔者的另外一个方法论上的意思则是:所谓“定量调查就一定要随机抽样到底,定性调查就根本不需要随机抽样”(16) 其实是一个误区,是把“要获得什么性质的资料”与“该资料是否应该有代表性”这两个问题给混淆起来了。
国内已有学者对后一个问题给予肯定的回答(王宁, 2007) ,笔者则进一步认为,社会科学应该发展的方法是:定量调查舍弃末段抽样层次的代表性,而定性调查则把自己所处的时空(而不是其调查内容)视为一个随机抽样的末段抽样层次,依据上级层次的随机抽样结果来确定本调查的时空;即使仅有一个个案也是如此。这样,无论定量调查还是定性调查,都足以获得末段抽样层次之上的某一级别的总体的代表性。这不仅可能是社会科学的特色,而且可以化解这方面的虚构的“定量与定性之争”。
总之,如何发展随机抽样的探讨,可以促进社会科学从技术层次与方法论的层次上,从“代表总体”提高到“表现整体”;更好地发挥自己在更高层次上对于抽样方法的整合性。
注释:
(1)笔者在自己的调查经历中,曾经出现过本文所指出的一切失误,而且恰恰是因此才有了本文。
(2)例如《中学数学参与式教师培训教程》中就要求使学生“以随机的观点来理解世界,形成正确的世界观与方法论”。首都师范大学出版社, 2003年1月。
(3)虽然有学者论述了非随机抽样的必要性甚至是优势,但是仍然局限在技术层次上,例如陈元江《对非随机抽样的思考》,《中国统计》2004年第12期;刘冰《非随机抽样与随机抽样的比较优势》,《辽宁行政学院学报》2006年第1期。
(4)在中国社会学界,把社会学研究方法的探讨混同于统计技术的照搬,也司空见惯。
(5)受访者推动抽样(RDS)方法,是在传统“雪球抽样”方法的基础上,结合社会网络分析的理论和方法,使研究者有可能根据样本对总体特征做出合理的推论(赵延东、Jon Pedersen, 2007) 。
(6)定量调查可以实现前一个目标,却无法实现后一个目标,只能使用定性调查的方法。在当下的我国社会调查实践中,这一认识并不普及,反而常常以为问卷也能调查自己所不知道的情况。这是一个很初级的但是很常见的误解。参见,潘绥铭, 2008,《“元假设”: 社会调查问卷的灵魂》,《学术界》第3期。
(7)这种抽样方法考虑的主要问题和原则是“新的个案是否会增加新的信息”(Douglas, 2003) ,也有人概括为考虑资料是否达到了“理论上的饱和”( Strauss & Corbin, 1998, p1212) 。
(8)如果使用笔记本电脑进行调查,就可以随时知道已有数据的统计结果,据此判断“信息饱和”的程度,并随时完善原来的抽样方案。
(9)“最大差异抽样法”是笔者设想的实施“信息饱和抽样法”的不成熟方案,就是在分层的基础上,按照本研究最需要的某项可获知的社会特征指标,方便地寻找第一个样本,然后从正反两个方向出发,寻找与其存在最大差异的样本。这种方法不具有总体代表性,但是却可能实现“样本的最大限度多样性”。可以参见其最初设计:潘绥铭, 1995,《性与家庭社会学研究及其应用》,载于:李强主编《应用社会学》(第一版)第10章,中国人民大学出版社。
(10)这一点,作为社会学界的主流认识,就不再直接引用文献了。
(11)统计学对这种方法多有论述,不再赘述。笔者仅仅是质疑把它与随机抽样对立起来的思维。
(12)在统计学中,对此有非常详细的论述,笔者不再直接引用文献。
(13)例如,笔者曾经两次随机抽样调查过的“中国总人口”其实是居住在除去港澳台的中国境内的、懂汉语的所有人。其他学者的定义则与笔者不同。这些定义都是我们根据自己的研究目的而建构出来的,决不意味着确实存在着这样的中国人总体,更不意味着他们就一定能够形成“中国人”这个整体。
(14)这应该说是我国社会学界的主流认识,因此不再直接引用文献。
(15)还原论、整体论、系统论之间的争论,本文暂不涉及。
(16)这种认识虽然不见诸于学术成果,却在研究实践中屡见不鲜。
参考文献: (实引,按照发表的年头)
[ 1 ]贝塔朗菲1一般系统论:基础、发展和应用[M ]1北京:清华大学出版社, 19871
[ 2 ]陈膺强1应用抽样调查[M ]1香港:商务出版社,19931
[ 3 ] Joseph Maxwell, Decisions About Samp ling, 1996:69 - 73, in Qualitative Research Design, Sage Publi2cations1
[ 4 ]Marshall, MN1Samp ling for qualitative research,Family Practice, 1996; 13: 522 - 5251
[ 5 ]刘少杰1社会学思维方式的变革[ J ] 1吉林大学学报11998, (3) 1
[ 6 ]林彬、王文韬1对当代中国社会学经验研究及研究方法的分析与反思[ J ] 1 社会学研究12000,(6) 1
[ 7 ]谢俊贵1关于社会现象定量研究的简要评析[ J ]1湖南师范大学学报12000, (4) 1
[ 8 ]边燕杰等1华人社会的调查研究———方法与发现[ J ]1香港:牛津大学出版社120011
[ 9 ]郇建立1 个体主义+整体主义=结构化理论? ———西方社会学研究的方法论述评[ J ] 1北京科技大学学报(社会科学版) 12001, (1) 1
[ 10 ]车文辉1论现代社会调查研究及其方法的创新[ J ]1湖南师范大学学报12002, (6) 1
[ 11 ]段培君1方法论个体主义与分析传统[ J ] 1自然辩证法通讯12002, (6) 1
[ 12 ]刘中起、风笑天1整体的“社会事实”与个体的“社会行动”———关于迪尔凯姆与韦伯社会学方法论的逻辑基点比较[ J ]1社会科学辑刊12002,
(2) 1
[ 13 ]王宁1个体主义与整体主义对立的新思考——社会研究方法论的基本问题之一[ J ] 1中山大学学报12002, (2) 1
[ 14 ]王宁1代表性还是典型性———个案的属性与个案研究方法的逻辑[ J ]1社会学研究12002, (5) 1
[ 15 ]王小章1社会的客观知识是否有效及如何可能[ J ]1社会学研究12002, (3) 1
[ 16 ]胡仕勇、叶海波1操作化流程及其在社会研究中的应用探讨[ J ] 1武汉理工大学学报12003,(5) 1
[ 17 ]黄欣荣1贝塔朗菲与复杂性范式的兴起[ J ] 1科学技术与辩证法12004, (4) 1
[ 18 ]卢山1走出事后分层应用的误区[ J ] 1中国统计12004, (3) 1
[ 19 ]李金昌1确立抽样调查主体地位建立现代抽样调查制度[ J ]1统计与信息论坛12004, (3) 1
[ 20 ]风笑天1社会学研究方法:走向规范化与本土化所面临的任务[ J ]1华中师范大学学报12005,(6) 1
[ 21 ]骆玲1西方社会学研究方法论的评价及应用[ J ]1社会科学研究12005, (3) 1
[ 22 ]边燕杰、李路路、蔡禾1社会调查方法和技术:中国实践[ J ]1社会科学文献出版社, 20061
[ 23 ]张天上1整体主义方法论检讨———读卡尔·博兰尼: <巨变:当代政治、经济的起源> [ J ] 1学术中国1http: / /www1xschina1org/ show1php? id= 76151
[ 24 ]潘绥铭,张娜,黄盈盈1网站调查与实地调查的实证对比研究:样本偏差程度及其方法论意义[ J ]1江淮论坛12009, (4) 1
[ 25 ]王宁1个案研究的代表性问题与抽样逻辑[ J ]1甘肃社会科学12007, (5) 1
