Université de Pékin

社会调查与研究方法, 首先,是一套观察社会现象、测量社会现象的工具; 其次,是一套分析和运用社会现象数据的科学方法; 最高境界,则是一套针对社会、经济、教育、政治、法律、管理、公共卫生、新闻报道等人类的生产与生活现象,进行科学沟通的思维逻辑与表达方式。

经济且有效地获取研究数据的方法之一是抽样调查。本周讨论另一个非常重要的议题:抽样。主要内容包括:什么是抽样?抽样有哪些基本要素,需要遵循什么逻辑?抽样误差有哪些来源?如何才能减少抽样误差?概率抽样和非概率抽样分别有哪些类型?各自适用于什么样的情境?如何选择、设计并实施一个抽样方案?

即使有很好的抽样方案,如果不落到实处还是没有样本。 抽样的实施一般来讲,根据抽样方案按照研究设计做就行了。 听起来很简单,不过千万别大意。 获得样本真的是一个非常艰难的过程。举一个例子,制备CFPS抽样框的时候, 我们做过多次测试。其中有一次,我们到西局, 北京西站附近的一个社区,那儿离北京市长途汽车站非常近,租房子的人呢比较多。 走近一个大院只有一个门儿, 看起来是一户人家。可是进门以后却发现,两边各有八间房都是出租的。 怎么办?到底算一家人还是算17家人? 在抽样实施中,有时候不是那么简单,不是简单地按照方案做就行了。 方案永远都是一个未定的方案,不可能把所有的复杂性和变异性都纳入考量。 尽管如此,方案还是抽样实施的指南,抽样实施就是按照 抽样方案或者抽样实施方案 获得样本的过程。不管是简单抽样还是复杂抽样,一次抽样还是多次 抽样,没有落到地上的抽样,没有实施的抽样都只是纸上谈兵。 再说刚才的例子,我们设计的很好,按门来,一门一户,可是遇到西局的情况就得具体处理。 在实践中还有更复杂的。大家知道在北京市西城区的辅方桥, 大部分都是四合院儿。我们就遇到一个情况,初看的确也是一个四合院儿, 跟别的四合院儿不一样的地方就在于它 是一个两层楼的四合院儿。在第二层上有一个门儿, 打开门就是一个楼梯,走下楼梯后面还有 一个院子。这个院子呢也只有这一个进出口,没有别的进出口。 不打开这扇门,后面的院子就漏掉了。 因此抽样设计,抽样方案,实施方案一定要落到地上。 从例子中我们看到,实施也是控制误差的重要环节。 为了便于操作我根据自己的经验, 概括了抽样实施的五个步骤供大家参考: 第一,正确地理解方案,制定每一个环节的实施方案。 抽样方案只是指引,指南,索引,在实践中在操作中还需要 实施方案。第二呢?组织资源。比如人力,社会关系,设备,后勤保障等等。 稍稍大一点的调查就得请人,请学生,请朋友,怎么计酬,怎么支付这就是后勤问题。 后勤对社会调查与研究也非常重要。 第三,培训抽样人员,督导人员,后勤人员。把实施中可能遇到的问题讲透彻, 把合作与分工讲透彻,让每一个人明确的知道自己到底要干什么。 第四,逐步实施。一般来讲,前三步工作做完以后就一步一步地实施, 先从制作抽样框开始,再抽样, 最后再做质量检验和误差估计。 举一个例子,末端抽样框的例子,CFPS的例子。 我在组织CFPS的时候根据中国国情做了一套末端抽样方法, 《地图地址抽样框制备手册》。 这是我们综合了已有的末端抽样框制作方法创造的一个方法。 比如说,我们根据测试阶段遇到的情况,列出了在制做末端 抽样框的时候,如果遇到了一宅多户和一户多宅怎么处理? 边界怎么界定? 无法确定是否是住宅时怎么处理?以及大社区如何拆分等等。 在抽样实施中,每一个抽样都有自己的特异性, 不过呢?也有一些常见的错误提出来希望大家能够避免。 第一类错误,理解类的错误。 对设计理解不太准确。比如说,CFPS的家户,到底什么是 家户?CFPS对家户有很严格的定义,一般情况下,操作人员认真看定义可能还会有不明白- 的地方。 如果按照不明白的理解去做,就会带来误差。 更严重的是根本不看定义,按照自己的日常生活中的理解, 就一定会带来误差。 为了避免误差操作人员一定要认真阅读操作说明,不明白的一定要问,问明白问清楚再操作。 第二类,操作类的误差。如果理解上没有问题,操作中的误差常常有两类。第一, 马虎。比如,遗漏了一宅多户中的户;一户多人中的人。 第二,作弊。比如由于执行的困难,故意作弊或者臆想。 调查点如果很远不想去,就自己随意的想象了。 在制作CFPS末端抽样框的阶段,我在甘肃省核查的时候去了一个村子。 这个村子明明有73户人家,结果 绘图员在图上只标明了56户。 我问还有十多户上哪去了? 我到村子里拿着图一步一步地看,发现绘图员把距村子大概有半米路远的一个小聚居给弄丢了, 正好是十多户,这就叫作弊。因为执行的困难而作弊。 当然还有一些经验也可以与大家分享。在 抽样的实施中,多问自己几个问题。第一,总体到底有多大? 到底多大范围的调查? 第二,研究总体在哪里?有哪些会影响到对调查对象的识别? 第三,有没有可用的抽样框?比如说,有没有可能让执行人提供一个抽样框? 如果没有怎么制备抽样框? 第四,选择什么样的抽样方法可以减少误差?第五,执行的难点 到底是什么?怎么样去组织资源能够使得我花最少的钱最有效地办事儿? 其中最重要的一条经验就是多沟通。 与相关各方尽可能就抽样设计, 抽样实施的目标达成一致。这就是经验之谈。 不要怕多事儿,尽量地沟通,有错误有误差说在明处, 总比最后再实施以后做辨解要来得容易的多。 下面对这一节的内容做一个小结: 抽样的实施,在实践中是科学与管理的结合。既要理解抽样设计的每一个环节, 又要依照设计,在每一个环节有效地执行。 因此,就抽样实施而言,不仅对智商提出了要求,也对情商提出了要求。同样呢, 抽样实施也是各方妥协的过程。对于减少抽样误差减少设计误差非常 重要。沟通是解决各种问题的根本之道。这节的内容就到这里。 下边我们对这周的内容做一个归纳: 这一周的内容非常多,相信同学们一定疲惫了。不过呢我们还是要做一个小结。 我们不做繁复地概括了,在更抽象的层次上把不同内容之间的逻辑串联一下。 总体要素的同质性和异质性,为抽样提供了基本的条件; 抽样估计的经济性,为抽样提供了充分的理由。 用样本估计总体的基本原理来自于等概率原理; 最重要的原则,就是尽量减少误差。抽样策略,抽样方法的运用都需要在经济性 和减少误差之间达成平衡。 如果变异性满足随机性原则,就可以运用概率抽样方法, 每一种方法的应用情景,要根据总体规模, 异质性的程度,变量的多寡而定,在大规模抽样中,灵活运用多种方法,是减少成本 减少抽样误差的有效方法。 如果变异性不满足随机性原则, 就可以运用非概率抽样方法。对一些稀有的研究对象, 可以采用特殊的抽样方法,但还是要注意的是,非概率 抽样中,某些阶段也可以运用等概率原理。 任何抽样一定要有一份抽样方案的文本。 不仅通过对抽样设计的完善来降低成本减少误差, 也为抽样实施提供指南。 抽样实施,既需要充分理解设计意图,也需要结合实际情况 灵活处理。选这类研究实践的同学这周的课程结束以后,就要把自己的研究题目 假设要通过抽样来搜集数据进行处理, 选择抽样策略,选择抽样方法,并且纂写抽样方案。 这一周的内容就到这里, 谢谢大家!