综合市场调查理论和实践经验,拓索(中国)对调查中出现的误差做如下的概况(见下图)。
(1)抽样误差
抽样过程中主要存在着以下两类误差:随机误差和系统误差。有时也称为偏差。调查中通常试图对目标总体中具有代表性的一个侧面进行调查而获得信息。它旨在根据抽取样本的调查结果而推测总体的情况。因此,即使样本选择过程是适当的,调查结果仍不免因偶然性而产生一定的误差(随机误差或随机抽样误差),这种误差是不可避免的,它只能随着抽样规模的增加而减小。通常在样本量设计时,我们可以以一定的置信水平来估计随机抽样的误差。
(2)系统误差
系统误差或偏差是指因调研设计或实施抽样设计中的错误或问题而产生的误差。如果抽样的结果与我们根据被调查对象的真实值所做的估计值总是有一定的偏差(固定的偏高或偏低),则抽样结果便很有可能存在系统误差。系统误差包括除随机抽样之外所有可能产生的误差。因此,有时系统误差又被称为非抽样误差,从系统上影响抽样调研的结果。非抽样误差分为样本设计误差和测量误差。样本设计误差是因样本设计或样本抽选过程而产生的误差。
样本设计误差的产生有多种原因:
抽样框误差 -抽样框是指对于某一类人口类型和成员的一个总体清单。样本将从这个总体清单中加以选取。抽样框误差便是因不准确或不完整的抽样框而引起的误差。问题是,从包含抽样误差的抽样框中抽取的样本有时无法正确地代表调研目标的实际情况,这就存在抽样框误差。举个例子,以电话号码薄作为抽样框,在对某地区所有住户进行的某种意向调查时,就存在着抽样框误差。
调研对象范围误差 -调研对象范围误差是因为对调研对象范围限定的不准确而引起的误差。例如,我们将某项研究对象限定在 35 岁以上,后来,我们发现不少 35 岁以下的年轻人也应该包含在这个研究之中,即当初的我们的限定范围是不正确的,这样的抽样便产生了误差。
选样误差 -即使抽样框的组建与调研对象范围的确定都没有什么问题,抽样误差也有可能发生。抽选误差是因为不完整或不恰当的抽选过程,或者正确的抽选过程未得以恰当的执行而产生的误差。例如,在入户调查时,访问员会因为不同的原因绕开被认为是“不友好的”住户,这样的话便会产生选样误差。特别是在非随机抽样中,选样误差是一个更为严重的问题。
(3)测量误差
测量误差对于抽样调查的准确性来说,比随机误差更具危害性。在许多调查报告中,包括媒介上发布公众意向调查,都会给出一个误差指数。对很多调研报告使用者来说,一般认为这个指数是针对总体误差而言,其实并非如此。这个数字仅代表随机抽样误差,它并不包括样本设计误差,也没有涉及调研结果中的测量误差。
测量误差是指所获得的原始信息(实际价值)与经测量处理的信息之间的差异。在信息处理过程中会因多种因素而产生测量误差。
替代信息误差 -是指实际所需的信息与调研者所收集信息之间的差距而产生的误差。这种误差与调研设计的主要问题有关,特别是对一些问题不恰当定义而产生的。
调研员误差 -是指因调研员与被调研者之间的相互作用而引起的误差。调研员有时会自觉或不自觉地影响被调研者,使之给出不真实或不准确的回答。
测量工具误差 -测量工具误差是指因测量工具或问卷而产生的误差。这种误差是由于所提出的问题或问卷设计中的某些因素而导致回答的偏差或者使回答时容易产生错误。这种类型的错误能够通过细致的问卷修改和在实地调研前进行充分的试调查而加以避免。
数据处理误差 -主要是指调研资料或调研数据在向计算机输入过程中所产生的误差。例如,在计算机辅助电话访谈中,访问员可能错误地输入某个问题的答案。这类错误可以通过在数据录入以及调研结果处理过程中严格的质量控制加以避免。
拒访误差 -如果我们从某个特定群体中抽选 400 个样本,理想的情况是对这 400 个样本都进行调查。而在实际中,这是很难实现的。在邮寄调研中,回答率一般在 5% 左右,甚至更低。因这种差异而引起的误差被称为“拒访误差”。很明显,回答率越高,拒访误差的影响便越小,因为拒访者在总体中占的比例减小了。
拒访误差在以下三种情况下发生:①在特定时间无法联系到被访者;②虽然得到了默许,但在当时的环境下不能或不愿意接受访谈;③虽然能够联系到被访者,但被访者拒绝接受访问。其中,最后一种情况最为严重。因为,前两种情况都有重新进行调研的可能。现在,拒访率已经达到了前所未有的水平,大约近 40% 。好在大部分人并非在所有情况下都拒绝访问。
回答误差 -如果被访问者在某一特定问题的回答中有特定的偏向,则产生回答误差。回答误差的产生有两种基本的形式:有意错误与无意错误。有意错误的产生是因为被调查者故意对所提问题做出不真实回答;无意错误是指回答者希望能够做出真实、准确的回答,但却给出了不正确的答案。这种类型的误差可能是由于问题的格式、内容或其他原因造成的。