2021-11-30
易表达是一家专为个人和企业用户解决数据收集及管理分析的互联网公司。作为技术驱动型公司,从表单/问卷创建、发布、管理、数据收集到分析服务,易表达致力于为用户提供快捷高效的用户使用体验,优质的服务是我们一直追求的目标。
在问卷调查中会出现这样的样本,很多个量表题都选择同一个答案(比如‘同意’)。也或者填空年龄,结果出现一个数字110。类似这样的都属于无效,应该进行处理。
如果对无效样本不进行处理,肯定会导致分析出现问题。因此在做好各种防范后,还需要在数据收集完成后对数据无效性进行处理。那么,接下来易表达的小编跟大家聊聊:什么是无效样本呢?无效样本我们该如何处理呢?接下来以SPSSAU无效样本和异常值处理这两个功能点进行说明。
1.无效样本
首先,我们可通过在线分享工具——SPSSAU提供的无效样本处理功能进行无效样本筛查分析。
SPSSAU提供两种情况的无效样本设置:第一种是完全相同数字超过一定比例时设置成无效样本。不认真填写者通常有个特别是完全选择相同的答案,一般以量表题选择相同数字超过70%作为标准。
性别、学历这种是样本本身的属性,到底是男还是女,无法测试。所以一般选中问卷中的所有量表题,比如30道题表题,30个量表题中70%都是相同数字,意味着21个题都选择同样一个答案,这种一般就算无效样本。这里70%是常见处理方式,当然也可以设置成60%或者80%的标准。
除了相同数字识别成无效样本,SPSSAU还提供缺失样本比例超过某数字后,也设置成无效样本。如果一大堆答案都不选择,那肯定也属于无效。具体有多少比例的答案没有做出回答算成无效,没有固定的标准,一般70%以上肯定是无效样本。
设置好无效样本后,默认会新生成一个标题,用来标识那些样本是有效,那些是无效,在分析的时候直接进行筛选下就好。
2.异常值
除上述无效样本外,还有一种情况是异常值也需要特别注意,比如有一个题是问年龄,样本回答为1岁,那肯定这个数字是有问题的,有可能填写者没有看清楚,也或者看清楚了写错了,也可能乱填,都有可能。
无论如何,当出现此种情况下都需要进行处理。SPSSAU数据处理里面的异常值功能可进行设置,并且提供多种选项处理方式等。
异常值的判断标准上,可按数字为null即‘缺失数字’当成是异常值,也可以设置在某个范围的数字(比如年龄大于100或小于0)为异常值,当然还有一种标准是数据超过3个标准差当成异常值。
异常值标准设定后,具体如何处理,正常情况下是设置成null值。当然也可以考虑进行填补,用正常的数据特征(比如平均值)去填补异常数据。具体情况视研究者偏好而定,没有固定的标准。
本文针对问卷无效样本的防范,以及通过SPSSAU对无效样本进行处理进行说明。除此之外还特别提示大家,如果问卷是量表题,多做信度和效度分析等,利用科学的研究方法进行分析,这样才具有说服力,数据是否真实可靠,问卷设计是否规范,不是个人说了算,而是通过科学的研究结论进行论证。