1.重要发现

英格兰和威尔士电话犯罪调查(TCSEW)于2020年5月20日开始运作。该调查取代了因2019冠状病毒病(COVID-19)大流行而于2020年3月17日暂停的英格兰和威尔士面对面犯罪调查。它的设立是为了衡量大流行期间的犯罪水平。由于大流行在整个2020/21调查年度持续存在,人们提出了关于截至2021年3月的年度TCSEW是否与前些年面对面CSEW得出的估计数具有可比性的问题。

本报告探讨了那些可能影响临时政府间咨委会和前临时政府间咨委会估计数可比性的因素。包括调查设计、样本设计、问卷变更和模态变更。

它的结论是,主要的罪行量度(过去12个月的事件数目和流行率)大致可比较,但所作的估计是基于下列基础:

  • 研究对象仅限于18岁及以上的人群
  • 犯罪的主要估计不得使用重叠的数据期
  • 威胁/骚扰筛选问题必须从主要犯罪估计的当前年份和比较年份中删除

应单独考虑从TCSEW上的调查问题收集的其他数据的可比性;尤其当社会期望的反应可能影响估计时,应考虑模态差异

TCSEW的背景

在2020年3月CSEW暂停后,国家统计局与犯罪调查承包商KANTAR一起启动了一项工作方案,以调查在冠状病毒大流行期间运营犯罪调查的替代方法。考虑了一系列备选方案。当时作出的许多决定都认为,任何替代CSEW调查工作的方案都是相对短暂的。由于面对面调查仍在暂停,电话调查在整个2020/21调查年度仍在进行,因此有可能与较早调查年份的数据进行比较。

回到目录

2.样本设计和可比性

英格兰和威尔士电话犯罪调查(TCSEW)的样本设计是根据什么是实际可行的,以及什么是理论上可行的决定的。考虑到调查的目的、准确性和实施所需的时间。最后一个因素很重要,因为面对面的调查已经暂停,没有考虑任何其他衡量犯罪的方法。

虽然样本设计最初考虑的是可达到的样本量,但需要考虑其他因素,包括来自新样本的任何额外偏差的可能性。虽然考虑了一系列策略,包括使用在线门户网站收集电话号码和远程匹配,但最终的设计是利用已经同意参加进一步研究的英格兰和威尔士犯罪调查(CSEW)的受访者。

总之,新样本是由所有前CSEW成人受访者组成的,他们同意在过去两年内重新联系并提供了一个语法有效的电话号码。由于估计约有4万例病例,我们知道这无法为TCSEW提供足够大的样本(2020年5月至2021年1月)。为了纠正这一点,TCSEW样本采用了类似于劳动力调查(LFS)等其他调查的面板设计(重复访谈)。这使得样品可以保存更长的时间。事实上,我们总共进行了36801次访谈,调查样本扩大到涵盖2020年5月至2021年3月的调查年度。

因此,TCSEW对截至2021年3月的一年的估计是基于对17167名18岁及以上人群的36801次电话采访得出的。受访者每三个月接受一次访谈,最多三次访谈(每次访谈称为一波)。第一波反应率为49.7%,第二波反应率为79.4%,第三波反应率为81.1%。

TCSEW的估计是基于访谈而不是受访者(与CSEW一样),这一区别反映在相关公布的表格中。因此,TCSEW上的标准误差要高于CSEW上的标准误差,因为它们是基于对同一个人的再次采访,而不是对一个人进行一次采访。实际上,一旦考虑原始样本地层和主要采样单元,TCSEW样本设计具有更强的聚类效应(因此标准误差更大)。

根据以前的受访者绘制样本意味着样本不是唯一的,实际上是原始样本中选择的家庭/个人的子集。在正常情况下,CSEW是基于每年都会变化的独特的个人样本。这意味着CSEW上的一个调查年份可以与下一个进行比较。如果样本不是唯一的,这是不可能的,因为任何两个相应的调查年所捕获的事件的时间段是重叠的。

上面的两张图代表了CSEW收集犯罪的参考时期和截至2020年3月的年份。接受采访的人会被问及他们在采访前12个月内经历过的任何事件。这意味着在连续两年的调查年中,收集事件的参考期间并非唯一的。

这不是CSEW的问题,因为不同年份的受访者不同。然而,由于TCSEW是由CSEW前两年的受访者组成的,该调查可能会重现同一个人记录的相同事件。因此,TCSEW只能与CSEW估计进行比较,其中收集事件的时间周期是完全独立的。因此,最近可以进行比较的年份是截至2019年3月的CSEW年度。

TCSEW样本也不同于正常的CSEW样本,因为受访者在抽样后都变老了。由于TCSEW样本来自前两年的CSEW(采访了所有16岁及以上的成年人),因此TCSEW样本中很少有18岁以下的人。因此,只有18岁及以上的人被选中参加TCSEW的面试。因此,为了能够比较TCSEW和CSEW, CSEW的分析需要限制在18岁及以上的人。

回到目录

3.抽样偏差和可比性

为了更好地理解从面对面调查转向电话调查的影响,最好是同时进行两项调查,以考虑季节性和社会变化的影响。这种类型的实验设计是不可能的,因为英格兰和威尔士犯罪调查(CSEW)在没有通知的情况下暂停了。

评估可比性的另一种方法是比较两项调查的样本组成,目的是了解一项调查与另一项调查之间可能存在何种偏差。CSEW和英格兰和威尔士电话犯罪调查(TCSEW)都使用了复杂的加权机制,旨在调整一系列因素,包括选择和不回应的概率。利用TCSEW抽样自CSEW这一事实,意味着面对面调查和电话调查之间的大部分非应答偏差可以使用额外的加权机制进行调整。这提高了TCSEW估算的可靠性及其与CSEW的可比性。

因此,所进行的分析比较了两次调查之间一系列人口和社会经济特征的加权和非加权分布。未加权分布给出了两个样本之间差异的一些想法,而加权分布表明一旦数据进行了调整,两个估计值之间的差异。分析中使用的变量的选择是基于这样的假设:在CSEW上的访谈时间和TCSEW上的访谈时间之间,它们不会发生变化(或变化很小)。使用适当的稳健标准误差和置信区间生成分布。由于几乎所有的受访者都回答了关于他们的特征的问题,这些变量的未加权基数很大,计算出来的估计值也很精确。因此,即使只有微小的差异也具有统计学意义。

除了已经提到的加权机制,CSEW和TCSEW都使用校准加权来调整地区和性别子群体之间的响应率差异。因此,这些变量的加权分布将具有可比性,因为它们采用相同的方法。这些变量的分析集中在未加权分布上,以了解与CSEW相比,TCSEW的差异无响应。

比较了截至2019年3月的CSEW数据和2020年5月至2021年3月期间第1、2和3波收集的TCSEW数据。还分析了多年的CSEW数据,以检查样本年份之间预期的正常变化以及调查测量的人口变化。

结果

分析表明,CSEW和TCSEW的样品组成相似。因此,这种偏差不太可能影响犯罪估计的可比性。这是因为:

  • 大多数个人和家庭特征在CSEW和TCSEW的加权分布之间没有显着差异
  • 虽然在TCSEW调查中,年龄较大的受访者比例较大,但这一差异已在权重中进行了调整
  • 虽然两个样本在婚姻状况、残疾和任期方面存在差异,但这些差异很小,或可能反映了社会的真实变化,因此不太可能对犯罪估计产生有意义的影响。

年龄、性别和地区

CSEW和TCSEW使用年龄、性别和地区人口总数作为校正权重,将样本调整为已知分布。尽管有此更正,但仍有必要了解两个来源之间未加权分布的差异,以突出调查覆盖面的差异。

与CSEW相比,TCSEW显示老年受访者的比例更高,而年轻受访者的比例较小(见图2)。在截至2019年3月的CSEW年度,37.4%的受访者年龄在60岁及以上。相比之下,这个年龄组在TCSEW样本中所占的比例要大得多,为50.8%。同样,12.1%的CSEW受访者年龄在18至29岁之间,而在TCSEW样本中,这一比例仅为6.3%。

两次调查在性别和地区的未加权分布上几乎没有变化。

个体社会人口学特征

两项调查收集的数据表明,调查的大多数个人特征的样本组成没有显著差异。在种族和宗教的加权分布之间没有统计学上的显著差异。这表明TCSEW对这些可能对发病率和受害估计产生影响的变量几乎没有偏见(见表1).

在婚姻状况方面,两个样本中唯一显示出显著差异的类别是“分居”的成年人。在截至2019年3月的CSEW年度,估计有1.9%的人口(置信区间:1.7%至2.0%)被分离。在截至2021年3月的TCSEW年度,这一比例较低,为1.5%(置信区间:1.4%至1.8%)。由于这一类别只占总体分布的一小部分,因此不太可能对犯罪估计产生任何有意义的影响。

两个样本在残疾方面有明显的显著差异。截至2019年3月的CSEW数据集估计,17.1%的人口(置信区间:16.6%至17.6%)是残疾人。这比TCSEW估计的19.2%低2.1个百分点(置信区间:18.5%至20.0%)。所使用的残疾定义与2010年《平等法》一致:如果一个人的身体或精神受损,对其进行正常日常活动的能力,包括精神健康状况,产生重大和长期的负面影响,则将其归类为残疾人。有证据表明,在冠状病毒(COVID-19)大流行期间,自我报告的心理健康和福祉恶化了,因此TCSEW样本中残疾成年人的比例更高可能反映了一种真实的变化,而不是样本偏见(COVID-19:心理健康和福祉监测报告).

家庭特征

家庭特征的加权分布相似,CSEW和TCSEW的样本组成变化不大。在地区类型(城市/农村)和家庭结构方面没有发现差异表2).

CSEW和TCSEW在保留期的样本组成上出现了微小的显著差异。在粤港澳地区,居住在自住物业的成年人比例更高,为65.5%(置信区间为64.5%至66.5%)。这比截至2019年3月的CSEW年度(62.9%)高出2.6个百分点(置信区间:62.2%至63.5%)。

与此相对应的是,在截至2019年3月的CSEW年度,私人租房者的比例下降了18.1%(置信区间:17.2%至19.0%),而在截至2019年3月的CSEW年度,这一比例为20.2%(置信区间:19.7%至20.8%)。社会租户的比例在两个样本之间保持相似,总体分布保持可比性(图3)。

研究表明,住在私人租赁住房的人比住在自住住房的人有更高的受害风险。在截至2020年3月的一年里,在过去12个月里,22%住在私人租赁住房的人经历过任何CSEW犯罪(包括欺诈和电脑滥用),相比之下,18.4%住在自住住房的人(截至2020年3月的年度趋势和人口统计表).总的来说,在TCSEW和CSEW之间观察到的终身教职构成的差异很小,CSEW在截至2020年3月的一年中测量的终身教职受害情况的差异也很小。虽然在统计上差异很大,但对估计的可能影响可以忽略不计。

虽然CSEW和TCSEW的样本之间存在差异,但它们似乎在应用于各自调查的权重系统中得到了很大程度的解释。这包括应用于TCSEW的额外权重,以补偿两个调查样本之间额外的无响应偏差。

回到目录

4.调查问卷的变化,包括增加一个关于骚扰问题的影响

作为建立英格兰和威尔士电话犯罪调查(TCSEW)的一部分,有必要考虑调查工具及其内容。影响这部分重新设计工作的三个重要因素:

  • 需要快速、无驾驶地重新设计测量仪器
  • 与面对面访谈相比,电话调查访谈的长度
  • 道德的考虑

TCSEW测量仪器的起点始终是现有的测量仪器,用于电话测量操作。从头重新设计测量仪器将花费时间和资源,而这些都是不可用的。这是由于无法运行任何形式的飞行员。

就电话业务而言,调查的总时长需要从平均约50分钟缩短至25分钟。因此,人们认为,调查应只提出提供犯罪关键估计值所需的问题(在冠状病毒(COVID-19)大流行期间和过去12个月期间调查记录的犯罪受害人数和患病率),或在大流行期间提供基本信息的问题。

出于伦理方面的考虑,最终问卷中省略了一些被认为在大流行期间足够重要的问题。因此,没有关于儿童期性侵犯、伴侣虐待或虐待的估计。这包括家庭虐待和家庭暴力的首选措施。

首先,英格兰和威尔士犯罪调查(CSEW)提供了受访者所经历的家庭和个人犯罪水平的估计。测量受害经历的问卷有两个阶段。首先,受访者在问卷的主要部分被问及一系列筛选问题,以评估他们是否曾是犯罪的受害者。筛选问题不会询问受访者是否曾是明确的犯罪类型的受害者,而是询问不同的经历,例如受访者在过去12个月里是否有任何东西被偷。这一设计确保了CSEW范围内的所有犯罪事件,包括相对轻微的犯罪事件。在筛选问题之后,那些受害者会被问及关于一系列受害者模块中究竟发生了什么的详细问题。

在筛选部分的最后,受访者通常会被问到:“除了你已经提到的事情之外,在这段时间里,有没有人以任何方式威胁你,让你感到害怕?”这一筛选问题自调查开始以来就被包括在调查中,尽管威胁本身不被考虑在CSEW犯罪范围内。

在大流行病开始时,有人猜测社会中的骚扰程度是否会增加。因此,决定将威胁问题改为“除了你已经提到的任何事情外,在此期间,是否有人以旨在引起你警觉或痛苦的方式威胁、骚扰或恐吓你?”这一相对较小的变化是为了测量大流行期间的骚扰程度,而最初的问题并不能做到这一点。由于它位于筛选器问题集的末尾,并且不在CSEW犯罪范围内,因此被认为是一个相对安全的变化,对犯罪的主要估计或CSEW与TCSEW之间的可比性几乎没有影响。由于没有试点选择,这个新问题于2020年5月与TCSEW一起上线。

改变TCSEW威胁甄别问题的措词所产生的影响远远超过预期。它增加了在一系列犯罪类型中被抓获的犯罪数量,特别是对无伤害暴力的估计。新的筛选问题的引入显然影响了犯罪的数量。然而,无法区分这是由于措辞的变化还是真正的变化。

为了进一步探讨这一问题,我们删除了在比较年原有筛选问题和在TCSEW中由新筛选问题产生的所有罪行。结果是,比较年份(截至2019年3月的年份)和TCSEW截至2021年3月的调查年份都更具可比性,尽管它们会低估真实的犯罪水平。附录表A3因此,使用基于以下可比数据,显示了截至2021年3月的年度CSEW估计值与截至2019年3月的年度CSEW估计值之间的百分比变化:

  • 18岁及以上
  • 不重叠数据周期;截至2021年3月的年度与截至2019年3月的年度相比
  • 从本年度和比较年中删除威胁/骚扰问题
回到目录

5.模式之间的区别

长期以来,人们一直在争论通过不同媒介提出的调查问题的回答之间的潜在差异。涉及与另一个人的社会互动的访谈(如面对面和电话调查)被认为是受受访者在回答时考虑社会规范的影响。例如,给出更符合社会要求的回答,或者避免回答敏感的问题。

虽然面对面和电话调查操作之间的交互类型不同,但现在越来越普遍的研究实践是使用混合模式设计(例如在基线进行面对面访谈,在后续进行邮政或电话访谈)。人们相信这些反应的差异是微乎其微的。美国主要的受害者调查,美国全国罪案受害情况调查(PDF, 4.76MB)的研究发现,在比较面对面和电话调查访谈时,对受害者数量和患病率的估计没有显著的模式效应。虽然这一发现在一定程度上保证了这些模式变化对患病率估计的影响是最小的,但由于调查中报告的事件数量相对较少,研究人员无法评估它们对事件数量或发病率估计的影响。

回到目录

联系详情方法

梅根·艾尔金
crimestatistics@ons.gov.uk
电话:+44 (0)20 7592 8695