1.要点

  • 总体而言,在远程数据收集的初始试点阶段,20名受邀人员中约有17人选择参与。

  • 在最初的试点阶段,参与者可能在14天的测试窗口内完成问卷的时间没有明确的模式。

  • 在初步试点阶段完成反馈调查的参与者中,约有90%的人对新的数据收集方法“满意”或“非常满意”。

截至2022年7月21日的一周内:

  • 通过远程数据收集得出的对冠状病毒(COVID-19)检测呈阳性的人的百分比的点估计值在研究工作者家访收集得出的英格兰、威尔士、北爱尔兰、苏格兰和除英格兰东部以外的所有英格兰地区的点估计值的可信区间内

  • 通过远程数据收集得出的COVID-19检测呈阳性的人群百分比的点估计值在研究工作者家访数据收集得出的大多数年龄组的点估计值的可信区间内

  • 远程数据收集方法产生的估计值与研究工作者家访数据收集产生的估计值之间的差异很小。我们将在我们的报告中开始提出联合数据收集方法的估计每周新冠病毒感染调查公报2022年8月19日

回到目录

2.冠状病毒感染情况调查

冠状病毒(COVID-19)大流行在英国产生了深远影响。为应对大流行,COVID-19感染调查(CIS)采取了以下措施:

  • 英格兰、威尔士、北爱尔兰和苏格兰有多少人COVID-19感染检测呈阳性,不管他们是否报告有症状

  • 不同水平的SARS-CoV-2抗体检测呈阳性的人数

自2020年4月调查开始以来,研究人员对参与者进行了家访,收集了问卷数据以及拭子和血液样本。从2022年7月开始,我们改变了收集数据的方式,从研究工作者家访转向了更灵活的远程数据收集方法。我们引入了一份数字化问卷,参与者可以在线或通过电话填写,也可以通过邮件或快递(对一些参与者)发送棉签和血液样本包。

这是第一份对数据收集方法的影响进行分析的报告。这些分析比较了大多数参与者的研究工作者家访和我们新的远程数据收集方法之间的初始试点阶段收集的数据。本质量报告涵盖远程摄取、完成率和用户满意度的信息。它还包括按国家、地区和年龄对COVID-19检测呈阳性人数的不同数据收集方法之间的比较。该报告显示了主要远程收集阶段的当前选择率。我们正在计划未来的分析,以继续调查对这种数据收集方法变化的任何进一步观察,这将在未来几个月发表。

阳性率是指在某一时间点聚合酶链式反应(PCR)检测中COVID-19检测呈阳性的人的百分比。我们使用当前的COVID-19感染指的是从鼻子和喉咙提取的棉签检测出SARS-CoV-2阳性,无论有无症状。数据基于居住在私人家庭的人确认的COVID-19检测阳性结果,不包括居住在养老院或其他社区机构的人。

本报告所载数据亦载于冠状病毒(COVID-19)感染调查质量报告:2022年8月数据集

回到目录

3.我们如何评估质量

我们评估了我们的冠状病毒(COVID-19)感染调查(CIS)中的数据质量CIS方法及进一步资料文章,其中提供了研究工作者访问所有参与者时所使用的数据和方法的信息。的CIS质量和方法信息(QMI)文章详细说明质量特征、优势和限制、现有用户以及数据和方法的适当使用。这些报告的最新更新是截至2022年6月30日的期间,在研究工作者家访转向远程数据收集之前。

本质量报告对远程数据收集过程中收集的数据进行了比较,其中数据是通过研究工作者家访的原始方法和远程方法收集的。对这些数据进行了一些分析,以比较每种不同方法的数据收集,并调查转向远程数据收集是否会影响响应。

回到目录

4.数据采集方法变更:初始先导

2022年7月,我们开始了新的数据收集方法,参与者通过在线或电话填写问卷,棉签和血液样本通过邮寄或(对少数参与者)快递返回。每个月,参与者都有14天的“测试窗口”来完成问卷调查并返回他们的测试样本。

在这一变化之前,我们邀请了少量现有的冠状病毒(COVID-19)感染调查(CIS)参与者来测试收集数据、棉签和血液的新方法,以便我们能够在向其他参与者推广新方法之前发现任何问题并做出调整。这一初步试验阶段的目的是测试通过在线或电话发送邀请和填写问卷是否是一种成功的方法并提供准确的数据。

在最初的试验阶段有两个采样阶段。第一阶段选择了2000多名参与者,目的是确保新的数据收集方法能够满足广泛的用户需求。他们是根据标准被选择性邀请的,这些标准将测试新在线平台在参与者范围内的能力,例如年龄范围、技术技能和流动性问题。因此,第一阶段使用的参与者样本不能代表英国人口。第一阶段的第一批邀请已于2022年3月28日发出。

在第二阶段,采用分层抽样方法选择了代表更广泛调查人群的约2000名参与者。第二阶段的目的是了解参与者如何在最初的数字化平台上使用数据收集的新方法,因此这个样本更能代表英国人口。第二阶段的第一批邀请已于2022年5月12日发出。

参与者被要求选择继续使用远程数据收集参与调查。在线选择加入的选项只在第二阶段提供,预计将鼓励更高的选择加入率。在选择参与时,参与者回答了关于他们想如何完成问卷和归还测试包的问题。

一旦初步试点在2022年7月完成,当调查完全转移到远程数据收集时,那些参与初步试点的人会自动继续提供数据和样本。他们不需要再次选择加入。

以下部分只关注初始试点阶段参与者的远程数据收集选择率、问卷完成率和用户满意度。

远程数据采集选择速率

远程数据收集选择加入率定义为接受邀请参加(选择加入)CIS新的远程数据收集方法的参与者数量。本节中的数字仅涉及初步试验阶段。

总体而言,在初步试验阶段,20名受邀人士中约有17人(85.8%)选择参与。

截至2022年7月24日,第一阶段共发出2414份邀请,总体选择加入率为88.3%;第二阶段共发出2387份邀请,总体选择加入率为83.2%。在第一阶段及第二阶段,约有五分之二的参加者在收到邀请信后的首五天内选择以远程方式报名(分别为40.8%及42.3%)。对于第一阶段和第二阶段,摄取在一个月后开始减缓。

在第二阶段,在邀请后30天发送提醒,结果又有165名参与者选择加入。在第一阶段,提醒在不同的时间点以交错的方式发送,因此选择加入的模式并不清楚。这表明,提醒确实鼓励参与者选择新的远程数据收集方法,并且当所有提醒一起发送时比分批发送更有效。

图1显示了初始试点阶段两个阶段的选择加入率。在第一阶段的第50天左右和第二阶段的第30天左右,选择加入率的步骤增加归因于参与者对收到的提醒做出了回应。

每个阶段开始后,远程选择率按天数显示在冠状病毒(COVID-19)感染调查质量报告:2022年8月数据集

图1:新远程数据收集方法初始试验阶段第一阶段和第二阶段的选择率

英国,2022年3月28日至7月24日

嵌入代码
" id="embed-a72-49e9-8b83-b9f4ed6d3726" name="embed-a72-49e9-8b83-b9f4ed6d3726" readonly>

下载数据

.xlsx

问卷完成率

完成率的定义是在参与者被要求完成问卷的14天“测试窗口”内,通过在线或电话方式实际完成问卷的参与者数量。本节仅概述了问卷完成率,但参与者也应在14天内采集并返回拭子样本。样本完成率将列入将来的出版物。

在第一阶段,1467名参与者选择了远程数据收集方法,并没有选择退出前14天的测试窗口。测试窗口在不同的时间开始,这取决于参与者选择远程数据收集方法的时间。第一个测试窗口于2022年5月19日开始。在第一阶段的所有参与者中,十分之九(91.1%)完成了问卷调查。

在第二阶段,1980名参与者选择了远程数据收集方法,并没有选择退出前14天的测试窗口。第一个测试窗口于2022年5月25日开始。在第二阶段的所有参与者中,20人中有17人完成了问卷调查(86.8%)。

这使得在初始试点阶段的第一个测试窗口中,问卷的总体完成率为88.7%。

在这两个阶段,参与者在14天的测试窗口内何时完成问卷都没有明确的模式。

问卷完成率将在未来的测试窗口进行监测。还将对数据进行监测,以确定影响问卷完成率的任何因素。

初步试验阶段第一阶段和第二阶段的问卷完成率载于冠状病毒(COVID-19)感染调查质量报告:2022年8月数据集

用户满意度

最初试点阶段的参与者有机会在问卷结束时通过调查提供反馈。只有成功完成问卷的参与者才能获得反馈。作为调查的一部分,参与者被问及“您如何评价使用新方法参加COVID-19感染调查的总体体验?”他们有五个选项,从“非常不满意”到“非常满意”不等。对于那些通过电话进行问卷调查的人,联络中心的工作人员告诉一部分参与者,他们可以联系英国国家统计局(ONS)的研究团队,以提供反馈。在这些情况下,研究团队通过电话阅读调查问题和回答选项,为参与者选择正确的回答。

该反馈调查在整个初始试点阶段均可提供,参与者可随时访问,直至2022年7月4日。因此,无法确定参与这项调查的参与者是来自最初试点的第一阶段还是第二阶段。满意度评分不包括参与这一新方法广泛推广的参与者的回复。

整体而言,在完成意见调查的受访者中,十分之九(89.3%)表示满意或非常满意这项新服务。对于那些对新方法不满意的人,已经发现了该方法的问题,并正在进行改进。大多数回答来自在线填写问卷的参与者。

初步试验阶段的参与者满意度回应载于冠状病毒(COVID-19)感染调查质量报告:2022年8月数据集

回到目录

5.数据采集方式变更:主要远程采集

根据最初试点的反馈,在线平台在主要的远程收集阶段进行了升级将参与者从研究工作者家访转移到远程数据收集,显著提高了性能和可用性。从研究工作者家访到通过邮寄或快递远程收集数据和棉签和血液样本,这一转变从2022年7月开始。最后一次研究工作人员家访发生在2022年7月31日,所有参与者将被邀请在2022年8月底之前转向远程数据收集方法。

在2022年7月和8月期间,未参与初始试点阶段的参与者被邀请在10个队列中每周选择新的远程方法,采用交错方法,因此在此期间,数据由研究工作者或远程方法收集。图2显示了两种收集方法完成的问卷数量。

本节中提供的数据冠状病毒(COVID-19)感染调查质量报告:2022年8月数据集

图2:自开始远程数据收集以来,远程完成的研究人员访问和问卷调查

英国,2022年6月6日至8月7日

嵌入代码
" id="embed-2ea-430f-9b08-3e3eaeeb8bfa" name="embed-2ea-430f-9b08-3e3eaeeb8bfa" readonly>

下载数据

.xlsx

在截至2022年8月11日的主要远程收集阶段,每个国家的选择加入费率见表1。第9和第10组的选择率将在我们的下一份质量报告中提出。

回到目录

6.数据收集法进行正性估计

为了评估数据收集方式的变化对我们建模估计的影响,我们比较了两组不同的结果。第一组由研究工作者家访收集的数据和棉签组成,第二组由远程收集的数据和通过邮寄或快递返回的棉签组成。本节中的分析比较了这两组数据。

比较包括英格兰、威尔士、北爱尔兰和苏格兰截至2022年7月21日的8周数据。第二组结果的数据仅提供了最近1.5周的分析数据,即2022年7月11日至21日。为了使我们的模型能够运行,前6.5周使用了研究工作者家访的数据。最近期间的比较提供了两种不同数据收集方法之间的可靠比较。最近一周的参考日期是2022年7月18日。这是一个不同的参考周2022年8月5日冠状病毒(COVID-19)感染调查公报仅用于研究工作者家访数据收集,以便这些比较使用完全相同的时间段,并包括来自远程数据收集方法的最大数量的数据。

用于本次比较的数据可能包括初始试点阶段的一些数据,这些参与者的第二次测试窗口可能要到2022年7月10日之后才关闭。

本节中提供的数据冠状病毒(COVID-19)感染调查质量报告:2022年8月数据集,以及样本计数和2周和6周基础数据的比较。

COVID-19检测呈阳性的估计百分比

图3显示了通过数据收集方法对COVID-19检测呈阳性的人数百分比的模拟估计值的比较。分析的最近一周是2022年7月15日至21日,参考日为2022年7月18日。通过远程数据收集分析的最近一周产生的点估计值在研究工作者家访数据收集产生的点估计值的可信区间内。COVID-19检测呈阳性的人的估计百分比的比较如下:

  • 在英格兰,研究工作者家访数据收集为4.71%(95%可信区间:4.49%至4.92%),远程数据收集为4.92%(95%可信区间:4.69%至5.18%)

  • 威尔士,4.61%(95%可信区间:3.71%至5.62%)来自研究工作者家访数据收集,5.20%(95%可信区间:4.23%至6.28%)来自远程数据收集

  • 对于北爱尔兰,6.06%(95%可信区间:4.59%至7.65%)通过研究工作者家访数据收集,4.78%(95%可信区间:3.71%至5.98%)通过远程数据收集

  • 对于苏格兰,5.22%(95%可信区间:4.30%至6.20%)来自研究工作者家访数据收集,4.93%(95%可信区间:4.14%至5.83%)来自远程数据收集

研究人员家访和远程数据收集之间的趋势要么匹配,要么大致相似。在截至2022年7月21日的一周内,通过远程和研究工作者数据收集方法,英格兰、威尔士和苏格兰COVID-19检测呈阳性的人数比例有所下降。同一周在北爱尔兰,研究人员家访数据收集的检测阳性百分比趋势不确定,但远程数据收集的百分比下降。在北爱尔兰的最后一周,远程收集的数据比研究人员单独家访收集的数据提供了更多的信息,这可能解释了趋势的变化。因此,我们对整体趋势的相似性有信心。

图3:通过数据收集方法对冠状病毒(COVID-19)检测呈阳性的人的百分比

通过数据收集方法,模拟了英国2022年5月27日至7月21日在鼻和喉咙拭子上检测出COVID-19阳性的人口的每日百分比

嵌入代码
" id="embed-881-4ea5-8c66-98da5d6cc206" name="embed-881-4ea5-8c66-98da5d6cc206" readonly>

注:
  1. 由于样本量较小,与英格兰相比,我们对威尔士、北爱尔兰和苏格兰的估计存在更高程度的不确定性,而且随着我们转向远程数据收集,这些结果是基于更小的样本量。这是由wider表示的可信区间

  2. 该比较包括英格兰2022年6月3日至7月21日的数据,以及威尔士、北爱尔兰和苏格兰2022年5月27日至7月21日的数据。

  3. 远程+研究工作者家访数据收集包括2022年7月11日至21日通过远程方法收集的一周半的最新数据(主要远程收集),以及为运行模型所分析的其余时间序列的研究工作者家访数据。

下载数据

.xlsx

通过远程数据收集,在截至2022年7月21日的一周内对COVID-19检测呈阳性的人的百分比进行的点估计值在研究工作者家访数据收集对英格兰所有地区(英格兰东部除外)进行的点估计值的可信区间内。在英格兰东部,通过远程数据收集得出的估计较高,并且略超出研究工作者家访数据收集得出的可信区间。然而,这两种方法对英格兰东部估计的可信区间是重叠的。

在截至2022年7月21日的一周内,英格兰地区COVID-19检测呈阳性的人数百分比的趋势也与研究工作者家访数据收集和远程数据收集相匹配或大致相似。

图4:按英格兰地区和数据收集方法划分的冠状病毒(COVID-19)检测呈阳性的人数百分比

按地区和数据收集方法,英格兰2022年6月3日至7月21日在鼻和喉咙拭子上检测出COVID-19阳性的人口每日百分比建模

嵌入代码
" id="embed-5cc-4d75-b913-26062ec38484" name="embed-5cc-4d75-b913-26062ec38484" readonly>

注:
  1. 由于样本量较小,与英格兰整体相比,我们对英格兰地区的估计具有更高程度的不确定性,并且当我们转向远程数据收集时,这些结果基于较小的样本量。这是由wider表示的可信区间

  2. 远程+研究工作者家访数据收集包括2022年7月11日至21日通过远程方法收集的一周半的最新数据(主要远程收集),以及为运行模型所分析的其余时间序列的研究工作者家访数据。

下载数据

.xlsx

通过数据收集方法对COVID-19检测呈阳性的人群的估计百分比进行了额外的质量保证检查。来自远程数据收集的估计传递给所有检查。其他质量保证检查包括以下分析:

  • 均方根误差(RMSE),指的是无法解释的方差水平,例如,模型无法解释的方差;我们认为低于0.8的RMSE值是可接受的阈值

  • Rhat,指的是模型收敛性的度量,例如,贝叶斯模型的收敛性有多好;我们认为Rhat值低于1.05是可接受的阈值

年龄随时间分组

在截至2022年7月21日的一周内,通过远程数据收集得出的COVID-19检测呈阳性的人数百分比的点估计值与研究工作者家访数据收集得出的大多数年龄组的点估计值的可信区间内。

对于7年级至11年级、35岁至49岁以及70岁及以上的年龄组,远程数据收集产生的估计值略超出研究工作者家访数据收集的可信区间。两种方法的估计值的可信区间除了7年级到11年级的估计值有重叠,但我们对两种方法估计值的相似性有信心。在两种方法中,7至11年级学生的1周和2周趋势以及70岁及以上人群的2周趋势也略有不同,反映了这种不确定性。所有其他趋势都大致相似。

图5:按年龄分组和数据收集方法划分的冠状病毒(COVID-19)检测呈阳性的人群百分比

按年龄组和数据收集方法对英格兰2022年5月27日至7月21日在鼻和喉咙拭子上检测出COVID-19阳性的人口每日百分比进行建模

嵌入代码
" id="embed-520-4f6e-b349-e5c3ec6ecb07" name="embed-520-4f6e-b349-e5c3ec6ecb07" readonly>

注:
  1. 由于样本量较小,与英国整体相比,我们对英格兰每个年龄组的估计具有更高程度的不确定性,并且当我们转向远程数据收集时,这些结果基于较小的样本量。这是由wider表示的可信区间

  2. 远程+研究工作者家访数据收集包括2022年7月11日至21日通过远程方法收集的一周半的最新数据(主要远程收集),以及为运行模型所分析的其余时间序列的研究工作者家访数据。

下载数据

.xlsx

年龄随时间变化

当我们转向新的远程数据收集方法时,由于样本量较小,无法对北爱尔兰进行单一年龄分析。

与每个国家的总体模型相比,按单个年龄进行建模会导致更高程度的不确定性,如图所示置信区间

在截至2022年7月21日的一周内,根据英格兰、威尔士和苏格兰的两种数据收集方法,按单一年龄划分的COVID-19检测呈阳性的人数百分比趋势非常相似。

英格兰、威尔士和苏格兰按单一年龄划分的模型估计在冠状病毒(COVID-19)感染调查质量报告:2022年8月数据集

按单一年龄和数据收集方法对COVID-19检测呈阳性的人群随时间变化的估计百分比进行了额外的质量保证检查。来自远程数据收集的估计传递给所有检查。其他质量保证检查包括以下分析:

  • 如本节前面所解释的那样

  • r平方,它指的是模型可以解释的数据中的方差有多大,例如,拟合优度的度量

我们还检查了偏差,这是一个与r平方非常相似的度量,但更适合于非高斯模型,以检查偏差在运行过程中相同或相似的假设。两种采集方法的偏差值均在5个单位以内。

回到目录

7.未来的发展

基于本报告中提出的质量调查结果,我们有信心,通过远程数据收集方法收集的样本与研究工作者家访收集的数据之间的差异最小。因此,我们将结合从这两种方法收集的数据,在未来的出版物中使用这两种方法的时间点。合并数据的好处是获得尽可能大的样本,增加我们分析的力量,使我们能够更快地恢复发布估计。我们将在我们的报告中开始提出联合数据收集方法的估计每周新冠病毒感染调查公报2022年8月19日。

我们还在进行进一步的比较分析,我们将在未来几个月的其他冠状病毒(COVID-19)感染调查质量报告中提供这些分析。这些报告将包括以下方面的比较:

  • 分析不同数据收集方法对各种结果测量的影响的优势比

  • 参与者在一段时间内通过远程收集提供数据的代表性

  • 从血液样本中估计抗体阳性

回到目录

8.协作

英国伦敦卫生、热带医学和公共卫生学院的标志

冠状病毒(COVID-19)感染调查分析由国家统计局(ONS)与牛津大学、曼彻斯特大学、英国卫生安全局(UK HSA)和威康信托基金会的研究伙伴合作完成。特别值得注意的是:

  • Sarah Walker -牛津大学纳菲尔德医学系:医学统计和流行病学教授,研究首席研究员
  • Koen Pouwels -牛津大学卫生经济学研究中心,纳菲尔德人口健康系:生物统计学和卫生经济学高级研究员
  • 托马斯豪斯-曼彻斯特大学数学系:数学统计读者
  • Anna Seale -华威大学华威医学院:公共卫生教授;英国卫生安全局,数据,分析和监测:科学顾问
回到目录

9.术语表

儿童和年轻人的年龄组

  • “两岁至六年级”包括小学及以下儿童
  • “七年级至十一年级”包括中学的学生
  • “12年级至24岁的人”包括可能正在接受进一步或高等教育的年轻人

根据生日是在9月1日之前还是之后,11至12岁和16至17岁的人被分为不同的年龄类别。

置信区间

置信区间表明了估计的不确定程度,显示了样本估计的精度。95%置信区间的计算是这样的,如果我们重复研究多次,95%的时间真正的未知值将位于置信下限和置信上限之间。区间越宽,估计的不确定性越大。重叠置信区间表明两个估计值之间可能没有真正的差异。有关更多信息,请参阅我们的方法页面统计的不确定性

可信区间

可信区间表明数据分析估计的不确定性。计算95%可信区间,使真值有95%的概率位于区间内。区间越宽,估计的不确定性越大。重叠可信区间表明两个估计值之间可能没有真正的差异。有关更多信息,请参阅我们的方法页面统计的不确定性

回到目录