2.数据源

这些分析使用了来自国家统计局公共卫生数据资产的数据。PHDA是一个独特的关联数据集,包括2011年人口普查记录、死亡登记、住院事件统计(HES)以及从用于大流行规划和研究的全科医学数据提取服务(GPES).PHDA仅覆盖英国,由以下人员创建:

  • 使用确定性和概率联系,获得了2011年人口普查和2011年至2013年NHS患者登记(PR)记录中出现的个人的NHS号码

  • 使用NHS号码,死亡登记数据与2011年人口普查记录相关联

  • 将2017年4月的HES记录和2000年1月的GPES记录加入到使用NHS编号的人口普查死亡相关数据中

我们将疫苗接种数据与国家免疫管理处到PHDA根据NHS数字调整疫苗接种状态。

研究人群包括2011年人口普查的2980万受访者,他们:

  • 到2020年年龄在30岁到100岁之间

  • 在2020年1月24日之前没有死亡

  • 可与2011年至2013年的患者登记册和GDPPR数据集相关联(其中包括冠状病毒(COVID-19)大流行开始时的活跃NHS患者,不太可能在2011年至2020年期间移民)

研究人群目前没有更新移民。因此,自2011年以来,一些与COVID-19有关的死亡将发生在进入美国的移民身上。

死因的定义采用了《国际疾病分类第十版》(ICD-10)。涉及COVID-19的死亡包括那些潜在原因或提及ICD-10代码U07.1 (COVID-19,病毒已识别)、U07.2 (COVID-19,病毒未识别)或U09.9 (covid后状态)的死亡。

回到目录

3.残疾的定义

为了在本出版物中定义残疾,我们参考了对2011年人口普查问题的自我报告答案,“你的日常活动是否因为健康问题或残疾而受到限制,这已经持续或预计将持续至少12个月?”-包括与老年有关的问题”。答案选项是“是的,限制了很多”,“是的,限制了一点”,或者“没有”。在研究人群中,17.1%的人报告说,他们要么受到一点限制(310万人),要么受到很大限制(200万人)。

在本文中,“少残”和“多残”分别被称为“少残”和“多残”。报告活动不受限制的人被称为“非残疾人”。残疾程度较低和残疾程度较高之间的区别仅基于2011年人口普查数据,而不是从任何其他信息推断出来的。因此,它只意味着基于自我报告的活动限制的差异。

这与电流略有不同政府统计局(GSS)统一了“核心”的定义.这将"残疾人"界定为自我报告患有身体或精神健康状况或疾病,已持续或预计将持续12个月或12个月以上,从而降低其开展日常活动能力的人。

GSS定义的目的是反映那些在法律术语中出现的1995年《残疾歧视法》接下来2010年平等法案

回到目录

4.医院的变量

在这个分析中,我们使用住院事件统计(HES)2017年4月至2020年1月的数据来自入院患者护理(APC)记录。该数据集中的信息是在发作级别(在咨询师指导下完成的每个护理期)。我们从插曲HES数据中创建了一个个人级别的数据集,以保存与2011年人口普查和死亡数据相关联的所有信息。

由HES推导出的分析变量为:

  • APC数据集中首次入院事件标记的数量,以得出每人入院的数量

  • 来自APC数据集的住院病人护理天数

然后,通过对NHS号码和出生日期的所有数据集进行堆叠和重复数据删除,将这些数据聚合到个人级别,为每个人创建一行。空白或无效的NHS号码和/或出生日期的记录被删除,因为这些不能与2011年人口普查相关联。

我们的HES数据中的总人数为53,483,456人。HES数据与2011年人口普查数据和NHS数字的死亡数据相关联。共有40,800,389项HES记录与2011年人口普查相关(76.3%)。其余23.7%的未婚人口可能没有在2011年人口普查中登记过。这可能是因为他们出生在2011年3月27日之后,在该日期之后移民到英国,或者尽管是居民,但没有在2011年人口普查中被列出。

此外,非关联组中的一些人可能无法将NHS号码分配到2011年人口普查记录中。这可能是因为地址冲突、名称更改或其他原因,因此确定性和概率链接方法将失败。然而,这只是在少数情况下。

回到目录

5.初级保健变量

初级保健记录是从全科医学提取服务(GPES)大流行规划和研究数据(GDPPR)数据集中提取的,该数据集包含55199份snom代码.在这些代码中,28561个涉及药房信息、处方和药物,20306个描述诊断和发现(包括解决和缓解)。

GDPPR数据集于2020年首次用于识别研究人群中的个人。英格兰2011年人口普查的4360万受访者可以与2011年至2013年的患者登记册相关联,并且在2020年1月24日之前没有死亡,其中4080万人可以与至少一个GPES记录相关联。

其次,与HES数据一样,相关疾病(在本节中列出)的发作数据被转换为二进制(身体质量指数、慢性肾病和1型和2型糖尿病除外),按NHS编号分组的人级变量。

GDPPR数据集用于识别过去20年(从2000年1月到2020年1月)因一系列疾病而有初级保健接触的个人。之所以选择这些合并症,是因为这些合并症以前被认为与增加冠状病毒(COVID-19)死亡风险有关预测成人COVID-19入院率和死亡率的QCOVID算法.调整的条件列表将更新为与更新了COVID-19风险预测模型(QCovid2)由NHS使用。

在QCOVID算法中使用某些健康变量被排除了:

  • 可供分析的病例数量不足(骨髓移植、脑瘫、先天性心脏病和镰状细胞病)

  • 缺乏使用这些数据的权限(化疗或放射治疗)

  • 或遗漏GDPPR(艾滋病毒/艾滋病和炎症性肠病)中必要的临床代码。

健康变量的完整列表包括:

  • 身体质量指数

  • 慢性肾病(CKD)

  • 1型糖尿病

  • 2型糖尿病

  • 呼吸系统癌症

  • 实体器官移植

  • 慢性阻塞性肺病(COPD)

  • 哮喘

  • 罕见肺部疾病

  • 肺动脉高压或肺纤维化

  • 冠心病

  • 中风

  • 心房纤颤

  • 心脏衰竭

  • 静脉血栓栓塞

  • 周围血管疾病

  • 先天性心脏病

  • 痴呆

  • 帕金森病

  • 癫痫

  • 罕见的神经疾病

  • 骨质疏松性骨折

  • 类风湿关节炎或系统性红斑狼疮

  • 肝硬化

  • 严重联合免疫缺陷

  • 严重的精神疾病(精神分裂症或躁郁症)

回到目录

6.疫苗接种变量

我们使用了疫苗接种数据国家免疫管理处2020年12月8日(英格兰首次接种疫苗之日)至2022年3月9日。

我们对第二波疫苗接种的分析包括第一剂和第二剂,对第三波疫苗接种的分析包括第一剂、第二剂和第三剂。分析没有区分加强剂量和其他原因提供的第三次剂量。

疫苗接种状态作为时变协变量被纳入模型,我们考虑一个人接种疫苗后14天。更多信息可在英国卫生安全局的博客文章COVID-19:分析英国首次疫苗的有效性.在接受过至少一剂疫苗的30岁及以上人群中,80.4%与国家统计局公共卫生数据资产(PHDA)有关。

回到目录

7.Age-standardisation方法

年龄标准化率(每10万人年面临风险)计算如下:

地点:

  • 是年龄段
  • w标准人口在年龄组别内的人数或比例是多少
  • r观察到的受试人群的年龄特异性发病率是否属于年龄组,由:

地点:

  • d在该年龄组中观察到的死亡人数是多少
  • n该年龄段的人群是否有患病风险

年龄标准化率是按年龄划分的死亡率的加权和,其中按年龄划分的权重代表标准人口的相对年龄分布。在这种情况下,我们使用2013年欧洲标准人口(ESP).方差是年龄相关方差的和,其标准误差是方差的平方根:

地点:

  • r本地人口按年龄划分的粗略比率是否属于年龄组别
  • d本地人口的死亡人数按年龄分组吗

置信区间

本新闻稿中的死亡率数据不受抽样变化的影响,因为它们不是来自样本。然而,它们可能受到随机变化的影响,特别是在死亡人数或死亡概率很小的情况下。为了帮助评估比率的可变性,它们与95%一起呈现置信区间

计算死亡率置信区间所采用的方法的选择,在一定程度上取决于对死亡率所依据的死亡数据分布所作的假设。

传统上,在假设死亡是正态分布的情况下,用正态近似方法计算置信区间。然而,如果死亡人数相对较少(少于100人),则可以假定它遵循泊松概率分布。在这种情况下,使用泊松分布表中的置信极限因子来计算置信区间比使用正态近似方法更合适。

用于计算基于少于100例死亡的比率的置信区间的方法由poisson参数加权和的置信区间的Dobson等(1991).这在公共卫生天文台协会第三次技术简报会(2008年)(PDF, 208kb)

在这种方法中,通过缩放和移动(加权)泊松分布计数(每年的死亡人数)的确切区间来获得置信区间。所使用的权重是年龄标准化率的标准误差与死亡人数的标准误差之比。

下95%置信区间和上95%置信区间分别记为ASR lower和ASR upper,计算公式为:


地点:

  • D而且Du使用泊松概率分布表中的置信极限因子计算出的死亡人数的确切置信下限和上限是多少
  • D每年的死亡人数是多少
  • v (ASR)这是年龄标准化率的方差吗
  • v (D)死亡人数的差异

如果一年内死亡人数超过100人,则使用正态近似方法计算年龄标准化率的95%置信区间:

地点:

ASR会/ UL分别为年龄标准化率的上、下95%置信限,SE为标准误差。

回到目录

8.造型分析

我们使用Cox比例风险模型来评估涉及冠状病毒(COVID-19)的死亡风险如何随自我报告的残疾状况而变化。这是在我们调整了住宅类型(私人家庭、养老院或其他公共设施)和一系列其他特征之后。这些特征包括:地点、劣势指标、职业、生活安排、大流行前的健康状况和疫苗接种状况。

大多数个人特征来自2011年人口普查。这不包括住院记录、先前存在的健康状况和疫苗接种状况,这些数据来源于住院事件统计(HES)2017年4月起的记录,用于大流行规划和研究的全科医学数据提取服务(GPES)2000年1月至2020年1月,以及国家免疫管理系统(NIMS),分别。

我们对2020年1月24日至2022年3月9日期间涉及COVID-19的死亡危险进行建模。在我们的分析数据集中,我们包括了在此期间因任何原因死亡的所有人,以及非残疾人群的加权随机样本(非残疾人群的抽样分数为1%,自我报告残疾状态人群的抽样分数为10%)。

危害函数建模如下:

地点:

  • T是生存时间

  • H (t)为t时刻的危险函数

  • h0(t)为t时刻的基线危险度

  • bI的估计系数是多少th协变量

  • x是I的值吗th协变量

i的风险比th期限计算为:

经验值(b

我们对男性和女性进行了单独的模型估计,因为涉及COVID-19的死亡风险因性别而显著不同。我们给出了几个模型的结果,逐步添加不同的控制变量。这使我们能够看到,随着我们加入更多的解释变量,涉及COVID-19的死亡风险的差异是如何变化的。

在我们的基线模型中,我们提出了根据年龄调整的风险比。我们将年龄作为二阶多项式,以解释年龄与COVID-19死亡危险之间的非线性关系。然后,我们调整了可能影响感染风险的因素,同时也调整了已有疾病的风险,从而调整了预后。

首先,我们根据住宅类型(私人家庭、养老院、其他公共设施)进行调整。我们使用2019年NHS患者登记册来更新2011年人口普查中记录为居住在私人家庭的个人的居住地,这些人后来搬到了养老院。

然后,我们根据GPES中持有的当前邮政编码来调整地理因素。感染COVID-19的概率可能因居住地区而异。因此,我们允许基准死亡危险因地方当局地区而异。我们还根据下层超级输出区域(LSOA)的人口密度进行了调整。为了解释人口密度与COVID-19死亡危险之间的非线性关系,我们将人口密度作为二阶多项式。这允许人口密度分布的前1%的不同斜率来解释异常值。

然后,我们考虑了贫困和更广泛的社会经济地位指标。我们根据多重剥夺指数(IMD) 2019在模型中添加十分位数来调整邻里剥夺。IMD是基于收入、就业和健康等因素对剥夺状况的全面衡量。

我们还根据以下因素进行调整:

  • 个人最高学历(学位,A-level或同等学历,GCSE或同等学历,无学历)

  • 家庭参考人员的国家统计社会经济分类(高级管理、行政和专业职业、中级职业、常规和体力职业、从未工作或长期失业,不适用)

我们进一步根据家庭组成和环境进行调整。我们的模型包括:

  • 家庭的人数

  • 家庭类型(不是家庭,有孩子的夫妇,单亲)

  • 住户组成(单成年人住户、两成年人住户、多代同堂住户(最少一人年龄在65岁或以上,另一人年龄在20岁以下)、18岁或以下儿童)

  • 房屋所有权(完全拥有、抵押拥有、社会租赁、私人租赁、其他)

我们为生活在养老院或其他公共机构的人的所有家庭变量增加了一个额外的“非家庭”级别。

此外,我们还对职业暴露的一系列措施进行了调整。我们包含了一个变量,表明该员工是否是关键员工,如果是,是什么类型的员工。这些数据取自2011年人口普查中记录的职业。我们还包括一个二进制变量,用于指示家庭中是否有人是关键员工。

我们使用从0(没有接触)到100(最大接触)的分数来解释接触疾病和与他人的接触。根据美国标准职业分类(SOC)代码,使用职业信息网络(O*NET)数据获得疾病暴露和物理接近得分,然后将其映射到英国SOC代码。分数的推导与英国国家统计局(ONS)之前在我们的文章中使用的方法一致哪些职业最容易感染新冠病毒?我们将这些分数包括所有拥有有效职业的个人,并得出所有家庭成员的最大值。

这些特征大多来自2011年人口普查。我们试图提高人口普查变量的准确性,使其更准确地反映2020年的生活状况。为此,我们将2011年人口普查中记录为生活在私人家庭,但2019年患者登记册中记录为生活在养老院的人的职业暴露变量设置为0。此外,2011年人口普查时10至17岁的人口被排除在家庭水平变量的计算之外,因为他们很可能已经离开了家庭。

我们根据过去三年住院人数和住院患者护理天数进行了调整,这些数据来自NHS HES记录。我们还根据来自GPES GDPPR的既存健康状况进行了调整。为了使所有这些健康相关因素的影响随个人年龄的变化而变化,我们将每个因素与一个二元变量相互作用,表明个人是否年龄在70岁或以上。

最后,我们调整免疫状态作为一个随时间变化的协变量,我们认为一个人在接种疫苗后14天就接种了疫苗。更多信息可在英国卫生安全局的博客COVID-19:分析英国首次疫苗的有效性。

我们报告了在年龄、地理因素、社会经济和人口因素、健康相关变量和疫苗接种状况调整后,2020年1月24日至2022年3月9日期间暴露变量的风险比。危险比大于1表明涉及COVID-19的死亡率高于参考组。风险比小于1表明COVID-19死亡率低于参考组。

我们还报告了涉及COVID-19的兴趣暴露的死亡风险第一波、第二波和第三波冠状病毒大流行通过扩展模型,允许感兴趣的曝光的时间依赖系数。我们将发生在以下情况的死亡进行分类:

  • 2020年1月24日和9月11日发生在第一波

  • 2020年9月12日和2021年6月11日发生在第二波疫情中

  • 2021年6月12日和2022年3月9日发生在第三波

回到目录

联系详情方法

赛斯托马斯
health.data@ons.gov.uk
电话:+44 1633 651602