1.简介

PAYE RTI如何帮助衡量就业和收入?

即挣即付(PAYE RTI)数据覆盖了全体员工(对于通过PAYE获得薪酬的员工),而不是一个样本,与目前基于调查的统计数据相比,它们可以用来产生更精确和详细的薪酬和就业统计数据。相反,可以从PAYE数据产生的统计数据受到PAYE系统收集的数据和其运行规则的限制。虽然英国国家统计局(ONS)使用国际劳工组织(ILO)的定义来进行基于调查的统计,但这些定义不能如此精确地使用PAYE数据,这些数据主要是为了税收目的而收集的。

PAYE RTI数据的某些性质在英国短期指标中是独一无二的。例如,以前不可能每月提供关于薪酬分配的统计数字。这些关于英国劳动力市场状况的统计数据提供的额外细节有可能帮助全国各地的决策。

本文对基于ONS调查的劳动力市场薪酬和雇员人数统计数据与使用PAYE RTI统计数据(包括对覆盖范围和方法差异的检查)进行了比较。

这些统计数据在未来也有可能取代一些基于调查的统计数据,这可能会减轻接受ONS调查的企业的负担。

为什么我们需要新的方法来产生使用PAYE RTI的每月估计?

PAYE RTI数据包括雇主支付给员工的付款记录,可用于构建关于员工工作和收入的统计数据。直到最近,英国税务海关总署(HMRC)才根据这些数据发布了每季度的实验性统计数据。用季度来处理对每月不同数目的周发薪日系列的影响。

本文中概述的新方法允许将数据与所做工作的时期相一致,特别是针对每周、每两周和每四周付款进行改进。这使得这些付款的处理更符合欧洲会计系统,ESA 2010 (PDF, 6.40MB)建议,并有效地将支付数据集更正式地转换为工作和工资率数据集。由于对数据应用了新方法,现在可以产生每月的员工工作和收入统计数据。

2010年欧空局要求工资和薪金记录在工作完成期间,而不是收入支付给员工的时间。新的方法估计了每笔付款所对应的工作周期。这将产生一个高度详细的微数据集,该数据集更好地符合ESA 2010原则,并且可以通过聚合生成时间序列。

此外,还根据支付数额和支付频率估计薪酬率,以便更好地比较按不同时间间隔支付的工作的薪酬。例如,在按周支付工资的情况下,一项工作的工资率将不再受每月发薪日是4天还是5天的影响。

本文还将探讨为更近期的时间段(提取时数据可能不完整)输入数据所涉及的方法,以及为使数据更适合于产生统计数据而进行的调整,例如考虑到开始日期、离开日期和不同的薪酬频率来改进估计。

Nôl我的表cynnwys

2.Calendarisation

什么是日历,为什么需要?

日历化是将PAYE支付转换为每日就业工资率的过程,然后可用于生成每月就业计数和收入,基于每笔支付报酬的估计就业期。例如,如果1月份的雇用在2月5日付款,那么该方法的目的是记录持续整个1月份的雇用,其工资率基于2月5日收到的付款。这样做的目的是更好地使数据与欧洲会计系统(ESA) 2010年的建议保持一致,即工资和薪金应在工作完成的期间计量。

之前使用即时支付信息(PAYE RTI)对工作和收入进行的实验性统计是按季度计算的,反映了PAYE按纳税年度(4月6日至4月5日)计算的事实。此外,数据是根据付款日期而不是工作完成日期分配到一个时间段的。虽然在将数据分配到一个季度时,这两个概念是相似的,但在创建月度时间序列时,它们的差异变得更加显著。

本文概述的日历方法将每笔付款的RTI数据从付款日期转换为更广泛地涵盖我们估计已完成工作的期间。在这样做的过程中,数据作为一个整体更好地与ESA 2010的建议保持一致,这反过来意味着数据与来自英国国民账户的数据更具可比性。重要的是,当与基于支付金额和支付频率的薪酬率估算相结合时,这种方法大大降低了使用RTI数据产生的时间序列的波动性。

通过计算工资率,即每单位时间的工资,可以方便地比较不同工资频率的工作的工资。这种衡量薪酬的方法可以与将薪酬作为特定时期内支付金额的简单总和来衡量相比。在汇总月薪工作和周薪工作的数据时,后者可能存在问题,因为一个月的周数可能不同(以及给定月份中特定工作日的天数)。

例如,一名员工在周五领工资,他在2019年10月的工资是四次,在2019年11月的工资是五次。与10月份相比,这名员工在11月份的薪水会更高,而他们的工资率(周薪)可能是相同的。这种影响在季度统计中大致平衡,因为通常每个季度有13个每周发薪日,但在计算每月工资时间序列时,这种影响非常严重。

将日历化与这种计算工资率的方法相结合,可以生成一个近乎连续的数据集,其中包括任何特定日期存在的工作,以及每个工作的工资率(转换为每天的工资)。这种从支付数据集到工作和工资率数据集的转换,使每月统计数据能够更好地反映劳动力市场状况,而不是每个日历月发薪日数量差异带来的噪音。这些方法应用于每笔支付级别的微数据。这使得简单的聚合能够产生时间序列聚合,并创建与这些时间序列一致的分析微数据集。

值得注意的是,这种方法的目的是将薪酬分配到正在获得报酬的就业期间。虽然这与“完成的工作期间”是一个类似的概念,但在某些情况下可能有所不同。例如,一个在工作日工作的带薪员工将被记录为连续受雇,包括周末。或者,那些在带薪休假期间没有工作的人,在这段时间内也会被归为雇员。为了简单起见,本文参考了估算“已完成工作的周期”,但是应该记住这些注意事项。

日历方法

在将数据从付款期转换为估计工作期之前,付款金额将转换为工资率。工资率本质上是一项工作的日工资率,由工资除以平均工作时间来计算。例如,周薪除以7,月薪除以30.4(365除以12)。计算每日工资的目的是确保工资可以在不同工资频率的工作之间进行汇总——例如,在周薪和月薪之间进行汇总。

要使用付款日期估计付款的工作期间,首先假定付款完全是拖欠的,付款日期是工作期间的最后一天,工作期间从上一笔付款的第二天开始。

根据雇佣的支付频率,对最终工作期限的长度进行了限制。如果工作周期太长或太短,将根据支付频率使用默认的工作周期长度。

例如,如果一项工作有周薪频率和两笔付款- -一次在6月1日,一次在6月15日- -则后一笔付款将被视为对应于6月9日至6月15日的工作期间。

就聘期的首笔发薪而言,在计算开始工作期间时,会以报备的开始工作日期为依据。如果开始日期根据该工作报告的支付频率产生了一个不长不短的工作期,则将其作为工作期的第一天,付款日作为最后一天。

如果雇员离职日期已记录在案,则付款日期标志着工作期结束的假设将有所放宽。有关这方面的更多信息,请参阅数据调整部分。

对工资率和工作时间的计算实际上创建了一个当前所有雇员的每日数据集,以及他们各自的工资。然后,这些数据按日汇总,以计算就业总数和薪酬统计数据,然后按日历月平均,以提供每月汇总数据。因此,每月的统计数字可以解释为基本的每日总和的平均值。

这种方法的一个重要含义是它如何处理在一个月中开始或结束的工作。例如,如果一份工作是在一个月的中途开始的,那么它将被算作整个月的半个工作。这不会影响该职位的计算薪酬率。例如,如果一份工作从4月16日开始,每月支付100英镑,那么在计算4月份的平均工资时,该工作的工资率仍然是每月100英镑。缩短的工作时间将反映在4月份计算平均工资时,实际给予该职位一半的权重,以反映该职位只存在了半个月。此外,在计算4月份的平均就业人数时,这些数据将被算作半个工作。

Nôl我的表cynnwys

3.数据调整

开始日期

通过“即赚即付”实时信息(PAYE RTI)收集的就业开始日期可用于改善我们对就业的第一个工作期的估计。

该数据包含了相对大量的开始日期,这些日期被列出为每月的1号或6号。当考虑到这些开始日期意味着就业开始的星期几时,这些开始日期在统计上似乎不太可信。那些在1日或6日开始工作的报告可能意味着在周末开始工作的可能性不大,尽管它们也可能是特定于某些业务领域的。虽然这对PAYE的运作没有重大影响,但为了统计的目的,可以改进数据。因此,报告为1日或6日的开始日期不用于计算改进的工作期间估计数。

支付的频率

雇主在提供薪酬频率方面有多种选择。员工可能的工资频率包括每周、两周、四周、每月、每季度、两年和每年。

偶尔,数据中的支付间隔似乎与所述的支付频率不同。这可能反映了诸如无薪休假等情况,还有其他情况,即付款之间的时间从一次付款到下一次付款是一致的,但与报告的付款频率不匹配。虽然这不会影响PAYE的运作,只要在其他方面的付款记录正确,但修改统计数据中记录的付款频率,以反映数据中观察到的实际付款频率,可以改善日历方法的功能。

具体做法如下:如果两次付款之间的时间连续三次与报告的支付频率不一致,但在此期间始终与另一个支付频率一致,则支付频率将相应修改。

漏付和双倍付款

“就业”,为了这些统计的目的,被定义为有偿填补雇员的工作。到目前为止所概述的处理过程将导致错过付款,从而导致错过了一段工作时间。在某些情况下,这些数据可以用来推断,错过了一段时间代表了一种不寻常的付款情况,这种情况与错过的一段工作不相对应。

一个这样的例子是,在错过付款之后,一笔付款几乎是受雇通常金额的两倍,随后的付款又回到接近通常金额。这种模式似乎反映了延迟付款,而不是一段时间的工作。接近正常金额两倍的付款可以被视为涵盖两个工作期间,并按此处理。

如果双重支付的时间发生逆转,也就是说,它发生在错过的支付之前,则应用相同的处理。例如,一项通常是拖欠工资的工作,却提前支付了一个月的工资。同样,这种情况可以按照付款对应于两个工作期间而不是一个工作期间来处理。

预付款

在确保付款数据与已完成工作的期间相一致时,了解拖欠或提前支付工作的程度也很重要。这是为那些离职的人计算的。预支工资的数额可以通过计算最终工作时间与标准工作时间之比与最终工资与标准工资之比的差值来近似计算。

目前,这种近似的提前支付只适用于那些已经离职的人以前的支付。为了更好地确保对工作期间的任何调整是基于预支付款,而不是基于例如奖金和工资的正常波动,规定了限制条件,使付款数额必须在倒数第二个期间保持稳定,以便作出这种调整。未来,它可能会根据行业或付款日期等因素适用于非离职人员。

Nôl我的表cynnwys

4.归责

为了产生及时的统计数据,估计中使用的实时信息(RTI)数据在参考月份结束后的几周内提取。这意味着数据集是不完整的,因为对于一些人来说,与当月完成的工作有关的付款尚未收到。为了及时产生可靠、无偏见的统计数字,需要对最近期间进行归因,以说明这些报告习惯。

虽然调查数据方法在很大程度上依赖于采样帧来输入和加权数据,但RTI数据集没有这样的采样帧。因此,开发了以下方法,建立了一个框架,该框架使用并保留了RTI数据集的各种独特特征,同时满足了聚合时间序列用户的需求。

数据的两个主要特征需要加以估算——就业的存在及其薪酬水平。对于雇佣的存在,有两种不同的方法:

  • 对于那些没有记录离职日期,但还没有报告下一次付款的工作,将为每一笔后续付款计算存在概率。

  • 为了正确地解释“新”就业人口,提出了一种组合方法。首先,使用类似调查的方法,对报告的数据进行加权以估计总量。然后,伴随着创造新就业的类似合成数据的方法,当与报告的数据一起汇总时,将产生估计的总量。

一旦处理了每个群体的就业情况,就可以估计他们的工资。如果有某一职位以前的薪酬数额,则计算薪酬增长估计数,并将其应用于报告的以前薪酬数额,以计算这些估算观察所得的薪酬。对于“新”工作的人口,采用了类似调查和类似综合的方法,与计算就业人数的方法类似。

利用概率归因估计就业

对于每个在过去一年中报告了一笔付款,但没有报告离职日期的工作,从上次收到的付款开始,定期计算付款,并估计付款存在的可能性。当这些估算的付款与统计数据产生日期之前的付款日期相对应时,这相当于估计付款已经支付但尚未报告给英国税务海关总署(HMRC)的可能性。当估算的付款日期晚于产生统计数据的日期时,这相当于估计将来付款的可能性。

有几个因素可以影响一份工作继续支付工资的可能性,但为了本方法的目的,使用了两个主要变量:距离上一次支付日期的时间长度和支付频率。前者很重要,因为一般来说,距离收到最后一笔付款的时间越长,收到另一笔付款的可能性就越小。在这种情况下,考虑支付频率也很重要。虽然一份按月支付的工作很有可能在上一次付款25天前收到另一笔付款,但如果是在25天之前,但该工作是按周支付的,那么这种可能性就会低一些。

为了计算这些可能性,使用历史数据来计算在支付日期后t天,如果没有提交离职日期,并且有条件于工作的支付频率,将收到下一笔付款的概率。这给出了一系列概率权重,可以附加到估算的支付。

除此之外,使用类似的方法,对工作仍然存在并将在未来支付的可能性进行了调整,但由于一些原因(如无薪休假),可能经历了一段时间的拖欠。

总之,对于之前已经向英国税务海关总署提交了付款但没有提交离开日期的工作,他们的最后一笔付款是“结转”的——实际上是复制和粘贴(可能是几次,这取决于工作支付的频率,但支付日期会随着工作支付频率的增加而改变)。对于这些新的、估算的付款,将创建一个概率权重,它表示(基于历史数据)对作业继续进行和付款或付款的概率的估计。

估计就业和新工作的报酬金额

根据定义,新工作没有支付历史。由于缺乏可以“结转”用于上述计算方法的过去付款资料,因此需要采用不同的方法来计算新工作的首次付款。

相反,与新作业有关的意见书——在抽取摘录之前收到的,或在系统运行时抽取摘录之前收到的——被视为(有偏见的)样本。在本节中,这些提交被称为“预提取提交”,不应与是否在到期日期之前提交给HMRC的判断相混淆。

虽然标准统计方法将使用抽样框架来获得数据的权重,以确保总体的代表性,但RTI没有这样的框架。相反,使用历史预提取提交率来获得总权重,从而产生汇总统计数据。然后使用这些汇总统计数据和合成数据类似的方法,以生成一个微数据集,该数据集再现这些汇总统计数据以及数据的其他维度。

首先,对过去的数据进行分析,以计算相对于付款日期,每天收到的付款信息的哪一部分(即,在数据提取日期前5天收到的付款信息,在数据提取日期前4天收到的付款信息,等等)。这是通过支付频率和每月支付的日期来完成的。因此,例如,在付款日之前10天计算每月付款的平均部分,其中所说的付款日是每月的15日。

这将根据支付频率、付款日以及相对于付款日的收到日期生成一组提交率。然后可以将这些提交率颠倒,以产生总收益权重,并将其合并到需要计算的时期的不完整新工作数据上。通过使用这些总收益权重,可以估计出所估算期间的新工作付款总额和平均付款数额。

为了解释预提取提交的平均付款金额的潜在偏差,再次分析历史数据,根据付款收到日期相对于付款日期来估计平均偏差——控制付款频率和付款发生的月份的日期。然后,这些数据用于计算估算期间的薪酬偏差调整,并应用于数据以计算平均支付数额。

对于一些需要估算的付款日期,提交率可能太小,无法使用基于收益的方法。例如,要计算最近一个月完成的工作的工资率,有必要计算将在不到一年的时间内支付给年薪人员的付款。如果对历史提交率的分析表明,在特定时期内,对特定薪酬频率的响应低于5%,那么将结合基于宏观的nowcast和预测来计算该时期的新工作薪酬和平均薪酬金额。就目前而言,这一临近预测只是将前一时期的增长率前移。

一旦估计出每个支付周期中每个支付频率的汇总统计数据,就会使用类似“合成数据”的方法来创建微数据,这些微数据将与实际收入一起使用,以再现这些汇总统计数据,并再现数据的其他特征。这样做的目的是考虑我们的数据维度——例如薪酬分配——这些维度没有被总收入方法考虑在内,并且在更及时地提交RTI文件的人和不及时提交RTI文件的人之间可能存在差异。

根据美国人口普查局(US Census Bureau)的定义,合成数据是“通过对原始数据进行统计建模,然后使用这些模型生成再现原始数据统计属性的新数据值来创建的”。我们希望提供的数据是对尚未收到的数据提交的估算观察结果。

就复制这一群体的属性而言,一个很好的代理是那些在去年同期还没有提交数据的人。因此,例如,如果2020年1月15日为2020年1月的新工作薪酬产生数据,那么,在计算将在2020年1月15日之后提交数据的人员时,这些数据属性的一个很好的代理是那些在2019年1月15日之后提交2019年1月数据的员工。

以这种方式,根据在前几年此时不会收到的新工作付款创建了重复的观察结果,但其付款日期已更改,以匹配所估算的付款期。

然后,(付款总额和平均付款数额的)汇总统计数字可用于约束这些类似合成的数据,以便在与收到的实际申报文件结合时再现汇总统计数字。由此产生的微观数据现在应该更好地代表最终数据的统计属性,并且将减少偏见,例如,只反映那些在提取前提交数据的人的薪酬分布。这也意味着实际提交的数据不会被编辑。因此,例如,如果已知提取前提交的数据是向上偏倚的,那么这将由提取后提交的数据具有相应的向下偏倚来解释。这对于产生一致的分布统计数字(例如中位数和百分位数)以及平均数和总数至关重要。

这一过程的效果和推理可以用图1来可视化,图1显示了新工作的薪酬分配的说明性示例。它旨在显示当提取日期大大早于参考期时数据可能会是什么样子。

首先,这张图表可以被认为是在收到所有纳税申报单后,真实、完整的数据可能会是什么样子。预摘录提交的文件构成了图表的一部分,摘录后提交的文件也是如此。这两组数据的维度可能不同。例如,每组的平均薪酬可能不同——在这个例子中,摘录前提交的平均薪酬为1050英镑,摘录后提交的平均薪酬为1550英镑。一旦按每个组的大小进行加权,就得到了总平均值——在本例中为1,500英镑。除了均值不同外,每个组的分布形状也可能不同。在本例中,选编前提交的报告的分布比选编后提交的报告更加倾斜。

提取前和提取后提交的数据之间的这种分布形状的差异是数据特征的一个例子,仅使用总收益权重很难确定这种特征。除非在计算总收益权重时将数据按薪酬水平分层,否则可能无法很好地估算薪酬分配的最终形态。

分层是按特征分割数据的过程,并用于许多加权方法,以解释数据集中这些特征的不均匀表示。例如,如果已知一项调查倾向于抽样更多的年轻人而不是老年人,则在加权时可能会根据年龄对数据进行分层,以便给予老年人更高的权重,从而具有所调查人口的代表性。在图1的例子中,摘录前提交的内容比摘录后提交的内容更倾斜,并且(没有按薪酬等级分层),因此任何汇总的摘录前提交的内容的分布也会过度倾斜。这一点延伸到在预摘要提交中可能存在偏见的数据的其他特征,这些特征的总收入没有分层,例如地理或行业。

对可能需要计算统计数字的数据的所有特征在汇总过程中增加层次,将导致数据质量低,或者是不可能的。这种方法需要在每个地层中提交足够数量的预提取。在调查数据的情况下,由于抽样程序中设计的随机性,在通过分层控制了一些广泛的非随机特征之后,通常可以假定数据的许多特征是无偏倚的。

由于预摘录的提交不是一项调查,所以不能假设这个“样本”的随机性。考虑到我们希望在现在或将来发表的统计资料的几个特点,因此需要大量的地层,而且所有地层都需要足够的样本量。对于所有需要计算的时期,特别是对于将来的付款,这是不能保证的。

图1还可以用来说明我们的方法是如何寻求避免这个问题的,通过向我们的预提取提交中添加类似合成的数据。预提取提交,可用于计算该组的平均值。通过从历史上观察预提取提交的平均薪酬与最终总平均薪酬之间的关系,可以计算出偏差调整。使用这种偏差调整,可以估计出该时期的总体平均值。通过了解预提取数据的典型比例,我们可以估计我们还没有收到多少数据,即提取后提交。利用这一点,再加上摘录前提交的平均薪酬和总体平均值,我们可以估计摘录后提交的平均薪酬。

然后,通过从去年同期提取后提交的数据来创建类似合成的数据,调整他们的薪酬,使他们达到这一时期提取后提交的估计,并将其添加到我们这一时期的数据集中。这两种调整结合起来,确保我们的估算和非估算数据一起达到我们对新工作数量和新工作平均薪酬的总估计和偏见调整。这个过程是针对每个支付频率分别执行的。

通过将节选前提交的意见书和节选后提交的意见书的类似综合估计结合起来,节选后提交的意见书的特征从前几年延续下来,如薪酬分布、地理位置、行业等特征。数据仍然是根据预摘录提交的数据进行调整的,因此在某种程度上,影响预摘录提交的经济因素也反映在类似合成的数据中。

在使用临近预测的情况下,预提取提交的提交率过低,那么这个过程基本上没有变化。但是,不是使用经过偏差调整的预提取提交来估计总体平均薪酬,也就是说,在系统运行之前和之后提交的平均薪酬,而是通过nowcast来完成。

估计持续工作的支付金额

在为新工作概述的类似方法中,当计算持续工作的支付金额时,使用历史回复率来计算预提取提交的数据,并应用偏差调整。

对于持续的工作,每个工作都有一个重要的信息-最后提交的付款金额。对持续作业的归因任务最终变成了归因支付金额的变化。

预提取提交用于估计特定付款日期的经偏差调整的平均付款增长。使用在估计新工作的就业人数和付款数额一节中概述的相同方法,然后用于估计尚未收到的付款的平均付款增长率,即需要归因的付款。计算出平均值后,将其应用于计算的每个作业的先前付款,结果就是该作业在特定付款日的估算付款金额。对于所有的支付频率,这个过程是分开进行的。

通过结合为每个没有离职日期的工作计算的概率权重(在使用概率归因估计就业一节中概述)和本节中计算的支付金额,构建了持续工作的微数据,可以汇总这些工作来计算工资和就业。

Nôl我的表cynnwys

5.发展领域

这些都是实验性的统计数据,将继续处于发展阶段。这并不意味着统计数据的质量很低,而是统计数据仍然是新的,可能会进一步改进。我们现在发布这些统计数据是为了让用户从迄今为止所做的工作中受益,也为用户提供了一个评论他们的发展的机会。

未来对这些统计数据的改进将根据用户反馈进行。以下是正在考虑的开发示例,但无意提供独家或详尽的列表。

改进日历和计算方法

通过分析本文中概述的日历和推算方法的输出,我们希望在未来几个月通过增量开发进一步完善它们。在这篇文章中,已经提到了这些可能的发展中的几个——例如在imputation方法中使用基于回归的临近预测。这些变化将使本文中概述的日历和计算方法的框架保持不变,但可以改进它的某些方面。

改进工作期限的定义

在关于数据调整的一节中,我们讨论了对付款的调整,这种调整考虑到提前付款或拖欠付款的程度。因为需要一个离职日期,这个调整只能计算那些已经结束的工作。

虽然这种方法的个性化版本只适用于已经结束的工作,但通过分析这些工作的模式,可以根据与工作倾向于提前支付的程度有关的特点计算出一般性调整。

开始日期

还有另一个影响开始日期的调整,考虑到列出的开始日期的数量不太可能是每月的1日或6日。目前,所有开始日期为每月1日或6日的工作都被计算在内,但未来的发展可能能够利用其他数据更好地确定1日或6日的开始日期实际上是否准确地表示了准确的开始日期。例如,如果雇主将所有的上班日期都列在1号,这可能不太准确,尽管这可能是特定于他们的业务领域。相比之下,如果雇主报告的开始工作日期范围很广,其中一个是每月的1号或6号,那么这个特定的工作实际上更有可能是在这个日期开始的,而不需要计算开始工作的日期。

研究归责过程的地层定义

在计算总收益权重时,概述的估算方法考虑了数据的重要特征,如支付频率和支付的月份日期。然而,在计算用于imputation的汇总统计数据时,这些统计数据是为整个总体计算的。在计算总权重和汇总统计数字时,在计算总权重和汇总统计数字时,不按可能影响付款数额的各种特征- -例如地理和工业- -来划分人口,平均而言,计算每次付款可能更准确。

制定“核心”薪酬标准

虽然即时支付信息(PAYE RTI)数据并没有将奖金与其他支付(包括常规工资)分开,但可以对每个工作的数据进行处理,以剔除不寻常的变动。这种变动可能是因为奖金,但也可能是因为加班费、欠款或其他一次性因素。因此,所建立的系列将不会构成像平均周薪等统计数字那样意义上的“定期薪金”,但可能提供一些相同的效用- -一种较不稳定的“核心”薪金措施。

使用更纵向的数据元素

近年来,人们越来越注意总结和分析个人收入增长(或收入损失)的效用,例如,最新的工作时间和收入年度调查.例如,通过观察工资的中位数增长而不是工资的中位数增长,劳动力结构变化的构成效应的影响就会减弱。这可能意味着,工资增长中值是衡量“工资通胀”的一个更有用的指标,因此提供了宏观经济气候的有用指标。

PAYE RTI数据将能够及时提供这样的统计数据。在未来,我们的目标是探索利用数据的纵向方面来满足用户需求的最有益的方式,并欢迎对此提出反馈。

Nôl我的表cynnwys

6.与其他劳动力市场统计数据的比较

如何解释这些实验性实时信息统计数据与其他来源的劳动力市场统计数据之间的差异

重要的是要指出,这篇方法文章中的统计数据是实验性的,建议劳动力市场统计数据的用户使用国家统计局(ONS)。劳动力市场释放是英国国家劳动力市场统计数据的权威来源。

劳动力市场统计数据的使用者可能会发现有用的另外两个项目是劳动力市场统计数据指南而且关于收益和收入的数据来源的指南

使用行政数据产生统计数据有一定的局限性,这可能使与其他统计数据来源的比较变得困难。这可能是由内容的差异引起的,例如,来自行政系统的数据测量的统计概念与调查测量的统计概念不同。或者,它们可能是因为覆盖范围的差异,即行政数据覆盖的人群与调查覆盖的人群不同。

当将PAYE RTI出版物中的统计数据与既定的劳动力市场统计数据、雇员收入的平均每周收入(AWE)系列和工作时间和收入年度调查(ASHE)以及雇员人数的劳动力调查(LFS)进行比较时,这些限制意味着不同的系列不能直接比较。

有关管理数据的内容和覆盖范围引起的问题的更多信息,可从英国的统计条例办公室

PAYE RTI与劳动力调查的雇员人数比较

这些实验性统计数据所报告的通过PAYE就业获得薪酬的人数,在所有月份都高于劳动力调查就业系列。这可能是因为这两个系列在覆盖范围和内容上的差异。由于劳动力统计调查的估计数是根据调查数据作出的,因此会受抽样变数的影响。覆盖范围和含量差异通常会导致RTI估计值高于LFS,而LFS结果的抽样可变性可能会影响两个方向的比较。

覆盖范围的差异

RTI数据包括在PAYE计划中就业并在参考期间因活动获得报酬的所有个人。这将覆盖比LFS更广泛的人口,LFS不包括16岁以下的个人,外国居民个人和暂时留在英国的人。此外,LFS的抽样框架是英国的住宅地址和公共设施,除了NHS住宿外,没有抽样。根据2011年3月的LFS和2011年3月的LFS的比较,用于计算LFS的家庭人口与常住人口之间的差距估计为47万人2011年的人口普查

LFS还将更好地覆盖未申报经济,因为RTI数据只包括HMRC已知的就业信息。最后,RTI将任何从事雇员工作的人归类为受雇者,而LFS仅将主要工作为雇员的人归类为雇员。

内容差异

LFS数据通过面试官收集,提供了澄清回答问题需要哪些信息的机会。然后根据对这些问题的回答来确定就业状况。RTI数据是通过雇主向HMRC提供PAYE信息的法律义务收集的。雇主可以得到广泛的指导,解释他们需要提交哪些信息,除了其他检查外,主要数字将由员工审查,以确保他们获得正确的工资。

LFS使用国际劳工组织(ILO)对就业的定义,而PAYE RTI的统计数字是基于领取薪酬的个人。以薪酬为基础的数字是每月各日估计从事有薪工作的雇员人数的平均值,而LFS系列则基于在参考周内从事有薪工作至少一小时的受访者。然后,LFS估计值按三个月期间参考周内就业人数的平均值计算。

此外,本出版物中使用的LFS雇员数据仅包括那些主要就业收入来源为雇员工作的人,不包括那些主要活动为自营职业、为雇主工作为次要活动的人。这可能是LFS系列低于RTI的一个小因素,因为RTI数字中增加了主要就业收入来源为自营职业但有第二就业来源的个人。

无响应和抽样可变性

国家统计局(ONS)投入了大量的努力和资源,以获得调查数据的高回复率。然而,没有响应可能会引入需要调整的偏差,这可以使用诸如imputation或通过重新加权接收到的响应等方法来完成。这些调整可以与该系列末尾对RTI数据所作的(相对较小的)总收益调整进行比较。

没有回应的影响以及LFS基于样本的事实意味着,与所有抽样调查一样,LFS的估计也带有抽样误差。统计数据(例如,来自随机样本的平均值或总数的估计)将受到抽样变化的影响;如果重复抽取随机样本,其值将随样本的不同而不同。

RTI和LFS统计数据的比较

LFS员工系列排除了主要收入来源为自营职业的员工,导致LFS系列低于RTI。

图2显示了标题RTI雇员系列和标题LFS雇员系列(已经使用了三个月移动平均值)的三个月移动平均值的比较。

图3显示了RTI和LFS与前一年同月相比的就业增长率。从过去五年的整体来看,这两个系列显示了大致相似的就业增长率。然而,两者表现出不同的短期和中期走势。

RTI和AWE测量方法的比较

英国国家统计局的收入统计数据有两个主要来源:时间和收入年度调查(ASHE)和平均周薪(AWE)系列,后者由每月工资和薪金调查(MWSS)产生。

AWE是英国国家统计局衡量短期收入变化的领先指标。它旨在捕捉英国员工平均周薪的每月变化。AWE基于月度工资和薪水调查,该调查涵盖了英国所有工业部门中拥有20名或更多员工的企业的员工(使用ASHE数据对较小的企业进行了调整)。由于这是每月进行的,因此比年度ASHE的细节要少得多。

由于AWE和RTI的方法不同,平均薪酬的总体统计数据不能直接比较。在诸如收入分布这样的情况下,由于高收入者的比例很小,所以较高收入者被扭曲,平均值将高于中位数。像RTI一样,AWE也包括那些收入因任何原因而减少的人的收入,这将有降低平均值的效果。此外,RTI和敬畏将包括那些添加了仅仅一个月的工资,例如奖金或类似。

RTI和AWE的比较

RTI的统计数据中都公布了平均收入和中位数,但AWE只公布了平均收入。RTI的估计值包括那些因任何原因收入减少的员工的收入。此外,RTI的统计数据还包括北爱尔兰、HM武装部队和通过PAYE支付的政府支持的培训人员、带薪遣散费和签约费,所有这些都不包括在AWE之外。

另一个重要的区别是,RTI估算值是以个人为基础计算的,而AWE估算值是以工作为基础计算的。由于人们可以有不止一份工作——在这种情况下,他们多份工作的收入将在RTI中加在一起——这种差异将导致RTI估计值高于AWE估计值。

抽样的可变性

与LFS一样,AWE将受到抽样变化的影响,这也将导致RTI和AWE估计值之间的差异。

RTI和AWE标题统计数据的比较

由于RTI统计数据以月平均工资表示,因此该数字除以4.3482,因为这是一个月的平均周数。图4显示,RTI系列的平均周薪略高于AWE系列。

图5显示了与去年同期相比,每个月的平均周薪增长情况。该系列数据表明,过去5年的增长率相对相似,但可以显示短期走势的差异。

与ASHE的比较

除了AWE,时间和收入年度调查(ASHE)是国家统计局收入统计数据的另一个重要来源。ASHE是在每年的基础上制作的,使用4月的参考日。它可用于按行业、职业、地区、地理位置乃至议会选区级别、性别以及全职或兼职状态分析收入。

ASHE统计数据关注的是在参考期内工资不受缺勤影响的成人工资率下的全职员工工作的周总收入。这与RTI的不同之处在于,RTI不根据全职或兼职工作状态进行区分,并将包括那些因缺勤而影响工作的人。与RTI最具可比性的统计数据是ASHE关于所有被调查员工(包括兼职员工)的周总收入中位数的数据。

内容差异

ASHE基于1%的员工样本,样本取自同一日历年1月HMRC PAYE数据。英国税务海关总署(HMRC)在4月份向英国国家统计局提供的数据更新了1月份的样本,以考虑到劳动力市场的新进入者,以及自1月份以来换工作的人。虽然样本是雇员,但ASHE是由雇主完成的。

RTI和ASHE标题统计数据的比较

ASHE的主要工资统计数据是全职员工工作的周总工资中位数,适用于在参考期内工资不受缺勤影响的成年工资水平的员工。ASHE还发布所有工人的统计数据,而不仅仅是那些全职工作的人。这与RTI更具可比性。由于ASHE使用每年4月的参考期,最具可比性的RTI数字是每年4月(非季节性调整)的周薪中位数。

图6显示了RTI和ASHE的周薪中位数。ASHE持续较高。其中一个原因可能是排除了缺勤工人,以及那些不在ASHE数据中的成人工资水平上的工人。此外,RTI数据可能更高,因为它们衡量的是人均薪酬,而ASHE数据衡量的是每份工作的薪酬。由于一个人可以有几份工作——在这种情况下,每一份工作的工资都是在RTI数据中对一个人的总和——人均工资将高于每份工作的工资。

图7显示了两种来源的周薪中位数的增长。虽然可供比较的数据很少,但两者在这段时间内大致显示了相同的趋势。

Nôl我的表cynnwys

许多狮子在游弋Erthygl

Debra Leaker, Ciaren Taylor
labour.market@ons.gov.uk rtistatistics.enquiries@hmrc.gov.uk
Ffôn: +44 (0)1633 455400 +44 (0)3000 593779