1.简介

PAYE RTI如何帮助衡量就业和收入?

由于现收现付(PAYE RTI)数据涵盖了整个员工群体(通过PAYE支付的员工),而不是样本,因此它们可以用来产生比目前基于调查的统计数据更精确和详细的薪酬和就业统计数据。相反,从PAYE数据中产生的统计数据受限于PAYE系统收集的数据及其操作规则。虽然国家统计局(ONS)使用国际劳工组织(ILO)的定义进行基于调查的统计,但使用PAYE数据无法如此精确地遵守这些定义,因为PAYE数据主要是为税收目的收集的。

PAYE RTI数据的某些属性在英国短期指标中是独特的。例如,以前不可能编制关于薪酬分配的每月统计数字。这些关于英国劳动力市场状况的统计数据提供的额外细节,有可能帮助告知全国各地的决策。

本文对国家统计局基于调查的劳动力市场薪酬和雇员人数统计数据与使用PAYE RTI统计数据(包括对覆盖率和方法差异的检验)进行了比较。

这些统计数据未来还可能取代一些基于调查的统计数据,从而减轻接受国家统计局调查的企业的负担。

为什么我们需要新的方法来使用收支兑付RTI来编制每月估计数?

PAYE RTI数据包括雇主支付给员工的付款记录,可用于构建有关员工工作和收入的统计数据。直到最近,英国税务和海关(HMRC)根据这些数据发布了季度实验统计数据。采用了季度基础,以解决对每个月不同数目的周薪日的一系列影响。

本文中概述的新方法允许将数据与需要改进的工作周期相一致,特别是针对每周、两周和四周支付的工作。这使这些付款的处理更符合欧洲帐目系统,ESA 2010 (PDF, 6.40MB)建议,并有效地更正式地将支付数据集转换为工作和工资率数据集。由于对数据采用了新的方法,现在可以产生每月雇员的工作和收入统计数据。

ESA 2010要求工资和薪金记录在工作完成的期间,而不是工资支付给员工的时间。新的方法估计了每笔付款对应的工作期间。这将产生一个非常详细的微数据集,该数据集更好地符合ESA 2010原则,并可以通过聚合生成时间序列。

此外还根据付款数额和付款频率估计薪金率,以便更好地比较按不同间隔付款的工作的薪金。例如,在每周支付工资的情况下,一份工作的工资率将不再受每月是否有四个发薪日而不是五个发薪日的影响。

本文还将探讨在更近的时间段内计算数据(在提取时数据可能是不完整的)所涉及的方法,以及为使数据更适合产生统计数据而进行的调整,例如考虑到开始日期、离开日期和不同的支付频率来改进估计。

回到目录

2.Calendarisation

什么是日历,为什么它是必要的?

日历化是将PAYE支付转换为每日就业工资率的过程,然后根据每笔支付所支付的估计就业期,使用这些工资率计算每月就业人数和收入。例如,如果1月份的工作在2月5日支付,那么该方法的目的是记录持续整个1月份的工作,其工资率基于2月5日收到的付款。这是为了更好地将数据与欧洲会计系统(ESA) 2010年的建议保持一致,该建议建议工资和薪金应在工作完成的期间内计算。

以前使用“随赚随付”实时信息(PAYE RTI)对工作和收入进行的实验性统计是按季度计算的,反映了PAYE按纳税年度(4月6日至4月5日)运作的事实。此外,数据是根据付款日期而不是工作完成日期分配给一个时间段的。虽然在分配季度数据时,这两个概念是相似的,但在创建月度时间序列时,它们的区别就更明显了。

本文中概述的日历方法将每次付款的RTI数据从付款日转换为更广泛地涵盖我们估计已完成工作的期间。在这样做的过程中,数据整体上更好地与ESA 2010的建议保持一致,这反过来意味着数据与来自英国国民账户的数据更具可比性。重要的是,当结合基于支付金额和支付频率的薪酬率估计时,这种方法大大降低了使用RTI数据产生的时间序列的波动性。

通过计算工资率,即每单位时间的工资,可以方便地比较不同工资频率的工作的工资。这种衡量薪酬的方法可以与将薪酬作为特定期间内薪酬数额的简单总和来衡量相对照。当汇总月薪和周薪工作的数据时,后者可能存在问题,因为每个月的周数可能不同(以及特定工作日的天数也可能不同)。

例如,一名在周五领周薪的员工将在2019年10月领四次工资,在2019年11月领五次工资。这名员工在11月的工资会比10月高,而他们的工资率(周薪)可能是一样的。这种影响在季度统计数据中得到了广泛的平衡,因为通常每个季度有13个周工资日,但在计算月工资时间序列时,这种影响非常严重。

将日历化与这种计算工资率的方法结合起来,就会生成一个几乎连续的数据集,其中包含任何特定日期的工作,以及每种工作的工资率(换算成日工资)。这种从支付数据集到工作和工资率数据集的转换,使每月统计数据能够更好地反映劳动力市场状况,而不是每个日历月发薪日数量的差异带来的噪音。这些方法应用于每次支付级别的微数据。这使得简单的聚合能够产生时间序列聚合,并创建与这些时间序列一致的分析微数据集。

值得注意的是,这种方法的目的是将薪酬分配到领取薪酬的雇用期间。虽然这是一个类似于“工作期间”的概念,但在某些情况下可能有所不同。例如,一个工作日工作的带薪雇员将被记录为连续雇员,包括周末。或者,一个休带薪假的人,在这段时间内不做任何工作,也会被归类为受雇者。为了简单起见,本文中提到了估算“完成的工作周期”,但应该记住这些注意事项。

日历法

在将付款期间的数据转换为估计工作期间之前,付款金额将转换为支付率。工资率实质上是一份工作的日工资率,计算方法是用工资除以平均工作时间。例如,周薪除以7,月薪除以30.4(即365除以12)。计算每日工资率的目的是确保不同工资频率的工作之间的工资可以汇总,例如,在每周支付和每月支付之间。

为了使用付款日期来估计付款的工作期间,首先假定付款是完全拖欠的,付款日期是工作期的最后一天,而工作期是从上次付款的第二天开始的。

根据雇佣者的支付频率,对最终工作期间的长短作出限制。如果工作周期太长或太短,将根据支付频率使用默认的工作周期长度。

例如,如果一项雇用有每周支付频率和两笔付款- -一笔在6月1日和一笔在6月15日- -那么后一笔付款将被视为对应于6月9日至6月15日的工作期间。

在计算工作期间的开始时,会考虑所报的开始工作日期。如果开始日期产生的工作期根据工作报告的支付频率不太长或太短,则将其作为工作期的第一天,付款日作为最后一天。

如果记录了雇用的离开日期,那么付款日期标志工作期间结束的假设就放宽了。关于这方面的更多信息,请参见数据调整一节。

对工资率和工作时间的计算实际上创建了所有当前受雇人员的每日数据集,以及他们各自的工资率。然后将这些数据按日汇总,计算就业总数和工资统计数字,然后按日历月平均,得出每月的汇总数字。因此,每月产生的统计数字可以解释为基本的每日总量的平均数。

这种方法的一个重要含义是它如何处理在一个月内开始或结束的工作。例如,如果一个工作是在一个月的中途开始的,它将被计算为整个月的半个工作。这不会影响计算出的就业率。例如,如果一份工作的工资是每月100英镑,并且从4月16日开始工作,那么在计算4月的平均工资时,这份工作的工资率仍然是每月100英镑。较短的工作期限将反映在4月份计算平均工资时,该职位实际上被赋予了一半的权重,以反映该职位只存在了半个月。此外,在计算4月份的平均就业人数时,这些数据将被视为半个工作。

回到目录

3.数据调整

开始日期

通过“随赚随付”实时信息(PAYE RTI)收集的就业开始日期可以用来改进我们对就业的第一个工作期的估计。

数据包含了相当多的开始日期,列出为每月的1号或6号。当考虑到这些日期意味着雇佣开始的一周中的哪一天时,这些开始日期在统计上可能显得难以置信。那些报告在1号或6号开始工作的人可能意味着在周末开始工作的可能性不大,尽管他们可能也特定于某些业务领域。虽然这对预付会费的业务没有重大影响,但为了统计的目的,可以改进数据。因此,报告为1日或6日的开始日期不用于计算改进的工作期间估计数。

支付的频率

在提供他们支付员工工资的频率信息时,雇主有一系列的选择。员工可能的支付频率包括每周、两周、四周、每月、每季度、每两年和每年。

偶尔,数据中的支付差距似乎与声明的支付频率不同。这可能反映了诸如无薪休假等情况,还有其他情况,即两次付款之间的时间间隔是一致的,但与报告的付款频率不一致。只要付款记录正确,这不会影响PAYE的运作,但修改统计数据中记录的付款频率,以反映数据中观察到的实际付款频率,可改善日历编制方法的运作。

具体做法如下:如果支付间隔时间连续三次与报告的支付频率不一致,但在此期间始终与另一个支付频率一致,则相应修改支付频率。

逾期付款和双倍付款

“就业”,为了这些统计的目的,被定义为带薪填补雇员的工作。到目前为止概述的处理过程将导致错过的付款转化为错过的工作期间。在某些情况下,数据可被用来推断,一个错过的时期代表一种不寻常的付款情况,而这种情况与一个错过的工作时期并不对应。

其中一个例子是,在一笔未支付的款项之后,紧接着支付了一笔接近雇员通常金额两倍的款项,随后又支付了一笔接近通常金额的款项。这种模式似乎反映了延迟付款,而不是一段时间的遗漏工作。接近正常金额两倍的付款可以被视为支付两个工作期间的费用,并按此处理。

在双重支付的时间颠倒的情况下,也就是在错过支付之前,应用相同的处理。例如,当一项通常是拖欠支付的工作被提前支付一个月时,情况可能就是这样。同样,这种情况可以按照付款对应于两个工作期间而不是一个工作期间来处理。

预付货款

在确保付款数据与已完成工作的期间相一致时,了解拖欠或提前支付工作的程度也很重要。这是为那些已经离职的人计算的。预支薪金的数额可以通过计算他们最后工作期间的长度与标准工作期间的比率以及最后薪金与标准薪金的比率的差值来近似计算。

目前,这种近似的提前支付只适用于那些已经离职的人以前的支付。为了更好地确保对工作期间的任何调整都是基于提前付款,而不是基于例如奖金和工资的正常波动,规定了一些限制,以便作出这种调整,在倒数第二个期间的付款数额必须稳定。未来,它可以根据行业或支付日期等因素应用于非离职人员。

回到目录

4.归责

为了产生及时的统计数据,估计所用的实时信息(RTI)数据是在参考月结束后的几周内提取的。这将意味着数据集是不完整的,因为对一些人来说,与当月完成的工作有关的付款尚未收到。为了及时产生可靠、无偏倚的统计数字,需要对最近几个时期的数据进行归责,以便解释这些报告习惯。

调查数据方法在很大程度上依赖抽样框架来进行数据的输入和权重,而RTI数据集没有这样的抽样框架。因此,开发了以下方法,建立了一个框架,使用和保留RTI数据集的各种独特特征,同时满足聚合时间序列用户的需求。

数据的两个主要特征需要估算——就业的存在和他们的工资水平。对于就业的存在,采取了两种不同的方法:

  • 对于那些没有记录离职日期,但尚未报告下一次付款的工作,将计算每个后续付款的存在概率。

  • 为了恰当地解释“新”就业人口,提出了一种综合方法。首先,采用一种类似调查的方法,对报告的数据进行加权来估计总量。然后再采用类似合成数据的方法来创造新的就业机会,当这些就业机会与报告的数据结合在一起时,将产生估计的总和。

一旦处理了每个群体的就业情况,就可以估计他们的薪酬。如果有以前的就业付款数额,则计算出薪酬增长估计数,并将其应用于报告的以前付款数额,以计算这些估算观察所得的薪酬。对于“新”工作的人口,采用类似调查和类似综合的方法相结合的方法,其方式与计算就业类似。

利用概率归责法估计就业

对于每一个在过去一年中报告了薪酬,但没有报告离职日期的工作,从最后一次收到的薪酬开始,按一定的间隔计算薪酬,同时估计薪酬存在的可能性。当这些估算付款与统计数据产生日期之前的付款日期相对应时,这相当于估计付款已经支付但尚未报告给英国税务和海关总署(HMRC)的可能性。当估算的付款日期晚于产生统计数据的日期时,这相当于估计将来付款的可能性。

有几个因素会影响一项工作继续获得报酬的可能性,但为了这种方法的目的,使用了两个主要变量:从上一个付款日起的时间长度和付款频率。前者很重要,因为一般来说,距离上次付款的时间越长,收到另一笔付款的可能性就越小。在这种情况下,考虑到支付频率也很重要。虽然一个月薪的工作很有可能会在25天前收到另一笔付款,但如果已经25天了,那么可能性就会更低,但该工作是按周支付的。

为了计算这些可能性,我们使用历史数据来计算在付款日后t天,如果没有提交离职日期,并且根据工作的支付频率,将收到下一笔付款的概率。这就给出了一系列可以附加到估算支付的概率权重。

除此之外,使用类似的方法,对该工作仍然存在并将在未来支付的可能性进行调整,但由于若干原因(如无薪休假),可能有一段时间没有支付。

总而言之,对于之前向HMRC提交了付款但没有提交离职日期的工作,他们最后的付款是“结转”的——实际上是复制和粘贴(可能是几次,取决于工作支付的频率,但支付日期会随着工作支付频率的变化而变化)。对于每一笔新的估算付款,都会创建一个概率权重,该权重表示(基于历史数据)对继续工作和付款的概率的估计。

估计新工作的就业和支付金额

从定义上讲,新工作没有支付的历史。由于缺乏可以“结转”用于上述计算方法的过去付款资料,这意味着需要采用不同的方法来计算新工作的首次付款。

相反,与新工作相关的提交——在提取摘要之前收到的或在系统运行时已经收到的——被视为(有偏见的)样本。在本节中,这些提交被称为“预摘录提交”,不应与关于提交是否在截止日期前提交给HMRC的判断相混淆。

虽然标准统计方法将使用抽样框架来推导数据的权重,以确保总体的代表性,但RTI没有这样的框架。相反,历史预提取提交率被用来计算总收入权重,从而产生汇总统计数据。然后使用这些汇总统计信息合成数据类似的方法,以生成一个微数据集,该数据集再现这些汇总统计信息,以及数据的其他维度。

首先,分析过去的数据,相对于它们的支付日期,计算每天收到的关于支付的信息的哪一部分(也就是说,在数据提取日期前5天、数据提取日期前4天收到的信息的哪一部分,以此类推)。这是通过支付频率和支付的月份的日期来完成的。因此,例如,计算在付款日之前10天收到的月付款的平均部分,其中付款日是每月的15日。

这将根据付款频率、付款的月份日期以及相对于付款日的收到日期生成一组提交费率。然后,可以将这些提交率倒过来计算总权重,并合并到需要归责期间的不完全新就业数据上。通过使用这些总权重,可以对新工作报酬总额和计算期间的平均报酬数额作出估计。

为了解释预摘录提交的平均付款金额的潜在偏差,我们再次分析历史数据,根据付款的接收日期相对于付款日期来估计平均偏差——控制付款频率和付款的月份日期。然后用这些数据来计算在计入期间的薪酬偏差调整数,这些调整数适用于计算平均支付数额的数据。

对于某些需要计入的付款日期,提交率可能太小,无法使用基于收益的方法。例如,要计算最近一个月完成的工作的工资率,就必须计算在不到一年的时间内每年支付的工资。如果对历史提交率的分析表明,在特定时期内,对特定支付频率的响应低于5%,那么将结合基于宏观的nowcast和预测来计算该时期的新工作支付和平均支付金额。就目前而言,这一nowcast只是将前一时期的增长率进行了结转。

一旦估计出每个付款期的每个付款频率的汇总统计数据,就会使用类似“合成数据”的方法来创建微数据,这些数据将与实际收入一起使用,以再现这些汇总统计数据和复制数据的其他特征。这样做的目的是要说明我们的数据的各个方面- -例如薪酬分配- -没有被收入方法考虑在内,并且在那些更及时提交RTI的人和那些没有及时提交RTI的人之间可能存在差异。

根据美国人口普查局(US Census Bureau)的定义,合成数据是“通过对原始数据进行统计建模,然后使用这些模型生成再现原始数据统计属性的新数据值”。我们希望生成的数据是对尚未收到的提交数据的推断观察。

就复制这个组的属性而言,一个很好的代理是那些在去年同一时间还没有提交数据的人。因此,例如,如果2020年1月15日产生的数据是2020年1月的新工作薪酬,那么,在计算2020年1月15日后提交数据的人时,这些数据属性的一个很好的代理是那些在2019年1月15日后提交2019年1月数据的员工。

以这种方式,根据以前几年的这个时候还没有收到的新的工作付款,根据新的工作付款日期更改,以符合计算的付款期间,产生重复的观察结果。

然后,可以使用汇总统计数据(支付总额和平均支付金额)来约束这些类似合成的数据,以便在与收到的实际文件结合时,可以复制汇总统计数据。由此产生的微观数据现在应该更好地代表最终数据的统计特性,并且将减少偏见,例如,只反映那些数据被预先提取提交的人的薪酬分布。这还意味着实际提交的数据将不会被编辑。因此,例如,如果已知提取前的提交是向上偏倚的,那么这将由推定的提取后提交具有相应的向下偏倚来解释。这对于产生一致的分布统计数字-例如中位数和百分位数-以及平均数和总数是必不可少的。

这一过程的效果和原因可以通过图1直观地显示出来,图1显示了新工作的薪酬分配的一个说明性示例。它的目的是显示当提取日期大大早于参考时期时,数据可能是什么样子。

首先,这个图表可以被认为是在所有的纳税申报单收到后,真实的、完整的数据可能会是什么样子。预提取提交的内容占图表的一部分,提取后提交的内容也是如此。这两组数据的维度可能不同。例如,每组的平均工资可能不同——在这个例子中,节选前提交的平均工资是1050英镑,节选后提交的平均工资是1550英镑。一旦每组的规模都被加权,整体的平均值就得到了——在这个例子中,是1500英镑。除了意味着不同之外,每个组的分布形状也可能不同。在本例中,提取前提交的分布比提取后提交的分布更加倾斜。

提取前和提取后提交之间的这种分布形状的差异是数据特征的一个例子,仅使用总收入权重很难推算。除非在计算总收入权重时将数据按薪酬水平分层,否则可能无法很好地推算薪酬分布的最终形态。

分层是按特征划分数据的过程,许多加权方法都使用它来解释数据集中这些特征的不均匀表示。例如,如果已知一项调查偏向于抽样更多的年轻人而不是老年人,那么在加权时,数据可能会按年龄分层,以便给予老年人较高的权重,从而使其具有被检查人口的代表性。在图1的例子中,提取前提交的内容比提取后提交的内容更加倾斜(没有按付费等级分层),所以任何提取前提交的总体分布也会过度倾斜。这一点延伸到数据的其他特征,这些特征在预先提取的提交中可能存在偏见,但总收入没有分层,例如地理或行业。

在收集过程中为统计数据可能需要计算的所有数据特征添加层次,将导致数据质量较低,或者是不可能的。这种方法需要在每个地层中有足够的预提取量。就调查数据而言,由于抽样程序中设计的随机性,在通过分层控制了一些广泛的非随机特征之后,通常可以假定数据的许多特征是无偏倚的。

由于预提取的提交不是一个调查,这个“样本”的随机性不能被假设。考虑到我们希望现在或将来发表的统计数据的几个特点,因此需要大量的地层,而且所有这些数据都需要足够的样本量。这不能保证所有需要计入的期间,特别是未来的付款。

图1还可以用来说明我们的方法试图避免这个问题的方式,通过向我们的预提取提交添加类似合成的数据。预提取提交,可以用来计算该组的平均值。通过从历史上观察预选段提交的平均薪酬和最终总平均薪酬之间的关系,可以计算出偏差调整。使用这种偏差调整,可以估计出该时期的总体平均值。通过了解预提取数据的典型比例,我们可以估计我们还没有收到多少数据,即提取后提交。利用这一数据,再加上我们在节选前提交的平均薪酬和总体均值,我们可以估算出节选后提交的平均薪酬。

合成类数据的创建是这样进行的:从去年同一时间提取提取后提交的数据,调整他们的薪酬,使他们达到这一时期提取后提交的估计,并将他们添加到我们这一时期的数据集。结合这两个调整,确保我们的估算和非估算数据一起达到我们对新工作数量和新工作平均薪酬的总估计和偏见调整估计。这个过程对每个支付频率分别执行。

通过结合抽取前提交的数据和对抽取后提交数据的综合估计,抽取后提交数据的特征从前几年继承下来,例如薪酬分配、地理位置、行业等等。数据仍然是根据预提取提交进行调整的,因此在某种程度上,影响预提取提交的经济因素也反映在类似合成的数据中。

在使用nowcast的情况下,预提取提交的提交率太低,那么这个过程基本不变。然而,我们没有使用经过偏差调整的预提取提交来估算总体平均薪酬,也就是说,系统运行前后提交的平均薪酬是通过nowcast完成的。

估计持续工作的支付金额

在对新工作概述的类似方法中,在计算持续工作的报酬金额时,使用历史响应率来计算预提取提交的内容,并应用偏差调整。

对于持续的作业,每个作业都有一个重要的信息——提交的最后支付金额。对持续作业的归因任务就变成了对支付金额变化的归因。

预提取提交用于估计特定付款日期的经偏差调整的平均付款增长。使用估计新工作的就业和付款数额一节所概述的同一方法,然后用来估计尚未收到付款的平均付款增长率,即需要归责的付款。一旦计算出这个平均值,就将其应用于计算的每个作业的上一个付款,结果就是该作业在特定付款日的估算付款金额。对于所有付费频率,这个过程都是单独进行的。

通过结合为每个没有离职日期的工作计算的概率权重(在“使用概率归责法估计就业”一节中概述)和本节中计算的支付数额,为持续工作构建了微观数据,这些数据可以汇总以计算薪酬和就业。

回到目录

5.发展领域

这些都是实验数据,将继续处于发展阶段。这并不意味着统计数据的质量很低,而是统计数据仍然很新颖,可能会进一步改进。我们现在发布这些统计数据是为了让用户能够从目前所做的工作中受益,同时也为用户提供一个评论他们的发展的机会。

未来将根据用户反馈对这些统计数据进行改进。以下是正在考虑的开发示例,但无意提供一个独家或详尽的列表。

改进日历法和归责法

通过分析本文中概述的日历化和归责方法的结果,我们希望在未来几个月通过增量开发进一步完善它们。在这篇文章中,已经提到了其中的几个可能的发展-例如在imputation方法中使用基于回归的临近预测。这些变化将使本文中概述的日历和归责方法的框架保持不变,但可以改进它的一些方面。

改进工作周期定义

在关于数据调整的一节中,我们讨论了对付款的调整,其中考虑到了预先付款或逾期付款的程度。因为需要一个离职日期,这个调整只能计算那些已经结束的工作。

虽然这种方法的个别版本只适用于已经结束的工作,但通过分析这些工作的模式,可以根据与工作倾向于提前支付的程度有关的特征计算出一般性调整。

开始日期

还有另一个影响开始日期的调整,因为列出的开始日期的数量不太可能是在每月的1号或6号。目前,所有将开始日期列为每月1号或6号的工作都被计算在内,但未来的发展可能能够利用其他数据更好地确定1号或6号的开始日期实际上是否准确地表示了准确的开始日期。例如,如果雇主把所有的开始日期都列在1号,这可能不太准确,尽管这可能是特定于他们的业务领域。相反,如果雇主有很多报告的开始工作的日期,其中一个是每月的1号或6号,那么很有可能这个特定的工作确实是在那个日期开始的,那么开始工作的日期就不需要计算了。

研究归责过程的分层定义

在计算总收入权重时,所概述的归责方法考虑到了数据的重要特征,如支付频率和支付的月份日期。但是,在计算要用于imputation的汇总统计信息时,这些统计信息是针对整个总体计算的。在计算总权重和汇总统计数字时,将人口按可能影响支付数额的各种特征- -例如地理和工业- -进行划分,平均而言,对每一笔付款进行估算会更加准确。

制定“核心”薪酬标准

虽然实时工资实时信息(PAYE RTI)数据并没有将奖金与包括正常工资在内的其他支付分开,但或许可以对每项工作的数据进行处理,以剔除不寻常的变动。这种变动可能是因为奖金,但也可能是因为加班费、欠款或其他一次性因素。因此,所创建的这个系列将不构成与平均每周收入等统计数字相同意义上的“定期薪酬”,但可能具有一些相同的效用- - -一种不太稳定的“核心”薪酬指标。

利用数据中更纵向的元素

近年来,人们更加注意总结和分析个人收入增长(或损失)的效用,例如,最新的工时和收入年度调查.例如,通过观察工资的中位数增长而不是工资的中位数增长,劳动力结构变化的构成效应的影响就减弱了。这可能意味着,工资的中位数增长是衡量“工资通胀”的一个更有用的指标,因此可以为宏观经济气候提供一个有用的指标。

国际收支兑付RTI数据将能够及时产生这样的统计数字。在未来,我们的目标是探索最有益的方式来利用数据的纵向方面,以满足用户的需求,并欢迎对这方面的反馈。

回到目录

6.与其他劳动力市场数据的比较

如何解释这些实验性实时信息统计数据与其他劳动力市场统计数据来源之间的差异

必须指出的是,这篇方法论文章中的统计数据是实验性的,建议劳动力市场统计数据的使用者使用国家统计局(ONS)劳动力市场数据作为英国国家劳动力市场统计数据的权威来源。

劳动力市场统计的使用者可能会发现有用的另外两个项目是劳动力市场统计指南而且关于收入和收入数据来源的指南

使用管理数据产生统计数据有一定的局限性,这可能使与其他统计数据来源的比较变得困难。这可能是由于内容不同造成的,例如,来自管理系统的数据所度量的统计概念与调查所度量的统计概念不同。或者,也可能是因为覆盖范围的差异,即管理数据覆盖的人群与调查覆盖的人群不同。

当将随附的《支付薪酬RTI》出版物中的统计数字与既定的劳动力市场统计数字、雇员收入的平均每周收入(AWE)系列和工作时间和收入年度调查(ASHE)以及雇员人数的劳动力调查(LFS)进行比较时,这些限制意味着不同的系列不能直接比较。

关于行政数据的内容和覆盖范围所引起的问题的更多信息可从英国获得统计及监管处

雇员人数与劳动力调查的比较

这些实验统计报告的从PAYE就业中获得报酬的人数高于所有月份的劳动力调查就业系列。这可能是因为两个系列在报道和内容上的差异。由于劳动力统计调查的估计数字是根据调查数据计算的,因此会受到抽样变化的影响。覆盖范围和含量的差异通常会导致RTI估计值高于LFS,而LFS结果中的抽样变异性可能会影响两个方向的比较。

覆盖率的差异

区域贸易指数的数据包括在现付现付计划中就业并在参考期间获得活动报酬的所有个人。这将覆盖比LFS更广泛的人口,LFS不包括16岁以下的个人,外国居民个人和临时停留在英国的人。此外,LFS的抽样框架是英国的居住地址和公共设施,除了NHS住宿,没有抽样。根据2011年3月的LFS和2011年3月的LFS的比较,用于计算LFS的家庭人口与常住人口之间的差距估计为47万2011年的人口普查

LFS还将更好地覆盖未申报的经济体,因为RTI数据只包括HMRC已知的就业信息。最后,RTI将任何从事雇员工作的人归类为受雇者,而LFS只将主要工作是雇员工作的人归类为雇员。

内容差异

LFS数据是通过面试官收集的,提供了澄清回答问题所需的信息的机会。然后根据对这些问题的回答确定就业状况。RTI数据是通过雇主向HMRC提供PAYE信息的法律义务收集的。雇主可以得到广泛的指导,解释他们需要提交什么信息,除了其他检查外,主要数据将由雇员仔细检查,以确保他们收到了正确的工资。

LFS使用国际劳工组织(ILO)对就业的定义的统计数字,而根据领取薪酬的个人计算。以薪酬计算的数字是每月各有关天从事有薪工作的雇员估计人数的平均数,而以工作时间指数计算的则是在参考星期内从事至少一小时有薪工作的被访者。然后,根据三个月期间参考周内受雇人员的平均值计算LFS估计数。

此外,本出版物使用的伦敦就业服务雇员数字只包括那些主要就业收入来源来自雇员工作的人,不包括那些主要活动是个体经营,为雇主工作作为次要活动的人。这可能是LFS系列低于RTI的一个小因素,因为RTI数字中额外包括了主要就业收入来源为自营职业但有第二就业来源的个人。

无响应和抽样可变性

国家统计局(ONS)投入了大量的努力和资源,以获得调查数据的高回复率。然而,不响应可能会引入需要调整的偏差,这可以使用诸如imputation或通过调整接收到的响应的权重等方法来实现。这些调整可以与该系列末尾对RTI数据所作的(相对较小的)总收入调整进行比较。

不回应的影响以及LFS是基于样本的事实意味着,与所有样本调查一样,来自LFS的估计也带有抽样误差。统计数据(例如,从随机样本中估计的平均值或总数)将受抽样变化的影响;如果抽取重复的随机样本,则其值会随样本的不同而不同。

RTI和LFS统计数据的比较

LFS雇员序列不包括主要收入来源为个体经营的雇员,因此LFS序列低于RTI。

图2显示了标题RTI雇员系列和标题LFS雇员系列(已经使用了三个月移动平均数)的三个月移动平均数的比较。

图3显示了RTI和LFS的就业增长率与前一年同月的比较。在过去的五年里,这两个系列显示了大致相似的就业增长率。然而,两者的短期和中期走势不同。

RTI和AWE测量方法的比较

英国国家统计局的收入统计数据有两个主要来源,一是工作时间和收入年度调查(ASHE),二是平均周收入(AWE)系列,后者由月度工资和工资调查(MWSS)产生。

AWE是英国国家统计局衡量短期收入变化的领先指标。它的设计目的是捕捉英国雇员每周平均收入的每月变化。AWE是基于每月工资和薪金调查,该调查涵盖了英国所有工业部门雇员人数在20人以上的企业的雇员(使用ASHE数据的小型企业进行了调整)。由于这是每月进行的,所以比年度ASHE的细节要少得多。

由于AWE和RTI的方法不同,平均薪酬的总体统计数据不能直接比较。在诸如收入分配这样的分布中,由于少数非常高的收入者,较高的一端被扭曲了,平均值将高于中位数。与“促进就业”一样,“促进就业”也包括那些因任何原因而导致收入减少的人的收入,这些原因会导致平均数字减少。此外,RTI和敬畏将包括那些添加了仅仅一个月的工资,例如奖金或类似。

RTI和AWE的比较

RTI的统计数据中同时公布了收入的平均值和中位数,但AWE只公布了收入的平均值。RTI估计数包括那些因任何原因收入减少的雇员的收入。此外,RTI统计包括北爱尔兰、英国武装部队和政府支持的通过PAYE支付的学员、带薪裁员金和签约费,所有这些都不包括在AWE中。

另一个重要的区别是,RTI估算是按人计算的,而AWE估算是按工作计算的。由于人们可以有不止一份工作——在这种情况下,他们从多份工作中获得的报酬将被加在一起,这一差异将导致RTI估算值高于AWE估算值。

抽样的可变性

与LFS一样,AWE也会受到抽样变化的影响,这也会导致RTI和AWE估计值之间的差异。

RTI和AWE标题统计数据的比较

由于RTI的统计数字是以月平均工资来表示的,因此除以4.3482,因为这是一个月的平均周数。图4显示在RTI系列中每周的平均工资略高于AWE。

图5显示了与去年同期相比,每月平均周薪的增长情况。这一系列数据表明,过去5年的增长率相对相似,但可以显示短期走势的差异。

与ASHE的比较

除了AWE,工作时间和收入年度调查(ASHE)也是国家统计局收入统计数据的另一个重要来源。ASHE每年以4月的一个参考日为基准编制。它可以根据行业、职业、地区、地理直到议会选区级别、性别以及全职或兼职状态来分析收入。

ASHE的主要统计数字集中于全职雇员工作的周总收入,即参考期间的工资不受缺勤影响的成人工资率。这与补习班不同的是,补习班不根据全职或非全职工作状况加以区分,而包括那些因缺勤而影响工作的人。与RTI最具可比性的统计数据是ASHE对所有被调查员工(包括兼职员工)的周总收入中位数的数据。

内容差异

ASHE基于1%的雇员样本,样本来自英国税务海关总署(HMRC)同年1月的PAYE数据。1月份的样本更新了英国税务海关总署4月份提供给英国国家统计局的数据,以考虑到劳动力市场的新进入者以及自1月份以来更换工作的人。虽然样本是雇员,但ASHE是由雇主完成的。

RTI和ASHE标题统计数据的比较

ASHE的主要工资统计数据是全职员工每周总工资的中位数,针对的是按成人工资标准计算的员工,且在参考期内工资不受旷工影响的员工。ASHE还公布了所有工人的统计数据,而不仅仅是那些全职工人。这与RTI更具可比性。由于ASHE使用每年4月的参考期间,最具可比性的RTI数字是每年4月(未经季节调整)的周薪中位数。

图6显示了RTI和ASHE的周工资中位数。ASHE始终较高。其中的一个原因可能是排除了缺勤工人,以及那些在ASHE数据中不按成人工资率计算的工人。此外,RTI的数字可能更高,因为它们衡量的是人均工资,而ASHE的数据衡量的是每份工作的工资。由于一个人可以有好几份工作——在这种情况下,每一份工作的工资是在RTI数据中为一个人加起来的——人均工资将高于每项工作的工资。

图7显示了两种来源的周工资中位数的增长。虽然可供比较的数据不多,但这两个数据大致显示了同一时期的趋势。

回到目录

联系方式文章

黛布拉·利克,西亚伦·泰勒
labour.market@ons.gov.uk rtistatistics.enquiries@hmrc.gov.uk
电话:+44 (0)1633 455400 +44 (0)3000 593779