1.简介

在冠状病毒(COVID-19)大流行期间,我们一直及时提供疾病对英国经济和社会影响的指标冠状病毒和英国经济和社会公报的最新指标

这些更快的指标现在包括一套覆盖英国就业市场的实验性招聘广告指数。这些指数是根据招聘广告创建的Adzuna.这些数据包括2018年2月以来数百万个招聘广告的实时信息,根据招聘广告中包含的信息按职位类别和地区划分。本文列出了用于推导这些指数的方法,并提供了与其他数据源的比较。

作为实验数据,这些数据可能会随着我们的方法和系统的完善而修订。

我们计划在未来几周和几个月里迭代开发这些指标,听取用户反馈并改进我们的方法,我们计划在年底前产生进一步的细分,包括在线职位空缺标准职业守则以及较低层次的地理位置,如地方当局或地方企业合作伙伴。

回到目录

2.我们正在使用的数据源

Adzuna是一个在线求职搜索引擎,它整理了英国数千个不同来源的信息。这些网站从直接雇主网站到招聘软件提供商,再到传统的招聘公告板,提供了当前在线招聘广告的全面视图。

Adzuna正与英国国家统计局(ONS)合作,并提供了包括在线广告职位描述、职位名称、工作地点、职位类别和工资信息在内的数据供分析。提供的数据是在数据提取期间Adzuna的工作搜索引擎中索引的所有工作广告的时间点估计。

在我们的分析之前,Adzuna执行了一些数据清理方法,例如删除与招聘广告相关的所有信息都相同的重复条目,因为同时有多个招聘人员发布广告,并对一些数据字段应用最低质量阈值。

Adzuna对英国所有的招聘广告都有很高的覆盖率,但由于这一来源仅限于在线空缺,因此会有一些招聘广告被遗漏,例如通过口头宣传的临时工作和内部空缺,这些空缺都是通过其他猎头方法填补的。

如果您想了解更多关于Adzuna数据的信息,请联系scottsweden@adzuna.com

回到目录

3.我们如何衡量在线空置数据

我们正在使用在线招聘广告数据来创建英国整体职位空缺的代理指标。

将招聘广告分类

Adzuna使用神经网络为招聘广告分配类别。该模型使用自然语言处理来分析职位标题和描述字段中的文本,并使用这些数据来分配最合适的职位类别。除了将“保健/护理”和“社会服务/护理/工作”纳入“保健和社会护理”之外,我们使用了Adzuna数据中定义的所有这些类别。

为招聘广告分配区域

2021年3月18日,我们更新了我们的区域方法。我们从Adzuna收到的在线招聘广告数据包含一个免费的文本位置字段,由直接创建招聘广告的公司或个人填写。这些信息可以包含广告公司认为适合广告的不同级别的地理信息,包括街道名称、邮政编码、城镇、城市甚至国家。他们也可能不填写位置。为分配招聘广告的区域,我们:

  • 手动检查这些位置中的许多位置,将它们分配给一个地方机构,该机构占数据集中所有唯一位置的80%
  • 将其与原始位置数据中包含邮政编码位置信息的广告的邮政编码查找文件进行匹配
  • 根据覆盖英国的国家统计局(ONS)地理名称中使用的措辞,将原始位置信息与较低级别的地理位置(如病房、地方当局和县)进行文本匹配
  • 基于覆盖英国的国家统计局地理名称中使用的措辞的部分匹配,对原始位置信息进行文本匹配
  • 在多级匹配的情况下,选择最低的地理位置(即病房)作为映射到区域的地理位置
  • 只有在有邮编和其他原始位置信息的情况下才使用邮编信息
  • 将前六个步骤中的信息映射到使用的正确的本地权限ONS地理查找文件,然后将这些地方当局聚合到相应的NUTS1区域
  • 进行一些手动更正,以重新分配由不同区域的公共位置名称引起的不正确的分配

有些位置可能级别太高,无法映射到地方当局(例如,县),但可以使用前面四点中概述的步骤映射到NUTS1区域。

使用这种方法,我们可以为大多数招聘广告分配区域,但仍有一些广告未分配,因此显示为“未知”区域。为什么这些广告没有被分配到一个区域的一些例子是:

  • 招聘广告的位置太细,无法使用我们当前的查找文件匹配到本地机构;例如,街道级别的信息目前不包括在我们的查找中,但将来可能会考虑
  • 招聘广告的位置太高,无法与某个地区相匹配;例如,招聘广告可以是“联合王国”级别的
  • 招聘广告的位置不能匹配到Lookup文件,因为它不是标准的
  • 招聘广告上没有指定具体的地点,而是宣传为“远程工作”或“在家工作”的机会
  • 招聘广告的地点在英国以外

我们计划在未来不断改进我们的区域分配流程,以解决这些示例案例。

展示数据

我们将我们的总广告、按类别划分的广告和按地区划分的广告作为指数系列,计算方法如下:

  1. 聚合一周内给定时间点的所有实时招聘广告
  2. 缺失值和异常值通过线性插值计算,因此每周有一个值
  3. 计算2020年2月Adzuna上列出的实时招聘广告的周计数平均值,包括估算值
  4. 将整个时间序列中的每个值除以这个平均值,从而对该序列进行索引,使2020年2月的平均值等于100
  5. 将索引值四舍五入到一位小数点后

注意事项:我们如何测量在线空置数据

  1. 3月21日教育行业广告总数异常,数值已通过线性插值进行估算。

  2. 缺失值为2019年2月15日至28日之间的一周,2019年10月31日至11月28日之间的三周,2019年12月5日至27日之间的两周,以及2020年1月3日至16日之间的一周。

回到目录

4.应用迭代重复数据删除方法

从2021年3月25日起,我们将推出一个额外版本的在线招聘广告指数,该指数部分解释了数据中某些特定类型的重复招聘广告。识别和删除这些重复的步骤概述如下:

  • 在职位描述和职位头衔上应用文字清理技术,确保它们是小写的,只包含字母或数字;也就是说,删除特殊字符
  • 从职位描述中去掉一些常见的词,比如“我们的”,“a”,“an”等等
  • 应用文件相似度检测方法,识别一组措辞几乎相同且具有相同职位名称的职位描述;然后,我们为每个NUTS 1区域保留一个单独的示例,由前面提到的方法分配,以便从相同的集合中找到一个工作描述
  • 相似度检测被设计成高度特定的,只标记非常相似的文档为重复;这是因为大多数重复的职位似乎都是经过很少编辑的重新发布,而且对于措辞严重的职位描述,往往不清楚重复的职位是针对同一职位,还是在技术技能要求或资历方面略有不同的非常相似的职位
  • 标记副本并从数据中删除
回到目录

5.提供在家工作机会的广告

2021年6月14日,我们发表了一篇文章数据集提供在家工作机会的在线招聘广告。这显示了涉及一些在家工作的工作的趋势,以及所有涉及该机会的工作的比例的趋势。一个支持文章探讨了这个问题。

识别这些广告的步骤如下:

  • 将职位描述和职位头衔字段合并为一个字符串变量
  • 对职位描述和职位标题应用文本清理技术,以确保它们是小写的
  • 应用文本匹配来识别包含“远程工作”、“在家工作”、“在家办公”和“远程工作”等与在家工作有关的关键词语的招聘广告。
  • 在“养老院”和“护理院”等短语合并时应用更正,以确保它们不会被错误地识别为在家工作。

注意这个系列的局限性是很重要的。这些是:

  • 该系列并没有将专门提供在家工作的招聘广告与提供灵活在家工作(比如每周在家工作一天)的招聘广告分开区分
  • 该系列确实有少量错误的分类,因为广告列出该职位“不适合在家办公”。

我们还制作了这些数据的重复数据删除版本。用户应该意识到,在未重复数据删除和重复数据删除的数据之间,有些趋势是不同的。

该方法由英国国家统计局(ONS)与华威大学的研究伙伴合作制定。大学团队支持我们识别在线家庭作业广告的工作。

华威大学的研究团队将于今年6月发表一篇学术论文,题为《正在进行的革命:英国远程工作的兴起》。CAGE工作文件(2021)”。

回到目录

6.优势和局限性

Adzuna数据的优势

  • 数据非常及时,分析可在提取广告快照后6天发布;这为英国实时招聘广告数量的变化趋势提供了一个早期迹象。
  • 数据以周为单位,可以进行每周比较。
  • 数据集中的大多数广告都包含详细信息,如潜在的低级别地理位置、详细的职位描述和一些薪资信息。

Adzuna数据的局限性

  • 招聘广告的数量并不是衡量劳动力需求的直接指标;这个数字可以对其他变化作出反应,例如招聘职位的方式(也就是说,招聘机构的活动减少可能导致一个职位的多个广告重复减少)。
  • 职位招满后,招聘广告可能不会立即从网上招聘栏上删除,因此这些指数可能无法完全反映那些已经停止积极招聘的公司。请注意,Adzuna执行数据清理,以删除未观察到30天的广告。
  • 这些数据来自多个职位空缺公告栏,如果广告仍然在任何一个公告栏上发布,即使它已经从另一个来源被删除,广告也被认为是“实时的”。
  • 在线招聘广告的范围并没有完全反映英国经济活动的范围,因为广告方法不同,例如,临时工作可能通过口头或商店橱窗做广告,而不是在网上。
  • 在时间序列中有一些点,我们知道数据集中的重复水平增加了,这导致了招聘广告的潜在膨胀价值;在这种情况下,在数据表中添加脚注以识别这些异常。
回到目录

7.现有职位空缺测量-国家统计局职位空缺调查

职位空缺调查是一项法定的每月商业调查。该调查只问了一个问题:一家企业(在某个特定日期)有多少职位空缺需要他们从外部积极招聘?

标题系列是基于三个月移动平均,按行业和企业规模。的部门间业务登记册(IDBR)作为采样帧。每月的抽样总数约为6100家企业,其中每月约有1400家大型企业,其余4700家由按季度随机抽样的小型企业组成。

该调查涵盖了英格兰、苏格兰和威尔士(大不列颠)的所有经济部门和所有行业,但职业介绍所(为了避免重复计算空缺)和私营家庭、农业、林业和渔业(因为这些行业主要由非常小的企业组成,空缺很少,涉及的成本不成比例)除外。英国的估计是通过使用就业估计对英国的数据进行加权得出的(北爱尔兰约占英国就业的3%)。没有按地区划分的空置率统计数字。没有接触北爱尔兰企业,因为有可能与北爱尔兰各部门进行的其他调查重叠。

空缺调查参考日期为每月的第一个星期五,除非今天是该月的第一天。在本例中,引用日期移到本月的第二个星期五。对于2020年5月期间,参考日期为2020年5月7日星期四,因为第一个5月银行假期的日期发生了变化。

英国国家统计局(ONS)的空缺统计数据是三个月的平均数据,经过季节性调整,然后在英国公布英国统计公报中的职位空缺和工作,通常是在统计调查点算日期后六至七星期。

有关国家统计局职位空缺调查的进一步信息可在职位空缺调查QMI

回到目录

8.与国家统计局空缺调查的比较

当比较experimental Adzuna招聘广告数据与国家统计局(ONS)的空缺调查,重要的是要谨慎,并注意到每个来源所涵盖的不同定义。

Adzuna涵盖了列出的在线招聘广告,其中可能包括一个广告中的多个工作机会或正在进行的招聘活动,而不是直接与一个职位空缺相匹配;关于Adzuna数据集局限性的进一步详细信息可以在第三节

英国国家统计局的职位空缺调查涵盖的职位空缺被定义为企业积极从外部招聘的职位空缺。

但是,比较两个数据源以提供质量指示可能仍然是明智的。在更高的层面上,我们可以看到Adzuna职位空缺与ONS职位空缺数据相似的变化。同样的可比性也可以观察到按行业级别划分的空缺标准工业分类(SIC),例如“教育”、“医疗保健/社会护理”(从医疗保健和社会护理汇总而来)、“零售/批发”和“餐饮/酒店”。对于这些群体,我们发现它们与英国国家统计局职位空缺数据的趋势存在一定相关性。

然而,由于不同的方法,在其他组中没有发现这种相关性。Adzuna分配的一些类别的职位空缺数据,如“毕业生”和“IT/计算/软件”,与职业和行业相关联;因此,将行业级别的职位空缺直接与国家统计局职位空缺估计在SIC水平上生产。

虽然从历史上看,“医疗保健/社会护理”类别与国家统计局的职位空缺调查有很强的相关性,但从2020年4月至9月,它与职位空缺数据有所背离。

回到目录

9.与就业研究所的比较

就业研究所(IES)使用Adzuna数据发布了2020年4月至7月初的每周空置率分析。这些出版物提供了更多的见解,包括当地空缺人数的变化和按薪金水平分列的空缺人数的变化。我们与IES合作,以确保我们的方法是一致的,但也有一些差异,用户应该意识到。

提取日期

Adzuna在任何特定时间提供招聘广告的时间点估计。尽管英国国家统计局(ONS)和IES都是每周提取数据,但这些提取是在一周的不同日子进行的。这意味着我们的分析存在微小的差异,因为不同的日子列出的招聘广告数量不同。

位置赋值

Adzuna数据中包含的一些招聘广告的地点不明。IES已经从他们的全部广告系列中删除了这些广告,但ONS没有。这可能在总体上造成来源之间的微小差异。

区域故障

在为招聘广告分配地区时,IES和ONS采取了不同的方法。英国国家统计局使用原始位置变量,但IES使用Adzuna提供的经度和纬度点。Adzuna使用他们自己的算法将原始位置变量映射到经纬度点。

此外,国家统计局正在进行文本匹配,但IES正在使用PostcodesioR包来匹配经度和纬度点到地方当局。IES手动检查英格兰的位置,因为在极少数情况下,经度和纬度点被发现在有关地方当局的边界之外;威尔士、苏格兰和北爱尔兰的位置仅由软件包匹配,这意味着方法方法略有不同。因此,我们预计在分解中会有微小的差异。

截至2020年7月9日,IES不再编制这些每周估计数。

回到目录

联系详情方法

汤姆·埃文斯
vacancy.survey@ons.gov.uk
电话:+44 1633 455277

你可能还会感兴趣: