基于机器学习和bert的在线招聘欺诈检测平台(完整代码+报告)

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6

2.1.1 数据获取

项目的第一步工作是进行数据的采集。最初的数据来源是智联网站上的招聘信息,但是由于智联的爬虫限制较为严重,故而我们最终将数据采集的对象设为了 58 同城。最终的数据总量为 2w 余条招聘信息。招聘职位涉及平时常见各种职位,涵盖了北京、上海、深圳、广州四个地区。

我们将所有信息分为三个数据表:company、recruitment、issue 进行存储。招聘信息数据库详细介绍详见项目附件一。

2.1.2 数据初步分析与数据标记

招聘信息数据库构建完成之后,接下来的工作为对信息的真假进行人工判断。

  • 首先我们从已有的 2w 余条招聘信息中,以城市为单位选取了 8640 条信息,其中北上广深四所城市分别占有 2160 条

  • 然后我们对选取的信息进行了初步分析,过滤了对人工判别的属性,详见下图,

未打对勾的属性被过滤掉:

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6
标签: 机器学习