目前,没有可用的大型戴口罩人脸图像数据集允许检查面部是否正确遮挡。事实上,由于不良行为或个人(如儿童、老年人)的原因,许多人没有正确地戴上口罩。由于这些原因,一些戴着口罩的活动打算让人们了解这个问题和良好的做法。
从这个意义上说,有研究者就提出了一种图像编辑方法和三种遮挡人脸检测数据集;即正确遮挡人脸数据集(CMFD)、错误遮挡人脸数据集(IMFD)及其全局遮挡人脸检测(MaskedFace-Net)的组合。现实的遮挡人脸数据集有两个目标:
据我们所知,没有一个大的遮挡人脸数据集为检测是否戴口罩提供如此细粒度的分类。此外,这项工作在全球提出了应用的遮挡人脸对人脸形变模型,允许生成其他遮挡人脸图像。新提出的遮挡人脸数据集可以在上找到。由NVIDIA公司在线公开提供的Flickr-Faces-HQ3 (FFHQ)数据集,已被用于生成MaskedFace-Net。
人脸图像数据集(Flickr-Faces-HQ3 (FFHQ))被选为创建一个增强的遮挡人脸图像。实际上,FFHQ包含70000张高质量的人脸图像,PNG文件格式为1024×1024分辨率,并公开提供。FFHQ数据集在年龄、种族、视点、灯光和图像背景方面提供了许多多样性。它最初是作为生成式对抗性网络(GAN)的基准而创建的。
对于FFHQ【3】的每一个人脸图像(例如上图a所示),基于Haar特征的级联分类器被用于检测一个感兴趣的区域(检测人脸矩形)。然后,一个特定的关键点检测器“预测68个关键点【4】【5】”应用于感兴趣的检测区域,并允许自动检测68个面部结构的坐标(见图b所示的样本)。
此外,还选择了广泛的face protection mask (single-use blue face protection mask)作为映射的参考图像(见下图中的示例)。对于后者,已经手动注释了12个关键点,用于描绘遮挡区域(多边形区域)。
在此阶段,针对目标情况定义了四种mask-to-face映射(见下图)即覆盖鼻子、嘴和下巴,口罩只覆盖鼻子和嘴,口罩只覆盖嘴和下巴,口罩只覆盖嘴以下。
对于每种类型的mask-to-face映射(CMFD、IMFD1、IMFD2或IMFD3),从自动检测到的68个位置中保留12个面部关键点的子集;然后与12个遮挡关键点匹配。通过这种方式,遮挡可以适合每个目标病例的面部的特定区域。因此,创建了一个mask-to-face deformable model来生成MaskedFace-Net。此外,每个目标情况最多可以有2个关键点(在12个关键点中),它们的位置在有限的周长内随机移位。因此,MaskedFace-Net也包含了各种各样的遮挡定位。
最后,应用了基于遮挡图像和人脸图像之间位置所定义的点对点对应关系变换来映射目标人脸区域上的口罩像素。图中显示每种类型的人脸位置实例和对应的口罩映射。