V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
funcookies
V2EX  ›  问与答

如何区分身份证人像和真人照片

  •  
  •   funcookies · 2020-10-13 09:59:21 +08:00 via iPhone · 4553 次点击
    这是一个创建于 1503 天前的主题,其中的信息可能已经有所发展或是发生改变。
    工作中在使用一个实名系统,系统采集存储相关人员得身份证照片以及本人实拍照片。可以实地采集,也可以网上自行上传。
    发现一些出问题的人员往往逃避实地采集,而且网上采集时不上传实拍照片,而是上传身份证人像的截图。考虑这些信息的上传者并不是身份证的持有人。
    目前想要的就是把这些上传人像截图的数据找出来。方便后续得跟踪分析。

    说明:
    身份证以及相关的照片属于个人隐私,所以不考虑各种云的人像识别接口,只做本地处理。
    第 1 条附言  ·  2020-10-13 13:15:34 +08:00
    核心目的不在于判断是否为本人进行业务操作,而是在于谁在逃避采集信息。
    举个例子 A 作为一个不法分子,因为自己的身份证被拉入黑名单,或者不愿意让自己的信息被采集到。想方设法找来 B 的身份信息,成立了 C 公司。为了尽可能让 B 少知道相关的事情。A 选择在网上采集,上传身份证正反面以及身份证的人像部分。

    现在的主要目的,就是找出这种逃避实地采集,逃避采集人像的。后续通过实地调查,来确定 B 是否经营,不实际经营的,则对 C 公司进行处理,避免 A 用来做恶。
    36 条回复    2021-03-08 15:39:15 +08:00
    coderluan
        1
    coderluan  
       2020-10-13 10:21:42 +08:00
    机器学习弄应该很容易, 贝叶斯之类估计都行, 楼主自己百度图像分类算法吧, 不考虑性能, 找 python 和 opencv 的版本应该很快就能搭起来.
    funcookies
        2
    funcookies  
    OP
       2020-10-13 10:47:10 +08:00 via iPhone
    @coderluan 谢谢啦。
    zoharSoul
        3
    zoharSoul  
       2020-10-13 10:49:03 +08:00
    要求本人实拍照片要戴帽子或者刘海遮盖额头
    vandort
        4
    vandort  
       2020-10-13 10:50:04 +08:00
    身份证照片上有没有网纹?
    funcookies
        5
    funcookies  
    OP
       2020-10-13 10:52:39 +08:00 via iPhone
    @vandort 我看了看 很多都是把身份证得人像部分放大截图,分辨率很差,图像模糊,网纹基本看不到。
    funcookies
        6
    funcookies  
    OP
       2020-10-13 10:53:49 +08:00 via iPhone
    @zoharSoul 这个不太好实现,只使用系统的查询功能。目前的想法是下载图片,自动分析。
    vandort
        7
    vandort  
       2020-10-13 10:57:10 +08:00
    @funcookies 这样说……那实拍照片的分辨率怎么样?
    funcookies
        8
    funcookies  
    OP
       2020-10-13 11:02:23 +08:00 via iPhone
    @vandort 如果是实地采集,因为使用的是统一的高拍仪,所以有固定的分辨率。但是网上上传的分辨率就五花八门。有的是手机相机,有的是身份证人像的截图,很小一块。有的是人像放大后截图,尺寸大,但是模糊。
    vandort
        9
    vandort  
       2020-10-13 11:15:04 +08:00
    @funcookies 那这不就是实拍照片和身份证人像截图的区别了?
    funcookies
        10
    funcookies  
    OP
       2020-10-13 11:23:41 +08:00 via iPhone
    @vandort 通过分辨率可以判断出实地采集和自行上传的。但是有些人自己上传的实拍照片分辨率也不高。现在想要做的就是把用户自行上传的图片进行清分,是自己日常拍的照片,还是单纯对身份证的头像进行了截图上传。
    imn1
        11
    imn1  
       2020-10-13 12:08:30 +08:00
    其实比较难,只要是静态,就难以判断是本人,就算不用身份证截图,也照样可以找到其他生活照
    扩展:如何区分身份证截图 P 成的生活照和真人实拍照片?毕竟下有对策嘛

    这就是为何那么多 APP 要开摄像头获取真人面部的理由
    道理我都懂,但确实不喜欢这样采集,我除了 ZF 办事外,基本拒绝上传身份证的方式(线下自助机器拍可以),但可以接受绑定银行卡的实名认证方式(没什么钱的二类卡,不能理财不能贷款)
    基本没见到支持公安部 eid 的,不然这个是首选方式,马上去买个支持 eid 的手机
    shm7
        12
    shm7  
       2020-10-13 12:30:13 +08:00 via iPhone
    如何用 cv 深度学习区分真假 LV 包 在线求
    Tianao
        13
    Tianao  
       2020-10-13 12:35:08 +08:00 via iPhone
    要求严格的业务都是视频采集视频验证的。
    funcookies
        14
    funcookies  
    OP
       2020-10-13 12:48:21 +08:00 via iPhone
    @imn1 我们现在都不考虑是不是本人的照片。是之前发现一部分出问题的组织关联的个人信息全是采集方式,且身份证的来源农村地区居多,考虑是违法者购买并冒用身份证。希望通过这种方式有一个预警,出现这种情况及时核实。
    funcookies
        15
    funcookies  
    OP
       2020-10-13 12:49:40 +08:00 via iPhone
    @Tianao 并不是什么严格的业务。只是一个单纯的采集。
    imn1
        16
    imn1  
       2020-10-13 13:08:31 +08:00   ❤️ 1
    大概明白了
    实名只是形式,主要目的是防范有人大量利用虚假身份,做不好的事,例如辱骂领导人、刷屏营销……需要预警此类风险

    不太好做,因为采集元不单一,单纯照片分辨误伤概率高
    还是分级管理吧,给可信的采集元较高权限,不可信的降权
    funcookies
        17
    funcookies  
    OP
       2020-10-13 13:21:16 +08:00 via iPhone
    @imn1 说的对,某些内部系统你懂的。em,基本这种利用虚假信息的,都是犯罪辣。 虽说是个形式,但是还是有点作用的,之前处理过一些,都是用的身份证头像,哪怕去晚上搜个照片也好啊,我也不知道这种人为啥这么耿直。
    dbsquirrel
        18
    dbsquirrel  
       2020-10-13 13:22:13 +08:00 via iPhone
    @shm7 清华的唐平中老师做过,好像有小程序,建议搜索看看。
    opengps
        19
    opengps  
       2020-10-13 13:28:05 +08:00
    多要素识别。单纯用身份证照片,要素是不足的,配合手机号,人脸识别等才是提高真实率的办法
    funcookies
        20
    funcookies  
    OP
       2020-10-13 13:31:21 +08:00 via iPhone
    @opengps 力所不能及呀。渣渣系统只给这么点东西
    vandort
        21
    vandort  
       2020-10-13 14:17:53 +08:00
    @funcookies #10 那是不是可以这样考虑,用分辨率来做初筛。初筛之后分辨率不够的图片,把人像抠掉之后识别剩余的部分。身份证截图的背景应该是有较明显的 pattern 的,用 ML ( DL )的方法看能不能学到。可以拿初筛之后具体的 case 跟你们的 researcher 讨论一下
    prodcd
        22
    prodcd  
       2020-10-13 14:26:24 +08:00
    要求提供人像的分辨率高一些,然后判断模糊程度?

    阿里云网站备案,是会邮寄背景图再拍照。你为什么不要求手持身份证的照片?
    lakehylia
        23
    lakehylia  
       2020-10-13 14:35:42 +08:00
    一般手机照片都有 EXIF 信息的,如果 EXIF 缺失,加入关注名单,人工审核。
    funcookies
        24
    funcookies  
    OP
       2020-10-13 14:49:59 +08:00 via iPhone
    @prodcd emm,底层没有控制系统的权利。互联网公司实名做的很好的。这只是一个小系统。更多的还是实地采集。
    funcookies
        25
    funcookies  
    OP
       2020-10-13 14:51:54 +08:00 via iPhone
    @lakehylia 上传会压缩,exif 信息都会被丢掉。
    funcookies
        26
    funcookies  
    OP
       2020-10-13 14:59:04 +08:00 via iPhone
    @vandort 谢谢,分辨率做初筛这个挺好。抠图和机器学习感觉有点搞复杂了。目前的想法是先分辨率初筛,然后通过色彩或者图片的清晰程度进行处理,感觉身份证人像得色彩和截图后的清晰度都较差。
    lakehylia
        27
    lakehylia  
       2020-10-13 15:00:29 +08:00
    @funcookies 前端可以判断啊,读取 exif 信息一并上传
    funcookies
        28
    funcookies  
    OP
       2020-10-13 15:33:36 +08:00 via iPhone
    @lakehylia emmm 只是系统的使用者。决定不了系统的功能
    lakehylia
        29
    lakehylia  
       2020-10-13 16:03:07 +08:00
    @funcookies 提需求单,让前端改
    funcookies
        30
    funcookies  
    OP
       2020-10-13 17:04:37 +08:00 via iPhone
    @lakehylia 🤪难搞呀。我们是搞业务,主业和互联网不沾边,只是信息化得程度高一些。所有的软件和信息系统都是外包给各家软件公司做的。emm 。改软件估计需要很高级的 leader 发话才行。
    shm7
        31
    shm7  
       2020-10-13 17:19:28 +08:00 via iPhone
    @dbsquirrel 我意思是这类只有几张图片 基本不可能做的
    baiyi
        32
    baiyi  
       2020-10-13 17:29:53 +08:00
    加“人工”智能审核
    huayumo
        33
    huayumo  
       2020-10-13 18:15:34 +08:00
    量不大的话自己人工过滤吧,感觉不是很好弄
    funcookies
        34
    funcookies  
    OP
       2020-10-13 20:02:25 +08:00
    @huayumo 量倒是不大,不过一直有,比较烦。机器做不了就不做辣
    funcookies
        35
    funcookies  
    OP
       2020-10-13 20:03:41 +08:00
    @baiyi 史上最强’人工‘智能
    taobibi
        36
    taobibi  
       2021-03-08 15:39:14 +08:00
    实地采集的话,可以购买身份证读卡器,现在便宜的身份证读卡器只需几百元,离线识别可以不需要接官方接口。在线识别的话,阿里腾讯都有身份证识别接口,只不过需要收费
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2637 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 05:47 · PVG 13:47 · LAX 21:47 · JFK 00:47
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.