最近在用 Python 做爬虫,碰到了这种验证码(降噪 /二值化处理后的)
现在想要将干扰线去掉,最好能矫正一下字符,不吝赐教。
1
EvilCult 2018-12-19 18:49:38 +08:00
这干扰线.......
都跟字母的笔画一边粗了吧....... 这可咋整.... 囧.... |
2
zuoyouTU 2018-12-19 18:56:15 +08:00
连续斜率?
|
3
arrow8899 2018-12-19 20:04:15 +08:00
这种只有切图了
|
4
as9t 2018-12-19 20:59:34 +08:00
深度训练
|
5
jdhao 2018-12-20 00:07:00 +08:00 via Android
建议深度学习训练模型,样本的话可以自己生成,尽量拟合真实样本,效果应该不错。
|
8
jdhao 2018-12-20 09:15:40 +08:00 via Android
@KevinBu 看你用 gpu 还是 cpu 训练,几十万样本,gpu 四五天可以跑完,cpu 就很慢了
|
9
boom7 2018-12-20 14:30:57 +08:00 via Android
前几天一个类似的验证码,搞了二十万数据,去腾讯云开了个 gpu 机器训练,两个小时跑完,最终测试的验证码通过率有九十多
|