比如我这幅图识别就比较困难各位有什么办法吗?
1
LuckCode 2017-05-21 23:59:43 +08:00 via iPhone
添加白名单?或是叠加一个移位的图层?
|
2
fffflyfish 2017-05-22 00:04:49 +08:00 via iPhone
图像的连通域分析可以识别
|
3
eastpiger 2017-05-22 00:04:55 +08:00
大一的时候做过一个 OCR 相关的项目,只能算入门的渣渣。。。。
有一些办法,最粗暴的莫过于找大量的数据扔 CNN,有一种杀鸡用牛刀的感觉,当然数据量足够大的话确实是有效果的,我们当时做的车牌的识别就是这么做的。 第二类方法就是传统 OCR 的一些形式,如果能确定这个数字的变化不是很多的话,可以在 x 和 y 轴,甚至斜对角求一下积累量,根据这个数据来进行区分,这种算法 naive 得很但是对于字母数字还算是比较有效地(对中文就是废了。。) |
4
wheeler 2017-05-22 00:24:24 +08:00 1
这种没有粘连的字符还是比较好识别的,不知道题主是想自己造轮子还是单纯的求解决方案。
就这种图而言,可以 label 后,求 bounding box 把字符分割出来。 如果字符本身不是很复杂的话(比如噪声,倾斜什么的),直接用模板匹配就可以了。 如果只是求解决方案的话,类似于 tesseract ( https://github.com/tesseract-ocr/ )的 OCR 很多啊,还可以针对自己的样本集训练。 |
5
KaoN 2017-05-22 06:56:23 +08:00 via iPhone
正在集成一个 ocr 项目,字母+数字..正如三楼所说..扔给 cnn...
|