V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
pandada8
V2EX  ›  Python

如何利用Python 做验证码识别?同时求关于 识别验证码的一些资料

  •  
  •   pandada8 · 2013-06-30 09:31:43 +08:00 · 4488 次点击
    这是一个创建于 4154 天前的主题,其中的信息可能已经有所发展或是发生改变。
    7 条回复    1970-01-01 08:00:00 +08:00
    mikawudi
        1
    mikawudi  
       2013-06-30 16:57:25 +08:00   ❤️ 2
    和语言没啥关系,主要是看看图像处理方面的东西吧,验证码就不用做边缘检测了,简单的二值化处理下,然后分割一下,每个分割出来的数字(字母)的每个像素和标准的数字(字母)图像的每个像素点做异或运算,然后统计下和哪个标准数字(字母)图像的相似度最高,就是那个数字(字母)了....不过要考虑干扰噪点啊,干扰线啊什么的,然后如果生成验证码的时候用了旋转啊什么的那么就很难匹配了....我只用C#做过简单实验....不过思路大概就是这样的吧
    pandada8
        2
    pandada8  
    OP
       2013-07-02 20:08:35 +08:00 via Android
    @mikawudi 有没有关于识别的资料呢,PDF书籍之类//算法渣求解救
    andyhu
        3
    andyhu  
       2013-07-02 20:52:59 +08:00
    也可以直接deathbycaptcha人力解决
    pandada8
        4
    pandada8  
    OP
       2013-07-02 21:07:20 +08:00 via Android
    @andyhu 太狂野了……只是自己用的一个小脚本而已
    ufo22940268
        5
    ufo22940268  
       2013-07-03 08:18:02 +08:00
    justin1989
        6
    justin1989  
       2013-07-03 09:25:17 +08:00
    验证码里如果有扭曲和重叠,程序就基本搞不定了
    VYSE
        7
    VYSE  
       2013-07-03 09:40:28 +08:00
    试过tesseract这类OCR,对验证码基本无解,除非针对某类特殊优化
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   6037 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 02:22 · PVG 10:22 · LAX 18:22 · JFK 21:22
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.