有图像识别的大佬么

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

推荐学习书目

› Learn Python the Hard Way

Python Sites

› PyPI - Python Package Index

› http://diveintopython.org/toc/index.html

› Pocoo

值得关注的项目

› PyPy

› Celery

› Jinja2

› Read the Docs

› gevent

› pyenv

› virtualenv

› Stackless Python

› Beautiful Soup

› 结巴中文分词

› Green Unicorn

› Sentry

› Shovel

› Pyflakes

› pytest

Python 编程

› pep8 Checker

Styles

› PEP 8

› Google Python Style Guide

› Code Style from The Hitchhiker's Guide

这是一个创建于 2464 天前的主题，其中的信息可能已经有所发展或是发生改变。

就是想做一个能识别出当前界面是广告界面，还是登陆界面，还是弹窗的功能程序。其中一种思路是将图片中的文字识别出来，根据文字来判断，第二种直接是根据图像转换成 ndarray，请问一下第二种有什么比较好的思路推荐么，感觉用 SVM，KNN，Logistic 什么的准确率好低，有什么更好的方法么？

识别

界面

图像

logistic

13 条回复 • 2019-05-06 14:51:50 +08:00

vedawang

2019 年 5 月 6 日 via iPhone

这种工作不应该由图像识别来做，速度慢，要做成普适性的算力要求又高。个人意见：根据 html 标签和元数据去识别更合适吧

dinghow

2019 年 5 月 6 日

楼上加 1，OCR 关键词>图像分类，但是这种类型图像识别数据自己搞太麻烦，也不知道有没有公开数据集

18870715400

2019 年 5 月 6 日

@vedawang 上面的要这样，我也没有太多办法。

airqj

2019 年 5 月 6 日

这是为了融资强行 AI 啊.....

Shingekinoshinji

2019 年 5 月 6 日

有大数据集直接上神经网络大力出奇迹吧，没有数据集老老实实 OCR

midasplus

2019 年 5 月 6 日 via Android

数据量有多大呢？

photon006

2019 年 5 月 6 日

分类就 3 种不是很难，关键得有样本数据集，而且以后业务场景出现的同类新图不能差异太大

18870715400

2019 年 5 月 6 日

@111qqz 数据集大概只有 7、8 百张吧

DrPikaduo

2019 年 5 月 6 日

@18870715400 这点数据量的话，还是用 OCR 关键词吧

18870715400

2019 年 5 月 6 日

就是广告弹窗什么的图像没有太大的特征性，直接用普通算法识别准确率肯定不是很好，关键是各种类型图片的文字看图就比较明显，所以才会直接根据文本来建立相关的模型。

lsvih

2019 年 5 月 6 日

强行创新不可取，把简单问题复杂化了

KKbu

2019 年 5 月 6 日 via Android

SVM 效果按说对这种简单分类人物效果已经很不错了，感觉像是特征没选对

dearmymy

2019 年 5 月 6 日

不知道你需求是什么？三张 png 图片要识别么？感觉你把东西复杂化了。你需求可能用别的方法实现更简单