最近在做一个反向图片检索引擎,在图片特征抽取的那步对比了传统计算机图形学的指纹提取例如 sift 与深度学习相关的 cnn,发现相较于 sift 来说 cnn 的方式对于图片的裁剪和模糊都有很强的抗性,就算使用他人预训练的模型不加修改都能获得很好的效果,一定程度上能识别出动作,角色,着装之类的信息,感叹大数据与深度学习结合起来竟是如此神奇
1
Stoulla 2021-05-27 10:41:18 +08:00 via Android 1
吐槽一个,你所说的这些都是 feature extraction 的工作。深度学习无非是相较于人工构建的 feature 来说,能获取到更细微的 feature 。
而所谓的深度学习,则是用非线性的函数去拟合一个实际的函数而已。无论是之前人工构建的 feature,还是现在用深度学习构建的 feature,都不过是在更好的拟合真实的函数而已。 按照这样的说法,深度学习也就没那么神奇了,依赖于大量的数据进行更好的拟合,也就是理所当然的了。 其实现在的方向与其说是用深度学习去完成某某工作,倒不如考虑到如何把模型做小做快,这反倒是更为重要的一个方向。比如你说的 sift,虽然在运算资源充足的情况下被最简单的 cnn 吊着打,但在 edge device 上,sift 仍然占有很重要的地位就是。 |