每次打开斗鱼,以及任何斗鱼新页面打开都会下载这个。我电脑安装了 NDM
1
mooyo 2020-12-28 15:40:51 +08:00
看起来像是字体文件
|
2
wangpao 2020-12-28 15:44:31 +08:00
是字体文件,应该是网络字体
|
3
Marchfish3 OP @mooyo ![iShot2020-12-28 15.33.24 的副本.png]( )
|
4
Marchfish3 OP @wangpao ![iShot2020-12-28 15.33.24 的副本.png]( )
|
5
Marchfish3 OP 第一次在 V2EX 发布问题,还不会贴图现在知道了
|
6
Marchfish3 OP ![iShot2020-12-28 15.33.24 的副本.png]( )
|
7
zhangyangkam1 2020-12-28 15:55:02 +08:00
Web 开放字体格式( Web Open Font Format,简称 WOFF )是一种网页所采用的字体格式标准。
可能斗鱼没判断是否已有缓存,每次都重新下载? |
8
Marchfish3 OP @zhangyangkam1 那么在 NDM 你们能设置一下不,太烦了。或者是否有其他办法可以解决
|
9
jjplay 2020-12-28 16:15:19 +08:00
看虎牙
|
10
liyang5945 2020-12-28 16:17:58 +08:00
这玩意浏览器应该识别为字体文件,就像 css 一样,不应该弹出来下载的,应该是你浏览器出了问题
|
11
Marchfish3 OP @liyang5945 版本 87.0.4280.67 (正式版本) (x86_64)
|
12
Marchfish3 OP @liyang5945 我已经重装了两次了 Chrome
|
13
leafleave 2020-12-28 16:35:56 +08:00
NDM 自动捕捉的问题
|
14
xrxsh 2020-12-28 16:37:50 +08:00 5
之前看过一个文章,是说斗鱼利用字体进行反爬虫的,所以无论怎么访问,都一定会下载一个不一样的字体文件。
《斗鱼关注人数爬取 ── 字体反爬的攻与防》 https://cjting.me/2020/07/01/douyu-crawler-and-font-anti-crawling/ |
15
Yooe 2020-12-28 16:42:21 +08:00
好像是每次通过字体反爬虫
|
17
Marchfish3 OP @xrxsh 看来没有 NDM 就不会出现这个问题,爬虫肯定是商业需要吧,看来这个也不影响普通用户。
但是不能没 NDM 啊 |
18
looking0truth 2020-12-28 17:09:24 +08:00
反爬这个记得最早见过是携程还是美团那边用的来着,所有价格全是用自定义字体
|
19
yaphets666 2020-12-28 19:18:36 +08:00
@xrxsh 这个大佬思路牛逼 对前端调试这块也手到擒来啊
|
20
justin2018 2020-12-28 21:02:34 +08:00
@Marchfish3 NDM 是啥?
|
21
ly361302747 2020-12-28 21:04:27 +08:00
反爬的字体,你爬到的文本需要具体的算法逻辑映射出实际展示的文本
|
22
Marchfish3 OP |
23
fffang 2020-12-28 22:49:07 +08:00
好家伙,但我选择按键精灵+屏幕截取+OCR
|
24
wjm2038 2020-12-28 22:50:29 +08:00 via Android
@Marchfish3 你直接在下载器里面过滤 woff 的自动捕捉下载行为不行么
|
25
JetMac 2020-12-29 09:13:26 +08:00
写个规则,把该域名下 *.woff 屏蔽掉
|
26
skybig 2021-01-11 18:59:16 +08:00
NDM 没有过滤选项啊,咋整
|