1
mmxq 2023-07-15 20:19:21 +08:00 via iPhone
这个不是污染吧,就是那些小网站为了规避审核和正版平台的防盗整出来的。
之前就有人说过这事儿了。 |
2
blockmin 2023-07-15 20:36:50 +08:00
搞盗版的人的正版网站账号被风控,出现替换文字,盗版 copy 过来又没校对,就这样了。
正版搞防盗,盗版没校正 |
3
biquzhi 2023-07-15 20:38:30 +08:00 7
字体反爬吧
|
4
cairnechen 2023-07-15 20:40:48 +08:00
@blockmin 搞盗版的人的账号咋风控啊,应该不会蠢到所有书付费订阅都用同一个账号吧
|
5
NoOneNoBody 2023-07-15 20:42:41 +08:00
厉害,中国人真不缺点子 🐶
|
6
Ansen 2023-07-15 20:43:07 +08:00 via iPhone
@cairnechen 盗版都是你抄我,我抄你
|
7
huguadao 2023-07-15 20:43:53 +08:00 via Android
尼玛,还真是,搞得都么有看下去的欲望了
|
8
cairnechen 2023-07-15 20:46:19 +08:00
@Ansen 他的意思是,盗版网站通过付费订阅拿到最新章节内容,然后通过 OCR 之类的方式拿到文本,正版网站是通过风控找到这个付费订阅的账号,然后替换掉这个账号看到的章节内容,我说的是这个过程
|
9
yyzh 2023-07-15 20:47:00 +08:00 via Android
正版的防盗版措施吧。某点也是这样,某些字莫名其妙用了繁体的
|
10
blockmin 2023-07-15 20:57:33 +08:00
@cairnechen #4 标点符号,特殊字符,还有一些其他的方式检测的,盗版个几章就能定位到账号了,这个时候找客服申述,提供手持照就能解
|
11
Jirajine 2023-07-15 21:27:31 +08:00
这样搞不怕出现政治问题么,作者写了一句赞歌,你给他替换成了反义词,那怕不是要直接被举报了。
|
12
yfugibr 2023-07-15 21:30:06 +08:00 6
原站把对应的字符编码互换(所以盗版网站爬到的字是反的),同时把对应的字体外形也互换(所以原站上看起来是正常的)
|
13
iamee 2023-07-15 21:36:11 +08:00
如果你们爬过美团、大众点评等网站,就会发现这点反爬手段只能算是入门级~
|
15
Lightbright OP @yfugibr 单个字符可以这样解释,但他这个还有词语的反义词
|
16
yfugibr 2023-07-15 22:16:15 +08:00 1
@Lightbright #15 具体没研究过,但是好像也能做到替换多个连续字符的显示内容。
见过一个编程字体,可以把 --> 替换成一个 ⇨,拆开时每一个字符都是正常显示,同理应该也能做到将”特殊“的字符编码作为一个整体显示为”普通“。 |
17
shinession 2023-07-15 22:21:01 +08:00
是的, 所以我很久没用过盗版的了, 而且它这个反义词还不是针对所有的, 有一定的比例, 全部替换也是读不通, 中国人鬼点子多
|
18
yfugibr 2023-07-15 22:26:54 +08:00
|
19
kkocdko 2023-07-15 22:35:48 +08:00
没人理会的 3 楼大概率是正解。
|
20
kkocdko 2023-07-15 22:36:12 +08:00
抱歉看到了,还是有人理会的 hhhhh
|
21
pocarisweat 2023-07-15 22:41:34 +08:00 1
|
22
mxT52CRuqR6o5 2023-07-15 23:02:22 +08:00 via Android
ocr 出来也是反义词的,不是说编码错误,显示正常,字体替换,2l 说的没错
|
23
iango 2023-07-15 23:37:13 +08:00 1
一方面是文字指纹: https://www.v2ex.com/t/774059
另一方面是防盗系统在保护时间内防盗。 某点的话是原网站作者发布后直接输出了混淆的文本,猜测防盗系统根据读者系数(网站等级 VIP/VVIP/SVIP×要读这部小说的消费等级等)×小说系数(小说热度、作者等级)得到一个每个人不同保护时间,保护时间过了刷新才会正常。榜一大哥秒恢复,签到请点数的读者可能要等两三天。 字体防爬 JJ 曾经用过,把四五十个常用字改变编码做了一套字体在网页引用,复制内容到其他地方会变空白或者▢▢。这个比较好处理,字符替换回来就行了。 |
25
dianso 2023-07-16 10:18:33 +08:00 via Android 3
都是在猜测,本人做了十几年小说站了
每天几十个起点高 v 抓去内容 一般就是脚本领取每日福利,大概几十点券 没有被限制一说,是起点的付费字体导致你看的不对 起点客户端可以解密 第三方脚本难,但是也能 实在不行等七天起点就解除了,主要是这两年防盗严格了 |
26
dianso 2023-07-16 10:20:23 +08:00 via Android
上面打错字了,是加密字体
不解密字体是有各种反义词和奇怪词汇干扰阅读 自己用脚本登录起点付费购买任意章节就能重现 任意账号都是这样 不会的可以用阅读 App 导入起点官方书源的,登录账号找一本月票榜或者畅销榜的书,任意订阅最新章节都能复现 |
28
dianso 2023-07-16 11:11:20 +08:00 via Android
我是提供书源和成品精校电子书的,渠道才有网站
|
29
Exgirlfriends 2023-07-16 13:15:46 +08:00
自从有了这个。。不看书了。。只找老书看了。
|
30
y051313 2023-07-16 17:38:53 +08:00
不光是反义词,还有人名也会被替换成书里面的其他角色名。
就是掺大便 |
32
xunqin 2023-07-16 23:29:11 +08:00
去年下半年到现在就这样了,起点升级了反盗版,无解,等完本精校吧,不用追更,着急的话,可以起点付费,支持正版。现在起点里,因反盗版得力,万订不是事,这是好事。
|
33
acerphoenix 2023-07-17 09:42:27 +08:00
是挺有意思,技术上好奇怎么做的,已经一年多没看网文了,这个技术算原因之一。当然最主要的还是大多觉得没意思了。
|