他们是如何做到正版小说出了 10 几分钟盗版站就可以更新的呢?这应该不是纯手打吧?还是说起点的防盗版措施以及很容易破解了呢?
1
cxbig 2016-07-26 00:03:01 +08:00
花钱买正版资源,抓下图片有团队 24 小时待命纯手打,从其他途径把钱挣回来。黑产比你想象的更能挣钱,比方说“ XX 神器”。
|
2
mikicomo OP @cxbig 原来是这样的么?难道就不用什么机器识别的么?毕竟小说太海量了,一章 3000 字, 1W 本就是 3000W 字啊
|
3
cxbig 2016-07-26 00:22:29 +08:00
@mikicomo 想想国内有多少五毛,你就知道这根本不是事。买一份正版,手打合并,在自己的平台卖实时更新等高端服务,免费看的等 1~2 天。手法多得是
|
4
manhere 2016-07-26 00:24:37 +08:00
杰奇 关关 啥的,自动采集,与官方同步
|
5
green15 2016-07-26 00:28:04 +08:00 via iPhone
很久就有起点的 ocr 软件了,手打太落伍了。
小说站基本用软件更新是直接抓 |
6
cxbig 2016-07-26 00:52:13 +08:00
@green15 OCR 是广泛使用的,人工手打带审阅的也不少。起点有机制防机器抓,像先放一篇假的等机器抓完了再换真文章,所以很多热门小说是有专人盯着的。
前段时间唐缺在知乎的“人到底可以有多不要脸?”的贴图: https://pic2.zhimg.com/0b571eaa058cb81fac7de4bc5493a169_b.jpg |
7
yexm0 2016-07-26 01:37:08 +08:00
的确,不过我追的小说中发现很少有作者开启这个放盗版的功能.可能是怕给那些心急的正版用户造成不便吧.
|
9
aru 2016-07-26 06:26:27 +08:00 via iPhone
有渠道的,现在大部分文是通过渠道直接抓文本
如果作者选择不同步到其它渠道,那只能手打 |
12
notgod 2016-07-26 08:01:24 +08:00 2
你要明确一个定义, 说清楚什么规模的
真正拿的上台面的更新及时的盗版小说站 不多只有几个 这个姑且叫一线类站 这类站 有个特点 就是专攻各种搜索排行榜 榜上有名的, 而那些点击小的 没人浏览的 基本都不入库 所以小说数据不多 但是都是那种热搜的 像一类站 他们有自己的团队 整个流程比较成熟 以前是有专门的维护人员 后来改为机器主力,人工辅助 整个流程差不多这样 首先 准备付费账户 比如起点 自动订阅小说 监控系统 自动登录 定时访问 监控到小说有新章节发布, 采集回来 如果是 文字章节,直接发布 图片章节,尝试 OCR 转换, (大站都是定制的 OCR 模块 非常简单 只是字体的问题而已 识别率很高) 如果 OCR 转换的章节小于 NN 个汉字,代表转换异常 图片章节,人工修正 你们好奇这些人工哪里来是不? 大部分是志愿者(练习打字 学五笔。。。。) 少部分兼职 中国什么多? 人多.... 以前贴吧红火的时候 部分会监控小说贴吧 一般间隔 10 分钟 贴吧就有最新章节出现了 那时候盗版不管 后来因为盗版问题 一些吧主主动改为 1 小时后更新 ..... 二线小说站 基本都采集 这类更新都直接采集的一线站点 然后使用采集器 比如关关采集器 什么作品都采集 靠量 一些乱七八糟的也采 然后你就经常看到一些 底部会加水印 我也不记得我哪年做过小说站了 应该是上海移动怒江机房被断网那年 我有个机器被 ko 了 那时候小说站不多 我挂个小说的小偷程序 一天都 50000IP 以上 后来感觉没挑战性 就撤了 那时候根本没什么版权概念 没人管 到现在我还有 2 个小说域名 我都不稀罕说...... NjV3eC5jb20= 和 eXl6dy5uZXQ= |
13
cye3s 2016-07-26 08:28:11 +08:00 via Android
起点手机浏览器版文本可直接复制
|
14
changshu 2016-07-26 08:46:50 +08:00
起点 VIP ORC 很成熟了, 在还没 android 那年代, UC 的特色功能之一就是起点 VIP 图片文字重排适配屏幕。
@cxbig 伪更新是作者搞的, 不是起点, 涉及到骗全勤和订阅字数的问题一旦举报起点要罚作者的, 只是一般不举不究。 |
15
changshu 2016-07-26 08:47:04 +08:00
ORC->OCR
|