V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
bug51
V2EX  ›  前端开发

问个名字,一种 html 内容防复制的解决方案

  •  
  •   bug51 · 243 天前 · 764 次点击
    这是一个创建于 243 天前的主题,其中的信息可能已经有所发展或是发生改变。

    比如博文是这个内容:“这里有段文字”

    输出到 html: “这 gss 里 xcv 有 ewf 段 sdv 文 sdf 字”

    因为背景图是白色的,那些乱码混淆文字输出到 html 也是白色,在视觉上自动隐藏了。看上去没问题,但是复制文本和爬虫会有乱码

    这种是什么技术?想问个名字自己找插件或者命名做一个插件

    8 条回复    2024-03-28 11:30:51 +08:00
    dfkjgklfdjg
        1
    dfkjgklfdjg  
       243 天前   ❤️ 1
    反爬虫使用的比较多的印象中是自定义字体的方式 👉 [斗鱼关注人数爬取 ── 字体反爬的攻与防 - CJ Ting's Blog]( https://cjting.me/2020/07/01/douyu-crawler-and-font-anti-crawling/)
    bronana
        2
    bronana  
       243 天前
    安装上这个插件就可以了
    [Simple Allow Copy]( https://chromewebstore.google.com/detail/aefehdhdciieocakfobpaaolhipkcpgc)
    AlexPao
        3
    AlexPao  
       242 天前
    这种解决方案非常有意思, mark.
    就是一个问题是, 这样做, 原理上呈现给搜索引擎的, 是
    “这里有段文字” 还是 “这 gss 里 xcv 有 ewf 段 sdv 文 sdf 字”
    后者还是不利于做 SEO 的, 只能用于防范盗版
    bug51
        4
    bug51  
    OP
       242 天前
    @AlexPao #3 是的,不利于做 seo 。作为弥补 seo 的话,只能抽取一些页面内容的关键词塞在 html 的 meta 上面。
    AlexPao
        5
    AlexPao  
       242 天前
    @bug51 还有一个问题是担心这种相对搜索引擎来说杂乱无章的文字可能会被判定为 scam, 反而怕比不做 seo 更坏
    bug51
        6
    bug51  
    OP
       242 天前
    @AlexPao 我模糊记得,爬虫不会爬”单页应用“的吧,单页应用 js 还没执行就看不到内容,只能摘取 html meta 。

    只能说试过才知道
    bug51
        7
    bug51  
    OP
       242 天前
    @AlexPao 有看见过 2 个颜色网站是这么做的。

    这 s 是 v 一 c 段 x 文 f 字 randomEnd 。英文的都是白色。视觉看不出来。
    AlexPao
        8
    AlexPao  
       240 天前
    "英文的都是白色。视觉看不出来。"
    这种是针对用户的, 实际搜索引擎还是抓的全文, 也就是他会看到并且易识别为
    "这 s 是 v 一 c 段 x 文 f 字 randomEnd"

    你说的是否单页应用我不太懂, 但是个人感觉爬虫肯定是要爬内容的, 不然网页爬来干啥
    所以这类方案可能只适合用于本身自带流量的站, 又要 SEO 优化又要防盗感觉是做不到的
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   961 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 21:12 · PVG 05:12 · LAX 13:12 · JFK 16:12
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.