V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
dalieba
V2EX  ›  V2EX

能不能拦截 Internet Archive 的数据请求?

  •  
  •   dalieba · 2019 年 1 月 28 日 · 4241 次点击
    这是一个创建于 2556 天前的主题,其中的信息可能已经有所发展或是发生改变。
    不知道有没有可能在 V 站的 robots.txt 加一条规则,从而排除来自这个网站的爬虫。
    6 条回复    2019-01-29 04:10:39 +08:00
    wjm2038
        1
    wjm2038  
       2019 年 1 月 28 日 via Android
    /t/531025
    你俩可以唠唠嗑
    dalieba
        2
    dalieba  
    OP
       2019 年 1 月 28 日
    有情 @Livid
    Tink
        3
    Tink  
    PRO
       2019 年 1 月 28 日 via iPhone
    这是有啥讲究么?屏蔽这个网站
    ryd994
        4
    ryd994  
       2019 年 1 月 29 日 via Android
    @Tink 估计是有不想留下记录的文章
    然而 robots.txt 只是一种约定俗成,并不是严格规范,不遵守的爬虫多了去了。
    Trumeet
        5
    Trumeet  
       2019 年 1 月 29 日 via Android   ❤️ 1
    1. 没有意义
    2. 没用
    3. 可以实现
    phy25
        6
    phy25  
       2019 年 1 月 29 日 via Android
    对于编辑的限制是为了让大家对发表在 V2EX 的言论更加负责。https://www.v2ex.com/faq
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   950 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 35ms · UTC 21:12 · PVG 05:12 · LAX 13:12 · JFK 16:12
    ♥ Do have faith in what you're doing.