V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
ranran
V2EX  ›  问与答

写网站程序时, url 的页码数值超出最大页面数量,该返回什么对搜索引擎友好一些

  •  
  •   ranran · 2014-12-13 09:04:28 +08:00 · 3047 次点击
    这是一个创建于 3625 天前的主题,其中的信息可能已经有所发展或是发生改变。
    比如说 分类下 有98页内容 但是却有一个url为99的被收录了

    简单说明,该列表为文章列表,目前数量有98页
    list.php?page=98

    但是搜索引擎收录了一个这样的网址(看了下快照,里面显示的是一个没有文章的列表页[也就是一个“没有可是显示的记录”的提示,是我自己当初判断页码超出最大页面值后输出的一个提示])
    list.php?page=99
    [内容和前面的列表页一样,没有返回500或者404错误,只是在列表内容部分显示了一个没有可以显示的记录]

    那么问题出来了,按理说这样的页面属于不存在的,应该返回404错误,但是如果返回404,搜索引擎会不会很长时间都跳过这一页不去收录了呢……

    返回500错误也不对,据说搜索引擎遇到这样的页面,会认定这个页面暂时发生错误,晚点会再来看看(502之类也会相同处理,可能频率上有所不同)

    那么还有可以选择的就是301和302,301是永久性跳转,告知该页面永久性迁移到某个网址……而302是临时性跳转……





    所以问题出来了,你们处理这种情况的时候,是返回什么错误代码呢,是否页面跳转到其他地方去呢?

    之所以要处理这样的情形,主要是因为这样的情况出现的可能性还是可能会多次存在……如果都让搜索引擎去判断和收录,那会造成重复收录的情况吧……(就是很多网址都是完全相同的内容)

    所以如何告知搜索引擎,这个页面是不存在的,但是以后它还是可能会存在的……

    我比较想用跳转,跳转到该栏目或者分类的第一页列表…… 但是不知道该选择301或者302,或者用js去跳转?
    10 条回复    2014-12-13 21:30:47 +08:00
    loveyu
        1
    loveyu  
       2014-12-13 09:36:34 +08:00
    应该直接404吧,既然没有这一页那这个链接怎么冒出来的。还有现在404不代表搜索引擎永远不来了吧,应该可以通过sitemap更新的
    Havee
        2
    Havee  
       2014-12-13 09:37:59 +08:00
    程序逻辑上去解决,而不是事后去补救,顺带耍一下搜索引擎。

    现在还有研究seo的啊,总原则就是把搜索引擎当作一个访客就行,搜索引擎越来越智能化了
    scys
        3
    scys  
       2014-12-13 09:59:22 +08:00 via Android
    第一页
    imn1
        4
    imn1  
       2014-12-13 10:15:57 +08:00
    如果搜索引擎已经开始收录,它会很频繁来爬的,不用担心“长时间”
    其实可以参考大站的做法,大站一般都是比总页数多一页的,最后这一页放同类题材的介绍、导航,特别是图片是这样,文章就很少这样,会算清楚
    RobberPhex
        5
    RobberPhex  
       2014-12-13 10:30:57 +08:00
    首先301肯定不能用,因为你没有**永久**重定向。
    其次50x也不能用,因为确实在程序预料之中。

    从语义上来说,404表示没有找到,302表示页面临时移动,所以推荐404。

    这个问题具有参考价值(不过没有讨论302和404直接的区别):
    http://webmasters.stackexchange.com/questions/43102/what-google-will-do-while-switching-from-301-404-to-200
    ranran
        6
    ranran  
    OP
       2014-12-13 10:47:24 +08:00
    @loveyu
    @RobberPhex 恩 综合考虑下也只能是用404了,不过在其他地方的404我都是用301跳转回栏目,因为那种404基本就是永久的404了,所以直接301就好了,这个就用404好了,谢谢!


    @Havee 虽然说是越来越智能了,但是还是考虑下比较好,真的……

    @scys = =!如果是直接显示第一页,还是会产生很多重复页啊……


    @imn1 嗯 决定用404了,本来就不是正确的页面
    bjzhush
        7
    bjzhush  
       2014-12-13 11:17:27 +08:00
    404 Not Found
    laoyuan
        8
    laoyuan  
       2014-12-13 12:25:00 +08:00
    最后一页内容
    dorentus
        9
    dorentus  
       2014-12-13 14:23:56 +08:00 via iPhone
    404

    另外按相关 RFC 里面的说法,user agent(浏览器、搜索引擎、代理服务器)必须把 404 当成一个临时状态。
    ranran
        10
    ranran  
    OP
       2014-12-13 21:30:47 +08:00
    @bjzhush
    @laoyuan
    @dorentus 谢谢,已经改成404状态码
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1380 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 17:54 · PVG 01:54 · LAX 09:54 · JFK 12:54
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.