V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
kofj
V2EX  ›  站长

每天 30 万 pv 的日志怎么做日志审核?

  •  
  •   kofj · 2014 年 10 月 21 日 · 3547 次点击
    这是一个创建于 4101 天前的主题,其中的信息可能已经有所发展或是发生改变。
    近半个月来网站访问量猛增,日pv量在25-30万之间,第三方统计(cnzz和百度)的结果远小于日志的统计结果。用脚本分析日志后发现各个搜索引擎的蜘蛛爬行量也不足5万,而且通过脚本统计单IP访问量得到的TOP10数据中也没有发现访问量特别异常的(TOP One就没有超过200)。那么,问题来了,剩余的不明PV访问量到哪里去了哪?求日志审核方法和指导。

    P.S.阿里云ECS,有云盾清洗流量,服务器又运行脚本对单IP链接数超过10个的进行永久封杀(宁错杀1000勿放过1个)
    10 条回复    2014-10-21 18:56:17 +08:00
    tumutanzi
        1
    tumutanzi  
       2014 年 10 月 21 日
    What is your domain?
    1up
        2
    1up  
       2014 年 10 月 21 日 via iPad
    服务器日志?怎么定义pv的
    llhh
        3
    llhh  
       2014 年 10 月 21 日
    楼主还是说下如何定义pv吧,这应该是个大问题。
    另外就是看下统计代码是否都加全了。
    jiyee
        4
    jiyee  
       2014 年 10 月 21 日
    对request uri归类做top 20分析看看。
    另外对useragent可以做同样的分析。
    kofj
        5
    kofj  
    OP
       2014 年 10 月 21 日
    @tumutanzi
    @1up
    @llhh
    大部分css和js使用的前端公共库CDN服务,只引用了一个css,js写在了页面中。简单粗暴的把日志中两个request算作了一个pv。

    @jiyee 可以试试~之前没有做过,查查资料去。
    webjin
        6
    webjin  
       2014 年 10 月 21 日
    可以不使用阿里云啊
    xupefei
        7
    xupefei  
       2014 年 10 月 21 日   ❤️ 1
    Tianpu
        8
    Tianpu  
       2014 年 10 月 21 日 via iPhone   ❤️ 1
    kofj
        9
    kofj  
    OP
       2014 年 10 月 21 日
    @webjin 用哪家的服务器咱暂且不讨论

    @xupefei
    @Tianpu
    谢谢两位,我来试试~
    webjin
        10
    webjin  
       2014 年 10 月 21 日
    @tumutanzi localhost
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3883 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 10:21 · PVG 18:21 · LAX 02:21 · JFK 05:21
    ♥ Do have faith in what you're doing.