V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
kofj
V2EX  ›  站长

每天 30 万 pv 的日志怎么做日志审核?

  •  
  •   kofj · 2014-10-21 00:30:43 +08:00 · 3237 次点击
    这是一个创建于 3678 天前的主题,其中的信息可能已经有所发展或是发生改变。
    近半个月来网站访问量猛增,日pv量在25-30万之间,第三方统计(cnzz和百度)的结果远小于日志的统计结果。用脚本分析日志后发现各个搜索引擎的蜘蛛爬行量也不足5万,而且通过脚本统计单IP访问量得到的TOP10数据中也没有发现访问量特别异常的(TOP One就没有超过200)。那么,问题来了,剩余的不明PV访问量到哪里去了哪?求日志审核方法和指导。

    P.S.阿里云ECS,有云盾清洗流量,服务器又运行脚本对单IP链接数超过10个的进行永久封杀(宁错杀1000勿放过1个)
    10 条回复    2014-10-21 18:56:17 +08:00
    tumutanzi
        1
    tumutanzi  
       2014-10-21 00:42:47 +08:00
    What is your domain?
    1up
        2
    1up  
       2014-10-21 01:06:45 +08:00 via iPad
    服务器日志?怎么定义pv的
    llhh
        3
    llhh  
       2014-10-21 01:10:28 +08:00
    楼主还是说下如何定义pv吧,这应该是个大问题。
    另外就是看下统计代码是否都加全了。
    jiyee
        4
    jiyee  
       2014-10-21 01:27:13 +08:00
    对request uri归类做top 20分析看看。
    另外对useragent可以做同样的分析。
    kofj
        5
    kofj  
    OP
       2014-10-21 01:47:21 +08:00
    @tumutanzi
    @1up
    @llhh
    大部分css和js使用的前端公共库CDN服务,只引用了一个css,js写在了页面中。简单粗暴的把日志中两个request算作了一个pv。

    @jiyee 可以试试~之前没有做过,查查资料去。
    webjin
        6
    webjin  
       2014-10-21 01:51:30 +08:00
    可以不使用阿里云啊
    xupefei
        7
    xupefei  
       2014-10-21 06:14:42 +08:00   ❤️ 1
    Tianpu
        8
    Tianpu  
       2014-10-21 06:32:36 +08:00 via iPhone   ❤️ 1
    kofj
        9
    kofj  
    OP
       2014-10-21 11:13:03 +08:00
    @webjin 用哪家的服务器咱暂且不讨论

    @xupefei
    @Tianpu
    谢谢两位,我来试试~
    webjin
        10
    webjin  
       2014-10-21 18:56:17 +08:00
    @tumutanzi localhost
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1051 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 22:33 · PVG 06:33 · LAX 14:33 · JFK 17:33
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.