V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
zoosucker
V2EX  ›  程序员

单个表,如何提高查询效率?

  •  
  •   zoosucker · 2014-08-22 16:08:52 +08:00 · 3852 次点击
    这是一个创建于 3732 天前的主题,其中的信息可能已经有所发展或是发生改变。
    现在有一张表,记录网段和对应地理位置,三个字段,一个网段开始IP,一个网段结束IP,一个地理位置,我使用了MySQL,多线程,索引,表分区,内存表,但是效率依旧不高,这样的业务适合Mysql吗?如果适合Mysql,怎样提高查询效率呢?
    19 条回复    2014-09-10 16:50:42 +08:00
    hvsy
        1
    hvsy  
       2014-08-22 16:12:29 +08:00
    提供详细的信息.字段的类型.数据量等.
    xing393939
        2
    xing393939  
       2014-08-22 16:15:25 +08:00
    貌似的用来通过ip确定地区的,一定要用查表的方式吗
    zoosucker
        3
    zoosucker  
    OP
       2014-08-22 16:16:24 +08:00
    @hvsy IP字段是32位整型的,地址位置是varchar(300),数据量大概50W条记录。业务是输入一个IP地址,给出地址位置。
    shiny
        4
    shiny  
       2014-08-22 16:17:01 +08:00
    根据 ip 查地理位置? ip2long,然后每次查询的时候把 ip 转成整数查范围。
    shiny
        5
    shiny  
       2014-08-22 16:18:51 +08:00
    44万条的纯真 ip sqlite 数据库都跑得飞快,可以参考下……
    zoosucker
        6
    zoosucker  
    OP
       2014-08-22 16:19:01 +08:00
    @shiny 我知道,还有个MM,不过那是竞争对手,肯定没法用了。
    akira
        7
    akira  
       2014-08-22 16:19:30 +08:00
    一个网段开始IP,一个网段结束IP

    改成可以直接比较的数字,并建立索引, 查询定位应该能有数量级的速度提升
    zoosucker
        8
    zoosucker  
    OP
       2014-08-22 16:21:24 +08:00
    @akira 都用了,不过效率依然不高啊。
    akira
        9
    akira  
       2014-08-22 16:26:20 +08:00
    explain 下你的sql,看看是不是哪里全表扫描了
    pp3182429
        10
    pp3182429  
       2014-08-22 16:26:48 +08:00
    mysql里有自带的IP转换为数字的函数 inet_aton ,再给IP加个索引,插入的时候会慢一点,但是查询的话应该会很快
    zoosucker
        11
    zoosucker  
    OP
       2014-08-22 16:40:30 +08:00
    @akira select address from ip_db where ip between ip_start and ip_end;
    royzheng
        12
    royzheng  
       2014-08-22 16:43:15 +08:00   ❤️ 1
    表StartIP,EndIP,Location,另外再新建两个字段StartIPInt,EndIPInt
    比如
    StartIP:1.2.3.4
    EndIP:5.6.7.8
    Location:US
    StartIPInt:1*256^3+2*256^2+3*256^1+4*256^0=16909060
    EndIPInt:5*256^3+6*256^2+7*256^1+8*256^0=84281096

    比如查询2.4.5.9
    2.4.5.9=2*256^3+4*256^2+5*256^1+9*256^0=33817865

    select * from ip where StartIPInt <= 33817865 AND EndIPInt >=33817865
    效率能慢到哪里去
    akira
        13
    akira  
       2014-08-22 16:50:06 +08:00
    @zoosucker 不要用between。用royzheng的方法来写
    zoosucker
        14
    zoosucker  
    OP
       2014-08-22 16:51:27 +08:00
    @akira 好吧 我试试看
    2688
        15
    2688  
       2014-08-22 23:12:04 +08:00
    才50万 不可能慢,就大于和小于比较而已。
    zoosucker
        16
    zoosucker  
    OP
       2014-08-23 08:05:35 +08:00
    @2688 单条查询不慢,差多了就慢了,请问一秒能查10W次吗?
    nomaka
        17
    nomaka  
       2014-08-23 11:38:42 +08:00
    一秒10w次 你已经不能用单台mysql了吧, 找个内存数据库
    Zuckonit
        18
    Zuckonit  
       2014-08-23 16:36:42 +08:00
    @nomaka +1
    zoosucker
        19
    zoosucker  
    OP
       2014-09-10 16:50:42 +08:00
    最后用了redis,约1.4亿IP,用了32GB内存,没有between and 直接select操作,10W条用了0.7s。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2658 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 03:09 · PVG 11:09 · LAX 19:09 · JFK 22:09
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.