为什么我使用分区列了进行查询，但 MYSQL 还是扫描了所有的分区

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 2465 天前的主题，其中的信息可能已经有所发展或是发生改变。

1、背景

我们一个交易表，数据量比较大（一个星期大概有 2000W 的新数据）。现在老板想让我们对这个表做个分区，增加一下性能。没办法被赶鸭子上架，大概看了一下手册后，以周为单位，按时间设计了这样的分区结构：

CREATE TABLE t_o2o_dm (
id bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '订单编号',
device_id int(10) unsigned DEFAULT NULL COMMENT '设备编号',
dt datetime NOT NULL DEFAULT '0000-00-00 00:00:00' COMMENT '上传时间',
PRIMARY KEY (id,dt),
KEY IDX_DT (dt),
KEY IDX_DEVICE_ID (device_id),
) ENGINE=InnoDB DEFAULT CHARSET=utf8 ROW_FORMAT=DYNAMIC
PARTITION BY RANGE (YEARWEEK(dt))
(PARTITION p1 VALUES LESS THAN (201901) ENGINE = InnoDB,
.......
PARTITION p52 VALUES LESS THAN (201952) ENGINE = InnoDB,
PARTITION p53 VALUES LESS THAN MAXVALUE ENGINE = InnoDB);

2、问题

第一问题是：在进行测试时，我发现使用这样的查询语句： EXPLAIN PARTITIONS SELECT * FROM t_o2o_dm WHERE dt BETWEEN "2019-03-10 00:00:00" AND "2019-03-10 23:59:59" 竟然无法过滤分区，每次查询都会把所有分区都扫描一次。可是按官网描述优化器应该根据 dt 列直接将查询范围固定到特定的分区才对。下面是这条语句 explain 的执行结果：

另一个就是，执行下面这样的查询语句时： SELECT * FROM t_o2o_dm WHERE dt BETWEEN "2019-03-11 00:00:00" AND "2019-03-11 23:59:59" AND device_id = "382414"。查询效率竟然比不分区还慢一倍。

有没有做过表分区的老哥来介绍下经验啊，我百度谷歌找了半天全是几篇一样的文章，都是从 mysql 官方手册和高性能 mysql 上粘过去。很无奈啊

分区

innodb

partition

engine

2 条回复 • 2019-03-14 15:04:23 +08:00

noe132

2019-03-14 14:57:01 +08:00

dt 有索引吗？

echo404

2019-03-14 15:04:23 +08:00

@noe132 有