MySQL 单表三千万条数据，怎么优化 count 查询？

查询

count

分表

MySQL

46 条回复 • 2020-09-30 10:47:06 +08:00

1

Joyboo

2020 年 9 月 29 日

分区，索引

2

G2bN4dbX9J3ncp0r

2020 年 9 月 29 日

可以不做 count，就不做
非做的话，看看能不能自己统计

或者放 es 里？

3

CodeXx

OP

2020 年 9 月 29 日

@Joyboo 索引对 count 查询貌似没用，还是得扫描全表

4

CodeXx

OP

2020 年 9 月 29 日

@lidashuang 分页查询用到的，也不知道会用什么条件查询

5

huntcool001

2020 年 9 月 29 日

2

每天晚上把到零点的数据库的数据,离线做分析统计,count+各种查询条件等等(大概 es 或者其他框架,我不是很清楚), 结果存起来.

然后每天的数据,你有了当天零点以来的 binlog,就有了增量的 count. 和离线分析做出来的 count 结合起来.

大概是这个思路. 大厂都是这么干的.

6

RickyC

2020 年 9 月 29 日

如果数据库不经常改变
根据查询条件建立几个 count 表, 里面保存根据各种条件得到的 count 数字;
并给 count 表建立索引

这样也许行

7

RickyC

2020 年 9 月 29 日

接上
如果你每天还有 10w 的数据更改, 可以在每次更改的时候修改 count 表.

我觉得用 count 表可能解决你的问题. 预先统计

8

egglin

2020 年 9 月 29 日

异构吧，es + mysql

9

maigebaoer

2020 年 9 月 29 日 via Android

如果直接 count，用 count(*)吧，没啥特别好的建议。要不就直接入库前统计，写 count 字段。

10

mrhhsg

2020 年 9 月 29 日

三千万的 count 那还不是一瞬间的事？加内存就完了

11

v2orz

2020 年 9 月 29 日

插入的时候维护 count 信息？同 9L

12

Leigg

2020 年 9 月 29 日 via Android

1

不要做实时查询即可，延迟个 30s 几分钟，数量到达一定高度后，多数场景中的实时统计就变成了一种伪需求，如果一定需要，换数据库，比如 clickhouse

13

RangerWolf

2020 年 9 月 29 日

12 楼+1，clickhouse 的统计非常🐂

14

dongisking

2020 年 9 月 29 日

这问题我这边也遇到过，特别是做管理后台特别多复杂的条件做 where 的 count 根本无法缓存，最后的解决办法是把 count 缓存，然后页面显示“大约 xx 条”，每一段时间更新一次

15

cccy0

2020 年 9 月 29 日

近实时统计的话建议放 es

16

sagaxu

2020 年 9 月 29 日 via Android

@CodeXx 索引 count 时有没有用，要看区分度，你索引类似性别这种低区分度的当然没用

17

liuzhaowei55

2020 年 9 月 29 日 via Android

不要使用 count，如果是 id 自增而且没有删除数据可以使用最后一条数据的 id，或者使用 explain 返回的 rows，这个值不太准但响应很快

18

nomansky

2020 年 9 月 29 日

加个表，里面保存 count，每插入一条数据更新 count

19

haohappy

2020 年 9 月 29 日

count 慢 select 不慢吗

20

dzdh

2020 年 9 月 29 日

@CodeXx 分页场景的话，where 排序字段 >上一页的最大值 limt x, n

21

juntao

2020 年 9 月 29 日

最近有遇到，多字段 WHERE 查询，1kw 条不到，不想分表
1 做好索引。可以用 EXPLAIN 来帮助优化。 -- 有一定效果
2 限制查询的时间范围 -- 特别有效
3 异构，mysql，redis 、elasticsearch 等等单独统计数据，因为 2 能够满足我们的需求，所以没采用。

@liuzhaowei55 直接获取自增 id 也是一种方法诶。之前没考虑，需要匹配场景。