mysql查询语句中使用星号真的慢的要死？

时间：2019-08-21 01:19:07 阅读：134 评论：0 收藏：0 [点我收藏+]

前言

之所以写这篇文章，是源于以前看过的关于sql语句优化的帖子，里面明确提到了在sql语句中不要使用 * 来做查询，就像下面的规则中说的

2、尽量避免使用select *，返回无用的字段会降低查询效率。如下：

SELECT * FROM t 

优化方式：使用具体的字段代替*，只返回使用到的字段。

但是中国有句姥话叫“尽信书不如无书”，难道在sql查询语句中使用星号就真的慢的要死，难道加索引也不行？带着这些个疑问，我进行了一些测试。结果发现，江湖传说未必真的靠得住。那具体测试情况是咋样的呢？下面且听我给各位看官慢慢分解。

　　事先声明，本文是抛砖文，只进行测试，不做原理分析（要不然篇幅太长，各位看官估计要看睡着了）。本文的一切测试均以实际测试数据为准，拒绝假大空。

测试环境准备

我这次测试的系统环境如下：

Win10系统
Mysql5.7.26 64位版本，使用默认的InnoDB存储引擎

　　然后我准备了一张tb_item表，用来存放测试数据，数据是我跟朋友要的一些商品信息数据。

　　下图是tb_item表的结构

技术分享图片

　　tb_item表中的部分数据

技术分享图片

　　我将从以下几个方面去进行测试：

count查询
联表查询
分页查询

　　好，闲话不多说，马上开整。

一．count查询

在count查询操作中，又分为两种情况，不带where条件的count查询，和带where条件的count查询。那我们就依次来测试一下。

1. 不带where条件的count查询

　　我们先来测试一下统计整个表的记录数。首先给大家剧透一下，tb_item表一共有300万条数据。执行 SELECT COUNT(*) FROM tb_item，结果如下图所示

技术分享图片

　　可以看到，查询时间是7秒多。如果是配置一般的机器，估计会更慢。显然，统计整张表的数据量，使用星号貌似是不行的。

　　那有没有办法可以优化一下呢？当然有啊，而且我都给大家测试好了。在tb_item表中有一个 status 字段，不知道大家注意到了没有

技术分享图片

　　我们发现，这个字段的长度才占一个varchar。那如果我们修改一下刚才的sql，改成

　　SELECT COUNT(STATUS) FROM tb_item

　　又会如何呢？我们执行一下这条sql，看一下结果

技术分享图片

　　可以看到，这次的查询时间是4秒多，快了将近一半。

　　如果我们给 status 字段加个索引，结果又会怎样呢？那我们就加个索引试试。执行

　　CREATE INDEX idx_tb_item_status ON tb_item(STATUS)

　　然后我们再执行一下 SELECT COUNT(STATUS) FROM tb_item，结果如下图

技术分享图片

　　这次的查询时间是0.9秒，不到1秒。

　　从一开始的7秒多到现在的不到1秒，查询时间缩短了85%。这个优化结果真是爽的一批啊。

2. 带where条件的count查询

　　现在我们再试一下使用星号执行带where条件的查询操作会是个什么情况。我们简单一些，就查询价格小于1000块钱的商品数据。

　　执行 SELECT COUNT(*) FROM tb_item t WHERE t.price<1000，结果如下图

技术分享图片

　　查询时间是6秒多。那我们给price字段加上索引后，再看看是个什么情况。执行下面的sql给price字段加索引

　　CREATE index idx_tb_item_price ON tb_item(price)

　　然后再次执行 SELECT COUNT(*) FROM tb_item t WHERE t.price<1000，结果如下图

技术分享图片

　　各位朋友，你们没有看错，加了索引之后，查询时间确实只有0.28秒。这查询效率提升了 99% 啊，简直爽得不要不要的。

　　那如果我们将星号换成长度只有一个varchar的 status 字段，情况又会是咋样的呢？我们来试一下

技术分享图片

　　是的，你没看错，这次查询又花了6秒多的时间。也就是说，price字段的索引失效了。

　　看来带where条件的情况下，直接指定具体字段还不如直接用星号呢。

　　刚才我们只测试了带一个查询条件的情况，下面我们再来试试带多个查询条件的情况。这次我查询price大于1000，sellerid（品牌代码）字段是oppo的数据。预期查询时间小于1秒

技术分享图片

　　查询时间6秒多，不能接受。那我先给sellerid字段上个索引再试试

技术分享图片

　　查询时间5秒，还是太慢。那就上个组合索引，给price和sellerid字段加个组合索引再试试。

技术分享图片

　　这次的查询时间是1秒多，虽然已经算不错了，但是还是没有达到我们预期的结果。而且我总不能增加一个查询条件，就改一次索引吧？

　　所以，对于这种百万级别数据的多条件查询的情况，最好的解决办法就是上一个数据检索系统，比如lucence或者elastic search，然后把数据导入到数据检索系统中，让它帮mysql完成数据的条件检索，Mysql只提供数据的详情查询服务。而且，像es这样的系统还带有分词功能，可以轻松通过关键词实现数据的检索。这比使用mysql的like操作来检索数据，效率不知道要高多少倍。所以，专业的事情还是交给专业的系统去干。别跟我说公司没钱，上不起es。数据量达到300w的业务，你跟我说没钱？