2021-07-09

新来的领导下令升级 MySQL 8.0,完美掉坑…

你在使用MySQL的Group by分组时,是否发现分组后的数据都是有序的?

其实,在MySQL8.0版本前,优化器在分组查询时都会进行隐式排序。

那既然隐式排序为什么还要保留Order by?隐式排序的目的又是什么呢?让我们一起来看看。

一、背景小故事

年前我们换了领导。

俗话说,新官上任干总爱干傻事儿,这不,领导要拥抱新事物,要求我们更新项目MySQL版本,从MySQL5.7更新到MySQL8.0。

不知是MySQL5.7不香了,还是领导你眼光高了?

我把这个任务交给同事小王,小王不以为然,说换就换。迁完库,在代码基本不改的情况下自信上线。上线后却发现原本一些有序的列表变无序了,最后临时回退了版本。

核对代码时我们发现,老版本Select语句中只是用到了Group by分组,也没有用到order by排序,有点蒙,为啥没用order by却排了序?

查资料后得知,在MySQL8.0版本前是存在Group by隐式排序的!

就是说在我们使用分组(Group by)时,如:select * from T group by appName; 会默认按照appName正序排序,相当于 select * from T group by appName order by appName;,倒排同理:select * from T group by appName desc

可见,MySQL在8.0版本前的分组查询中,偷偷加上了排序操作。

纳尼?MySQL还有这种操作?快找一下官方文档对Group by隐式排序的介绍:

官方文档

官方文档 MySQL 5.7 Reference Manual 中的"2.1.14 ORDER BY Optimization"章节有如下介绍:

GROUP BY implicitly sorts by default (that is, in the absence of ASC or DESC designators for GROUP BY columns). However, relying on implicit GROUP BY sorting (that is, sorting in the absence of ASC or DESC designators) or explicit sorting for GROUP BY (that is, by using explicit ASC or DESC designators for GROUP BY columns) is deprecated. To produce a given sort order, provide an ORDER BY clause.

翻译:

默认情况下GROUP BY隐式排序(即,缺少GROUP BY列的ASC或DESC指示符)。但是,不推荐依赖于隐式GROUP BY排序(即,在没有ASC或DESC指示符的情况下排序)或GROUP BY的显式排序(即,通过对GROUP BY列使用显式ASC或DESC指示符)。要生成给定的排序 ORDER,请提供ORDER BY子句。

从MySQL 8.0开始,GROUP BY字段不再支持隐式排序. 官方文档MySQL 8.0 Reference Manual中"8.2.1.16 ORDER BY Optimization"章节有如下介绍:

Previously (MySQL 5.7 and lower), GROUP BY sorted implicitly under certain conditions. In MySQL 8.0, that no longer occurs, so specifying ORDER BY NULL at the end to suppress implicit sorting (as was done previously) is no longer necessary. However, query results may differ from previous MySQL versions. To produce a given sort order, provide an ORDER BY clause.

翻译:

以前(MySQL 5.7及更低版本),GROUP BY在某些条件下隐式排序。 在MySQL 8.0中,不再发生这种情况,因此不再需要在末尾指定ORDER BY NULL来抑制隐式排序(如前所述)。

但是,查询结果可能与以前的MySQL版本不同。 要产生给定的排序顺序,请提供ORDER BY子句

陈哈哈:"哦,这么看来开发老版本的同事是没用Order by,直接用了隐式排序。年轻人,不讲武德啊!!"

小王(小声):"哈哥,这模块之前好像是你负责的。"

陈哈哈(老脸一红):???

陈哈哈:"咳咳,这MySQL8.0团队不讲武德,给我挖坑!"

好了,接下来我们用测试数据演示一下

数据测试

下面是表T测试数据,无序

mysql> SELECT pid,appName from T; +--------+-------------------------+| pid | appName     |+--------+-------------------------+|  1 | Dock Sound Redirector ||  2 | Blues Music station ||  3 | usb tether TRIAL  ||  4 | Il vero test del QI ||  5 | FlightTime Calculator ||  6 | ZX Spectrum Emulator ||  7 | The City Dress Up  |+--------+-------------------------+7 rows in set (0.00 sec)

实验1:(MySQL版本:5.7.24)

-- 隐式排序mysql> SELECT pid,appName from T group by appName; +--------+-------------------------+| pid | appName     |+--------+-------------------------+|  2 | Blues Music station ||  1 | Dock Sound Redirector ||  5 | FlightTime Calculator ||  4 | Il vero test del QI ||  7 | The City Dress Up  ||  3 | usb tether TRIAL  ||  6 | ZX Spectrum Emulator |+--------+-------------------------+7 rows in set (0.00 sec)-- 如上述隐式排序,相当于SELECT pid,appName from T group by appName asc 或 SELECT pid,appName from T group by appName order by appName asc;-- 显式排序,相当于SELECT pid,appName from T group by appName order by appName desc;mysql> SELECT pid,appName from T group by appName desc; +--------+-------------------------+| pid | appName     |+--------+-------------------------+|  6 | ZX Spectrum Emulator ||  3 | usb tether TRIAL  ||  7 | The City Dress Up  ||  4 | Il vero test del QI ||  5 | FlightTime Calculator ||  1 | Dock Sound Redirector ||  2 | Blues Music station |+--------+-------------------------+7 rows in set (0.00 sec)

实验2:(MySQL版本:8.0.16)

mysql> SELECT pid,appName from T group by appName; +--------+-------------------------+| pid | appName     |+--------+-------------------------+|  1 | Dock Sound Redirector ||  2 | Blues Music station ||  3 | usb tether TRIAL  ||  4 | Il vero test del QI ||  5 | FlightTime Calculator ||  6 | ZX Spectrum Emulator ||  7 | The City Dress Up  |+--------+-------------------------+7 rows in set (0.00 sec)mysql> SELECT pid,appName from T group by appName DESC;ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'DESC' at line 1

如上所示,在MySQL 8.0中,GROUP BY隐式排序不支持了,上面测试例子是无序的。GROUP BY显示排序则直接报错。所以如果有数据库从MySQL 5.7或之前的版本,迁移升级到MySQL 8的话,就需要特别留意这个问题了。

二、隐式排序 - 起源(一个优美的BUG)

最初为什么要用隐式排序呢?

我们知道,要对一组数据进行分组,MySQL优化器会选择不同的方法。其中最有效的一种是分组之前对数据排序,降低数据复杂度,使得连续分组变得很容易。

另外,如果可以Group by 一个索引字段来用于获取排序的数据,那么使用它的成本就非常低了(因为BTree索引是天然有序的)。而在实际操作中,Group by用到索引的频率很高。这么看,这确实是个很棒的主意!也可以说是留了一个优美的BUG。

如下查询语句,用到了appName_idx索引,因此group by查询不需要排序,直接分组,高效。

-- 有索引:appName_idxmysql> EXPLAIN SELECT appName from 0122_csj_demo GROUP BY appName \G*************************** 1. row ***************************   id: 1 select_type: SIMPLE  table: 0122_csj_demo partitions: NULL   type: indexpossible_keys: appName_idx   key: appName_idx  key_len: 515   ref: NULL   rows: 28  filtered: 100.00  Extra: Using index1 row in set, 1 warning (0.00 sec)

如果没有索引,MySQL优化器仍然可以决定在分组之前用外部临时表进行filesort排序,从效率上讲,和无序分组差不多。当用户指定Order by......

原文转载:http://www.shaoqun.com/a/859325.html

跨境电商:https://www.ikjzd.com/

6pm:https://www.ikjzd.com/w/317

垂直电商:https://www.ikjzd.com/w/1450

paipaiwang:https://www.ikjzd.com/w/2205


你在使用MySQL的Groupby分组时,是否发现分组后的数据都是有序的?其实,在MySQL8.0版本前,优化器在分组查询时都会进行隐式排序。那既然隐式排序为什么还要保留Orderby?隐式排序的目的又是什么呢?让我们一起来看看。一、背景小故事年前我们换了领导。俗话说,新官上任干总爱干傻事儿,这不,领导要拥抱新事物,要求我们更新项目MySQL版本,从MySQL5.7更新到MySQL8.0。不知是M
isbn:https://www.ikjzd.com/w/174
亚马逊listing转化率优化系列教程一:怎样优化listing图片?:https://www.ikjzd.com/articles/126908
亚马逊旺季FBA再次限仓,卖家该如何应对?:https://www.ikjzd.com/articles/126876
Lazada管制防疫物品:罚款、关店全都有!:https://www.ikjzd.com/articles/126910
澳大利亚,一个被卖家们低估的跨境蓝海市场:https://www.ikjzd.com/articles/126855
我解开了岳的乳 岳好紧好紧我要进去了:http://lady.shaoqun.com/a/247389.html
被邻居老头不停的要 老头使劲在我身上耸动:http://lady.shaoqun.com/m/a/247346.html
少妇口述:乱性丈夫将我拖进换妻游戏:http://www.30bags.com/m/a/249618.html
女海王阵型!不告诉男朋友就勾搭富二代!数百万粉丝,Tik Tok女人,网络名人,做了很多轮:http://lady.shaoqun.com/a/410933.html
清迈的一个天桥小舒林成同志,被居民举报:http://lady.shaoqun.com/a/410934.html
女人为什么选择"暧昧"?倾听中年妇女的心声:http://lady.shaoqun.com/a/410935.html
独立站高昂流量成废品,如何操作才能起死回生?(上):https://www.ikjzd.com/articles/146487

No comments:

Post a Comment