经常进行数据分析的小伙伴经常会需要生成序号或进行数据分组排序并生成序号。在MySQL8.0中可以使用窗口函数来实现,可以参考历史文章有了这些函数,统计分析事半功倍进行了解。而MySQL5.7中由于没有这类函数,该如何实现呢,下面对比MySQL8.0,列举两种情况的实现。
创建一张演示表:
#创建表
CREATE TABLE users (
id INT PRIMARY KEY,
group_id INT,
c_name VARCHAR(64)
);
插入演示数据:
-- 插入10行数据
INSERT INTO users VALUES (1, 1, '张三');
INSERT INTO users VALUES (2, 1, '李四');
INSERT INTO users VALUES (3, 2, '王五');
INSERT INTO users VALUES (4, 2, '赵六');
INSERT INTO users VALUES (5, 3, '钱七');
INSERT INTO users VALUES (6, 1, '周八');
INSERT INTO users VALUES (7, 2, '吴九');
INSERT INTO users VALUES (8, 3, '郑十');
INSERT INTO users VALUES (9, 1, '孙十一');
INSERT INTO users VALUES (10, 3, '李十二');
在MySQL8.0中可以直接使用窗口函数ROW_NUMBER()来实现序号的生成,例如:
# 根据c_name字段进行排序生成序号
SELECT
ROW_NUMBER() OVER (ORDER BY c_name) AS row_num,
id,
c_name
FROM
users;
结果如下:
+---------+----+-----------+
| row_num | id | c_name |
+---------+----+-----------+
| 1 | 7 | 吴九 |
| 2 | 6 | 周八 |
| 3 | 9 | 孙十一 |
| 4 | 1 | 张三 |
| 5 | 10 | 李十二 |
| 6 | 2 | 李四 |
| 7 | 3 | 王五 |
| 8 | 4 | 赵六 |
| 9 | 8 | 郑十 |
| 10 | 5 | 钱七 |
+---------+----+-----------+
10 rows in set, 1 warning (0.00 sec)
因为在MySQL8.0版本之前无ROW_NUMBER()窗口函数,因此需要结束变量来实现。具体示例如下:
SET @row_num = 0;
SELECT
(@row_num:=@row_num + 1) AS row_num,
id,
c_name
FROM
users
ORDER BY
c_name;
结果如下:
+---------+----+-----------+
| row_num | id | c_name |
+---------+----+-----------+
| 1 | 7 | 吴九 |
| 2 | 6 | 周八 |
| 3 | 9 | 孙十一 |
| 4 | 1 | 张三 |
| 5 | 10 | 李十二 |
| 6 | 2 | 李四 |
| 7 | 3 | 王五 |
| 8 | 4 | 赵六 |
| 9 | 8 | 郑十 |
| 10 | 5 | 钱七 |
+---------+----+-----------+
10 rows in set, 1 warning (0.00 sec)
注意:每次执行前需要将@row_num重新设置为0 ,即执行SET @row_num = 0。
在MySQL8.0中可以继续使用窗口函数ROW_NUMBER()来实现分组排序的功能,例如:
SELECT
id,
group_id,
c_name,
ROW_NUMBER() OVER (PARTITION BY group_id ORDER BY id) AS row_num
FROM
users
ORDER BY
group_id, id;
运行结果如下:
+----+----------+-----------+---------+
| id | group_id | c_name | row_num |
+----+----------+-----------+---------+
| 1 | 1 | 张三 | 1 |
| 2 | 1 | 李四 | 2 |
| 6 | 1 | 周八 | 3 |
| 9 | 1 | 孙十一 | 4 |
| 3 | 2 | 王五 | 1 |
| 4 | 2 | 赵六 | 2 |
| 7 | 2 | 吴九 | 3 |
| 5 | 3 | 钱七 | 1 |
| 8 | 3 | 郑十 | 2 |
| 10 | 3 | 李十二 | 3 |
+----+----------+-----------+---------+
10 rows in set (0.00 sec)
因为涉及到分组及分组后排序,因此需要引入2个变量,一个用于分组标识,一个用于组内排序标识,示例如下:
SET @row_num = 0;
SET @g_id = NULL;
SELECT
id,
group_id,
c_name,
@row_num := CASE
WHEN @g_id = group_id THEN @row_num + 1
ELSE 1
END AS row_num,
@g_id := group_id AS v_gid
FROM
users
ORDER BY
group_id, id;
运行结果如下:
+----+----------+-----------+---------+-------+
| id | group_id | c_name | row_num | v_gid |
+----+----------+-----------+---------+-------+
| 1 | 1 | 张三 | 1 | 1 |
| 2 | 1 | 李四 | 2 | 1 |
| 6 | 1 | 周八 | 3 | 1 |
| 9 | 1 | 孙十一 | 4 | 1 |
| 3 | 2 | 王五 | 1 | 2 |
| 4 | 2 | 赵六 | 2 | 2 |
| 7 | 2 | 吴九 | 3 | 2 |
| 5 | 3 | 钱七 | 1 | 3 |
| 8 | 3 | 郑十 | 2 | 3 |
| 10 | 3 | 李十二 | 3 | 3 |
+----+----------+-----------+---------+-------+
10 rows in set, 2 warnings (0.00 sec)
这样就实现了分组及排序的序号生成。