使用MySql的窗口函数统计数据时,发现一个小的问题,与大家一起探讨下。

环境配置:

  • mysql-installer-community-8.0.20.0

问题点:在sum对window函数执行时,如果有重复数据,会直接把相同的数据相加,并不是逐步相加。

问题描述

数据:在一个成绩表中,有三个个字段:学生s_id,课程c_id,成绩s_score。

查询条件查询每个课程的学生成绩排名和成绩汇总。

查询结果:发现如果同一个课程有相同成绩是,汇总成绩不是累加的,而是一次全部加上去。

创建数据表

CREATE TABLE `Score`(
`s_id` VARCHAR(20),
`c_id` VARCHAR(20),
`s_score` INT(3),
PRIMARY KEY(`s_id`,`c_id`)
)

插入数据

-- 成绩表数据
insert into Score values('01' , '01' , 80);
insert into Score values('01' , '02' , 90);
insert into Score values('01' , '03' , 99);
insert into Score values('02' , '01' , 70);
insert into Score values('02' , '02' , 60);
insert into Score values('02' , '03' , 80);
insert into Score values('03' , '01' , 80);
insert into Score values('03' , '02' , 80);
insert into Score values('03' , '03' , 80);
insert into Score values('04' , '01' , 50);
insert into Score values('04' , '02' , 30);
insert into Score values('04' , '03' , 20);
insert into Score values('05' , '01' , 76);
insert into Score values('05' , '02' , 87);
insert into Score values('06' , '01' , 31);
insert into Score values('06' , '03' , 34);
insert into Score values('07' , '02' , 89);
insert into Score values('07' , '03' , 98);

查询数据

select c_id,s_id,s_score,
first_value(s_score) over w as first_v,
last_value(s_score) over w as last_v,
sum(s_score) over w as sum_v,
max(s_score) over w as max_v,
min(s_score) over w as min_v,
count(s_id) over w as count_v,
row_number() over w as row_id,
rank() over w as rank_id,
dense_rank() over w as dense_id
from score window w as (partition by c_id order by s_score desc);

查询结果

看课程号01的统计结果,数据第一行的sum_v列,前两个数据都是160,按照函数原理,数据应该是80,160。

看课程号02的统计结果,发现结果是正确的,sum_v的第一个为90,第二个为179。

实际显示与预期结果不一致,哪里出了问题。

c_id s_id s_score first_v last_v sum_v max_v min_v count_v row_id rank_id dense_id 01 01 80 80 80 160 80 80 2 1 1 1 01 03 80 80 80 160 80 80 2 2 1 1 01 05 76 80 76 236 80 76 3 3 3 2 01 02 70 80 70 306 80 70 4 4 4 3 01 04 50 80 50 356 80 50 5 5 5 4 01 06 31 80 31 387 80 31 6 6 6 5 02 01 90 90 90 90 90 90 1 1 1 1 02 07 89 90 89 179 90 89 2 2 2 2 02 05 87 90 87 266 90 87 3 3 3 3 02 03 80 90 80 346 90 80 4 4 4 4 02 02 60 90 60 406 90 60 5 5 5 5 02 04 30 90 30 436 90 30 6 6 6 6 03 01 99 99 99 99 99 99 1 1 1 1 03 07 98 99 98 197 99 98 2 2 2 2 03 02 80 99 80 357 99 80 4 3 3 3 03 03 80 99 80 357 99 80 4 4 3 3 03 06 34 99 34 391 99 34 5 5 5 4 03 04 20 99 20 411 99 20 6 6 6 5

思考验证

课程号02的数据正确,01的不正确,01与02的区别是01课程的前两个学生成绩一样都是80。

难道是成绩一样,导致sum时出错了。

为了验证这个问题,把课程号01,学号为01的成绩修改为82,然后在执行查询,结果如下

发现sum_v列显示的为82、162,与预期结果一致。

这样可以得出结论,在sum对window函数执行时,如果有重复数据,会直接把相同的数据相加,并不是逐步相加。


c_id s_id s_score first_v last_v sum_v max_v min_v count_v row_id rank_id dense_id 01 01 80 80 82 82 82 82 2 1 1 1 01 03 80 80 80 162 82 80 2 2 1 1 01 05 76 80 76 236 82 76 3 3 3 2 01 02 70 80 70 306 82 70 4 4 4 3 01 04 50 80 50 356 82 50 5 5 5 4 01 06 31 80 31 387 82 31 6 6 6 5 02 01 90 90 90 90 90 90 1 1 1 1 02 07 89 90 89 179 90 89 2 2 2 2 02 05 87 90 87 266 90 87 3 3 3 3 02 03 80 90 80 346 90 80 4 4 4 4 02 02 60 90 60 406 90 60 5 5 5 5 02 04 30 90 30 436 90 30 6 6 6 6 03 01 99 99 99 99 99 99 1 1 1 1 03 07 98 99 98 197 99 98 2 2 2 2 03 02 80 99 80 357 99 80 4 3 3 3 03 03 80 99 80 357 99 80 4 4 3 3 03 06 34 99 34 391 99 34 5 5 5 4 03 04 20 99 20 411 99 20 6 6 6 5

其他Sql验证和对比

经过上述验证,Mysql在sum时确实出现了错误,不是逐步累加的。

其他平台是否同样存在问题,在Sqlite Expert 5.3版本验证了下,发现结果一样。

这个就奇怪了,如果是Mysql在实现时出错,Sqlite出同样错误的几率小很多。

难道是sum和window函数结合使用时的特性导致的。欢迎一起讨论和研究。

总结

广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!

《魔兽世界》大逃杀!60人新游玩模式《强袭风暴》3月21日上线

暴雪近日发布了《魔兽世界》10.2.6 更新内容,新游玩模式《强袭风暴》即将于3月21 日在亚服上线,届时玩家将前往阿拉希高地展开一场 60 人大逃杀对战。

艾泽拉斯的冒险者已经征服了艾泽拉斯的大地及遥远的彼岸。他们在对抗世界上最致命的敌人时展现出过人的手腕,并且成功阻止终结宇宙等级的威胁。当他们在为即将于《魔兽世界》资料片《地心之战》中来袭的萨拉塔斯势力做战斗准备时,他们还需要在熟悉的阿拉希高地面对一个全新的敌人──那就是彼此。在《巨龙崛起》10.2.6 更新的《强袭风暴》中,玩家将会进入一个全新的海盗主题大逃杀式限时活动,其中包含极高的风险和史诗级的奖励。

《强袭风暴》不是普通的战场,作为一个独立于主游戏之外的活动,玩家可以用大逃杀的风格来体验《魔兽世界》,不分职业、不分装备(除了你在赛局中捡到的),光是技巧和战略的强弱之分就能决定出谁才是能坚持到最后的赢家。本次活动将会开放单人和双人模式,玩家在加入海盗主题的预赛大厅区域前,可以从强袭风暴角色画面新增好友。游玩游戏将可以累计名望轨迹,《巨龙崛起》和《魔兽世界:巫妖王之怒 经典版》的玩家都可以获得奖励。