SQL23 统计每个学校各难度的用户平均刷题数 sum

文章目录 隐藏

描述

题目：运营想要计算一些参加了答题的不同学校、不同难度的用户平均答题量，请你写SQL取出相应数据

用户信息表：user_profile

id	device_id	gender	age	university	gpa	active_days_within_30	question_cnt	answer_cnt
1	2138	male	21	北京大学	3.4	7	2	12
2	3214	male		复旦大学	4	15	5	25
3	6543	female	20	北京大学	3.2	12	3	30
4	2315	female	23	浙江大学	3.6	5	1	2
5	5432	male	25	山东大学	3.8	20	15	70
6	2131	male	28	山东大学	3.3	15	7	13
7	4321	male	28	复旦大学	3.6	9	6	52

第一行表示:id为1的用户的常用信息为使用的设备id为2138，性别为男，年龄21岁，北京大学，gpa为3.4，在过去的30天里面活跃了7天，发帖数量为2，回答数量为12

最后一行表示:id为7的用户的常用信息为使用的设备id为4321，性别为男，年龄28岁，复旦大学，gpa为3.6，在过去的30天里面活跃了9天，发帖数量为6，回答数量为52

题库练习明细表：question_practice_detail

id	device_id	question_id	result
1	2138	111	wrong
2	3214	112	wrong
3	3214	113	wrong
4	6543	111	right
5	2315	115	right
6	2315	116	right
7	2315	117	wrong
8	5432	117	wrong
9	5432	112	wrong
10	2131	113	right
11	5432	113	wrong
12	2315	115	right
13	2315	116	right
14	2315	117	wrong
15	5432	117	wrong
16	5432	112	wrong
17	2131	113	right
18	5432	113	wrong
19	2315	117	wrong
20	5432	117	wrong
21	5432	112	wrong
22	2131	113	right
23	5432	113	wrong

第一行表示:id为1的用户的常用信息为使用的设备id为2138，在question_id为111的题目上，回答错误

……

最后一行表示:id为23的用户的常用信息为使用的设备id为5432，在question_id为113的题目上，回答错误

表：question_detail

id	question_id	difficult_level
1	111	hard
2	112	medium
3	113	easy
4	115	easy
5	116	medium
6	117	easy

第一行表示: 题目id为111的难度为hard

….

最后行表示: 题目id为117的难度为easy

请你写一个SQL查询，计算不同学校、不同难度的用户平均答题量，根据示例，你的查询应返回以下结果(结果在小数点位数保留4位，4位之后四舍五入)：

university	difficult_level	avg_answer_cnt
北京大学	hard	1.0000
复旦大学	easy	1.0000
复旦大学	medium	1.0000
山东大学	easy	4.5000
山东大学	medium	3.0000
浙江大学	easy	5.0000
浙江大学	medium	2.0000

解释：

第一行：北京大学有设备id为2138，6543这2个用户，这2个用户在question_practice_detail表下都只有一条答题记录，且答题题目是111，从question_detail可以知道这个题目是hard，故北京大学的用户答题为hard的题目平均答题为2/2=1.0000

第二行，第三行：复旦大学有设备id为3214，4321这2个用户，但是在question_practice_detail表只有1个用户(device_id=3214有答题，device_id=4321没有答题，不计入后续计算)有2条答题记录，且答题题目是112，113各1个，从question_detail可以知道题目难度分别是medium和easy，故复旦大学的用户答题为easy, medium的题目平均答题量都为1(easy=1或medium=1) /1 (device_id=3214)=1.0000

第四行，第五行：山东大学有设备id为5432和2131这2个用户，这2个用户总共在question_practice_detail表下有12条答题记录，且答题题目是112，113，117，且数目分别为3，6，3，从question_detail可以知道题目难度分别为medium,easy,easy，所以，easy共有9个，故easy的题目平均答题量= 9(easy=9)/2 (device_id=3214 or device_id=5432) =4.5000，medium共有3个，medium的答题只有device_id=5432的用户，故medium的题目平均答题量= 3(medium=3)/1 ( device_id=5432) =3.0000

SELECT university,

difficult_level,

ROUND(SUM(1) * 1.0 / COUNT(DISTINCT u.device_id), 4) AS avg_answer_cnt

FROM user_profile u

JOIN question_practice_detail qp ON u.device_id = qp.device_id

JOIN question_detail qd ON qp.question_id = qd.question_id

GROUP BY u.university, qd.difficult_level

ORDER BY u.university, avg_answer_cnt DESC;

核心难点分析

ROUND(SUM(1) * 1.0 / COUNT(DISTINCT u.device_id), 4)

目的：计算每个用户的平均答题数量。
为什么用 SUM(1)？
SUM(1) 其实等价于 COUNT(*)，就是统计所有答题记录的总条数。
为什么要除以 COUNT(DISTINCT u.device_id)？
因为要得到“平均每个用户答了多少题”，所以要用总答题数 ÷ 独立用户数。
为什么要乘以 1.0？
在一些数据库（如 MySQL）中，两个整数相除会自动取整。
乘以 1.0 是为了让结果变成浮点数，避免整除问题。
为什么要用 ROUND(..., 4)？
控制结果保留 4 位小数，让展示更美观。

文章来源于互联网:SQL23 统计每个学校各难度的用户平均刷题数 sum

相关推荐: Stable Diffusion性能优化：加速生成速度的10个有效方法

Stable Diffusion性能优化：加速生成速度的10个有效方法关键词：Stable Diffusion、性能优化、生成速度、扩散模型、AI绘图、显存管理、硬件加速摘要：Stable Diffusion作为当前最流行的文本生成图像模型，被广泛用于设计…

SQL23 统计每个学校各难度的用户平均刷题数 sum

描述

核心难点分析

相关推荐

对比kimi、通义千问、文心一言的写代码能力

热门文章

AI大模型,我们的未来