AI大模型教程
一起来学习

SQL23 统计每个学校各难度的用户平均刷题数 sum

描述

题目:运营想要计算一些参加了答题的不同学校、不同难度的用户平均答题量,请你写SQL取出相应数据

用户信息表:user_profile

id device_id gender age university gpa active_days_within_30 question_cnt answer_cnt
1 2138 male 21 北京大学 3.4 7 2 12
2 3214 male 复旦大学 4 15 5 25
3 6543 female 20 北京大学 3.2 12 3 30
4 2315 female 23 浙江大学 3.6 5 1 2
5 5432 male 25 山东大学 3.8 20 15 70
6 2131 male 28 山东大学 3.3 15 7 13
7 4321 male 28 复旦大学 3.6 9 6 52

第一行表示:id为1的用户的常用信息为使用的设备id为2138,性别为男,年龄21岁,北京大学,gpa为3.4,在过去的30天里面活跃了7天,发帖数量为2,回答数量为12

最后一行表示:id为7的用户的常用信息为使用的设备id为4321,性别为男,年龄28岁,复旦大学,gpa为3.6,在过去的30天里面活跃了9天,发帖数量为6,回答数量为52

题库练习明细表:question_practice_detail

id device_id question_id result
1 2138 111 wrong
2 3214 112 wrong
3 3214 113 wrong
4 6543 111 right
5 2315 115 right
6 2315 116 right
7 2315 117 wrong
8 5432 117 wrong
9 5432 112 wrong
10 2131 113 right
11 5432 113 wrong
12 2315 115 right
13 2315 116 right
14 2315 117 wrong
15 5432 117 wrong
16 5432 112 wrong
17 2131 113 right
18 5432 113 wrong
19 2315 117 wrong
20 5432 117 wrong
21 5432 112 wrong
22 2131 113 right
23 5432 113 wrong

第一行表示:id为1的用户的常用信息为使用的设备id为2138,在question_id为111的题目上,回答错误

……

最后一行表示:id为23的用户的常用信息为使用的设备id为5432,在question_id为113的题目上,回答错误

表:question_detail

id question_id difficult_level
1 111 hard
2 112 medium
3 113 easy
4 115 easy
5 116 medium
6 117 easy

第一行表示: 题目id为111的难度为hard

….

最后行表示: 题目id为117的难度为easy

请你写一个SQL查询,计算不同学校、不同难度的用户平均答题量,根据示例,你的查询应返回以下结果(结果在小数点位数保留4位,4位之后四舍五入):

university difficult_level avg_answer_cnt
北京大学 hard 1.0000
复旦大学 easy 1.0000
复旦大学 medium 1.0000
山东大学 easy 4.5000
山东大学 medium 3.0000
浙江大学 easy 5.0000
浙江大学 medium 2.0000

解释:

第一行:北京大学有设备id为2138,6543这2个用户,这2个用户在question_practice_detail表下都只有一条答题记录,且答题题目是111,从question_detail可以知道这个题目是hard,故 北京大学的用户答题为hard的题目平均答题为2/2=1.0000

第二行,第三行:复旦大学有设备id为3214,4321这2个用户,但是在question_practice_detail表只有1个用户(device_id=3214有答题,device_id=4321没有答题,不计入后续计算)有2条答题记录,且答题题目是112,113各1个,从question_detail可以知道题目难度分别是medium和easy,故 复旦大学的用户答题为easy, medium的题目平均答题量都为1(easy=1或medium=1) /1 (device_id=3214)=1.0000

第四行,第五行:山东大学有设备id为5432和2131这2个用户,这2个用户总共在question_practice_detail表下有12条答题记录,且答题题目是112,113,117,且数目分别为3,6,3,从question_detail可以知道题目难度分别为medium,easy,easy,所以,easy共有9个,故easy的题目平均答题量= 9(easy=9)/2 (device_id=3214 or device_id=5432) =4.5000,medium共有3个,medium的答题只有device_id=5432的用户,故medium的题目平均答题量= 3(medium=3)/1 ( device_id=5432) =3.0000

SELECT university,

       difficult_level,

       ROUND(SUM(1) * 1.0 / COUNT(DISTINCT u.device_id), 4) AS avg_answer_cnt

FROM user_profile u

JOIN question_practice_detail qp ON u.device_id = qp.device_id

JOIN question_detail qd ON qp.question_id = qd.question_id

GROUP BY u.university, qd.difficult_level

ORDER BY u.university, avg_answer_cnt DESC;

核心难点分析

ROUND(SUM(1) * 1.0 / COUNT(DISTINCT u.device_id), 4)

  • 目的:计算 每个用户的平均答题数量。

  • 为什么用 SUM(1)
    SUM(1) 其实等价于 COUNT(*),就是统计所有答题记录的总条数。

  • 为什么要除以 COUNT(DISTINCT u.device_id)
    因为要得到“平均每个用户答了多少题”,所以要用总答题数 ÷ 独立用户数。

  • 为什么要乘以 1.0
    在一些数据库(如 MySQL)中,两个整数相除会自动取整。
    乘以 1.0 是为了让结果变成浮点数,避免整除问题。

  • 为什么要用 ROUND(..., 4)
    控制结果保留 4 位小数,让展示更美观。

文章来源于互联网:SQL23 统计每个学校各难度的用户平均刷题数 sum

相关推荐: Stable Diffusion性能优化:加速生成速度的10个有效方法

Stable Diffusion性能优化:加速生成速度的10个有效方法 关键词:Stable Diffusion、性能优化、生成速度、扩散模型、AI绘图、显存管理、硬件加速 摘要:Stable Diffusion作为当前最流行的文本生成图像模型,被广泛用于设计…

赞(0)
未经允许不得转载:5bei.cn大模型教程网 » SQL23 统计每个学校各难度的用户平均刷题数 sum
分享到: 更多 (0)

AI大模型,我们的未来

小欢软考联系我们