做题笔记：SQL Sever 方式做牛客SQL的题目--SQL156

本文主要是介绍做题笔记：SQL Sever 方式做牛客SQL的题目--SQL156，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

----SQL156 各个视频的平均完播率
问题：计算2021年里有播放记录的每个视频的完播率(结果保留三位小数)，并按完播率降序排序
注：视频完播率是指完成播放次数占总播放次数的比例。
简单起见，结束观看时间与开始播放时间的差>=视频时长时，视为完成播放。
输出顺序：video_id | avg_comp_play_rate

表的创建及数据的插入：

DROP TABLE IF EXISTS tb_user_video_log, tb_video_info;
CREATE TABLE tb_user_video_log
(id         INT PRIMARY KEY identity,-- '自增ID',uid        INT NOT NULL,-- '用户ID',video_id   INT NOT NULL,-- '视频ID',start_time datetime,-- '开始观看时间',end_time   datetime,-- '结束观看时间',if_follow  TINYINT,-- '是否关注',if_like    TINYINT,-- '是否点赞',if_retweet TINYINT,-- '是否转发',comment_id INT,--'评论ID'
);CREATE TABLE tb_video_info
(id           INT PRIMARY KEY identity,-- '自增ID',video_id     INT UNIQUE  NOT NULL,-- '视频ID',author       INT         NOT NULL,-- '创作者ID',tag          VARCHAR(16) NOT NULL,-- '类别标签',duration     INT         NOT NULL,-- '视频时长(秒数)',release_time datetime    NOT NULL,-- '发布时间'
);INSERT INTO tb_user_video_log(uid, video_id, start_time, end_time, if_follow, if_like, if_retweet, comment_id)
VALUES (101, 2001, '2021-10-01 10:00:00', '2021-10-01 10:00:30', 0, 1, 1, null),(102, 2001, '2021-10-01 10:00:00', '2021-10-01 10:00:24', 0, 0, 1, null),(103, 2001, '2021-10-01 11:00:00', '2021-10-01 11:00:34', 0, 1, 0, 1732526),(101, 2002, '2021-09-01 10:00:00', '2021-09-01 10:00:42', 1, 0, 1, null),(102, 2002, '2021-10-01 11:00:00', '2021-10-01 11:00:30', 1, 0, 1, null),(103, 2002, '2021-10-01 10:59:05', '2021-10-01 11:00:05', 1, 0, 1, null),(101, 2003, '2020-09-01 10:00:00', '2020-09-01 10:01:42', 1, 0, 1, null),(102, 2003, '2021-09-01 10:00:00', '2021-09-01 10:00:42', 1, 0, 1, null);INSERT INTO tb_video_info(video_id, author, tag, duration, release_time)
VALUES (2001, 901, '影视', 30, '2021-01-01 7:00:00'),(2002, 901, '美食', 60, '2021-01-01 7:00:00'),(2003, 902, '旅游', 90, '2021-01-01 7:00:00');

解题思路：
① 所查信息涉及两表，所以需要多表查询 - join
② 视频每次播放的实际时间 = 结束时间 - 开始时间

datediff(second,start_time,end_time)		--时间差，以秒为单位

③ 以视频分组，比较实际播放时间>= 视频时长(秒数) 的并统计个数 / 视频播放总次数
④ 筛选2021年的数据

查询如下：

 select video_id,Convert(decimal(18,3),count(iif(watch_time >= duration,1,null))* 1.0 / count(video_id)) avg_comp_play_ratefrom (select tu.video_id,year(start_time) as year_v,datediff(second,start_time,end_time)  as watch_time,tv.durationfrom tb_user_video_log tujoin tb_video_info tvon tu.video_id = tv.video_id)twhere year_v = '2021'group by video_id

上述查询用了一层嵌套，有利于在写查询时候理清思路，可以优化简洁代码如下：

 select tu.video_id,Convert(decimal(18,3),count(iif(datediff(second,start_time,end_time) >= duration,1,null))* 1.0 / count(tu.video_id)) avg_comp_play_ratefrom tb_user_video_log tujoin tb_video_info tvon tu.video_id = tv.video_idwhere year(start_time) = '2021'group by tu.video_id

做题总结：
① 需要注意count(iif(watch_time >= duration,1,null))的使用，在开始null处写的0是错误的，count统计返回的元素个数1或0都会被统计，所以导致最后完播率都是100%，如果返回是null则不会被count统计，可筛选出符合要求的数据。如果想反回0，可以用sum函数替换count函数：sum(iif(watch_time >= duration,1,0))
② DATEDIFF 函数
DATEDIFF函数用于计算两个日期之间的差异，可以以天、小时、分钟、秒等不同的单位来返回结果。
DATEDIFF的基本语法如下：

DATEDIFF(datepart, startdate, enddate)

在次语法中：
datepart 表示需要计算的时间单位，可以是以下值之一：
“year”（年）；“quarter”（季度）；“month”（月）
“day”（天）；“hour”（小时）；“minute”（分钟）
“second”（秒）
startdate 表示起始日期；enddate 表示结束日期。
③ Convert 函数