做题笔记:SQL Sever 方式做牛客SQL的题目--SQL156

2023-12-09 16:01

本文主要是介绍做题笔记:SQL Sever 方式做牛客SQL的题目--SQL156,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

----SQL156 各个视频的平均完播率
问题:计算2021年里有播放记录的每个视频的完播率(结果保留三位小数),并按完播率降序排序
注:视频完播率是指完成播放次数占总播放次数的比例。
简单起见,结束观看时间与开始播放时间的差>=视频时长时,视为完成播放。
输出顺序:video_id | avg_comp_play_rate

表的创建及数据的插入:

DROP TABLE IF EXISTS tb_user_video_log, tb_video_info;
CREATE TABLE tb_user_video_log
(id         INT PRIMARY KEY identity,-- '自增ID',uid        INT NOT NULL,-- '用户ID',video_id   INT NOT NULL,-- '视频ID',start_time datetime,-- '开始观看时间',end_time   datetime,-- '结束观看时间',if_follow  TINYINT,-- '是否关注',if_like    TINYINT,-- '是否点赞',if_retweet TINYINT,-- '是否转发',comment_id INT,--'评论ID'
);CREATE TABLE tb_video_info
(id           INT PRIMARY KEY identity,-- '自增ID',video_id     INT UNIQUE  NOT NULL,-- '视频ID',author       INT         NOT NULL,-- '创作者ID',tag          VARCHAR(16) NOT NULL,-- '类别标签',duration     INT         NOT NULL,-- '视频时长(秒数)',release_time datetime    NOT NULL,-- '发布时间'
);INSERT INTO tb_user_video_log(uid, video_id, start_time, end_time, if_follow, if_like, if_retweet, comment_id)
VALUES (101, 2001, '2021-10-01 10:00:00', '2021-10-01 10:00:30', 0, 1, 1, null),(102, 2001, '2021-10-01 10:00:00', '2021-10-01 10:00:24', 0, 0, 1, null),(103, 2001, '2021-10-01 11:00:00', '2021-10-01 11:00:34', 0, 1, 0, 1732526),(101, 2002, '2021-09-01 10:00:00', '2021-09-01 10:00:42', 1, 0, 1, null),(102, 2002, '2021-10-01 11:00:00', '2021-10-01 11:00:30', 1, 0, 1, null),(103, 2002, '2021-10-01 10:59:05', '2021-10-01 11:00:05', 1, 0, 1, null),(101, 2003, '2020-09-01 10:00:00', '2020-09-01 10:01:42', 1, 0, 1, null),(102, 2003, '2021-09-01 10:00:00', '2021-09-01 10:00:42', 1, 0, 1, null);INSERT INTO tb_video_info(video_id, author, tag, duration, release_time)
VALUES (2001, 901, '影视', 30, '2021-01-01 7:00:00'),(2002, 901, '美食', 60, '2021-01-01 7:00:00'),(2003, 902, '旅游', 90, '2021-01-01 7:00:00');

解题思路:
① 所查信息涉及两表,所以需要多表查询 - join
② 视频每次播放的实际时间 = 结束时间 - 开始时间

datediff(second,start_time,end_time)		--时间差,以秒为单位

③ 以视频分组,比较实际播放时间>= 视频时长(秒数) 的并统计个数 / 视频播放总次数
④ 筛选2021年的数据

查询如下:

 select video_id,Convert(decimal(18,3),count(iif(watch_time >= duration,1,null))* 1.0 / count(video_id)) avg_comp_play_ratefrom (select tu.video_id,year(start_time) as year_v,datediff(second,start_time,end_time)  as watch_time,tv.durationfrom tb_user_video_log tujoin tb_video_info tvon tu.video_id = tv.video_id)twhere year_v = '2021'group by video_id

上述查询用了一层嵌套,有利于在写查询时候理清思路,可以优化简洁代码如下:

 select tu.video_id,Convert(decimal(18,3),count(iif(datediff(second,start_time,end_time) >= duration,1,null))* 1.0 / count(tu.video_id)) avg_comp_play_ratefrom tb_user_video_log tujoin tb_video_info tvon tu.video_id = tv.video_idwhere year(start_time) = '2021'group by tu.video_id

做题总结:
① 需要注意count(iif(watch_time >= duration,1,null))的使用,在开始null处写的0是错误的,count统计返回的元素个数1或0都会被统计,所以导致最后完播率都是100%,如果返回是null则不会被count统计,可筛选出符合要求的数据。如果想反回0,可以用sum函数替换count函数:sum(iif(watch_time >= duration,1,0))
DATEDIFF 函数
DATEDIFF函数用于计算两个日期之间的差异,可以以天、小时、分钟、秒等不同的单位来返回结果。
DATEDIFF的基本语法如下:

DATEDIFF(datepart, startdate, enddate)

在次语法中:
datepart 表示需要计算的时间单位,可以是以下值之一:
“year”(年);“quarter”(季度);“month”(月)
“day”(天);“hour”(小时);“minute”(分钟)
“second”(秒)
startdate 表示起始日期;enddate 表示结束日期。
Convert 函数

Convert(decimal(18,3), x * 1.0 / y)

Convert 函数将x/y的结果转化为decimal(18,3)数据类型:decimal(18,3)是一种数据类型,用于存储具有总共18位数值的数字,其中包括3位小数,即保留三位小数

这篇关于做题笔记:SQL Sever 方式做牛客SQL的题目--SQL156的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/474284

相关文章

一文详解MySQL如何设置自动备份任务

《一文详解MySQL如何设置自动备份任务》设置自动备份任务可以确保你的数据库定期备份,防止数据丢失,下面我们就来详细介绍一下如何使用Bash脚本和Cron任务在Linux系统上设置MySQL数据库的自... 目录1. 编写备份脚本1.1 创建并编辑备份脚本1.2 给予脚本执行权限2. 设置 Cron 任务2

SQL Server修改数据库名及物理数据文件名操作步骤

《SQLServer修改数据库名及物理数据文件名操作步骤》在SQLServer中重命名数据库是一个常见的操作,但需要确保用户具有足够的权限来执行此操作,:本文主要介绍SQLServer修改数据... 目录一、背景介绍二、操作步骤2.1 设置为单用户模式(断开连接)2.2 修改数据库名称2.3 查找逻辑文件名

C++中零拷贝的多种实现方式

《C++中零拷贝的多种实现方式》本文主要介绍了C++中零拷贝的实现示例,旨在在减少数据在内存中的不必要复制,从而提高程序性能、降低内存使用并减少CPU消耗,零拷贝技术通过多种方式实现,下面就来了解一下... 目录一、C++中零拷贝技术的核心概念二、std::string_view 简介三、std::stri

SQL Server数据库死锁处理超详细攻略

《SQLServer数据库死锁处理超详细攻略》SQLServer作为主流数据库管理系统,在高并发场景下可能面临死锁问题,影响系统性能和稳定性,这篇文章主要给大家介绍了关于SQLServer数据库死... 目录一、引言二、查询 Sqlserver 中造成死锁的 SPID三、用内置函数查询执行信息1. sp_w

Linux脚本(shell)的使用方式

《Linux脚本(shell)的使用方式》:本文主要介绍Linux脚本(shell)的使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录概述语法详解数学运算表达式Shell变量变量分类环境变量Shell内部变量自定义变量:定义、赋值自定义变量:引用、修改、删

python判断文件是否存在常用的几种方式

《python判断文件是否存在常用的几种方式》在Python中我们在读写文件之前,首先要做的事情就是判断文件是否存在,否则很容易发生错误的情况,:本文主要介绍python判断文件是否存在常用的几种... 目录1. 使用 os.path.exists()2. 使用 os.path.isfile()3. 使用

canal实现mysql数据同步的详细过程

《canal实现mysql数据同步的详细过程》:本文主要介绍canal实现mysql数据同步的详细过程,本文通过实例图文相结合给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的... 目录1、canal下载2、mysql同步用户创建和授权3、canal admin安装和启动4、canal

SQL中JOIN操作的条件使用总结与实践

《SQL中JOIN操作的条件使用总结与实践》在SQL查询中,JOIN操作是多表关联的核心工具,本文将从原理,场景和最佳实践三个方面总结JOIN条件的使用规则,希望可以帮助开发者精准控制查询逻辑... 目录一、ON与WHERE的本质区别二、场景化条件使用规则三、最佳实践建议1.优先使用ON条件2.WHERE用

MySQL存储过程之循环遍历查询的结果集详解

《MySQL存储过程之循环遍历查询的结果集详解》:本文主要介绍MySQL存储过程之循环遍历查询的结果集,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录前言1. 表结构2. 存储过程3. 关于存储过程的SQL补充总结前言近来碰到这样一个问题:在生产上导入的数据发现

MySQL 衍生表(Derived Tables)的使用

《MySQL衍生表(DerivedTables)的使用》本文主要介绍了MySQL衍生表(DerivedTables)的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学... 目录一、衍生表简介1.1 衍生表基本用法1.2 自定义列名1.3 衍生表的局限在SQL的查询语句select