[Algorithm][堆][优先级队列][最后一块石头的重量][数据流中的第K大元素][前K个高频单词][数据流中的中位数]详细讲解

本文主要是介绍[Algorithm][堆][优先级队列][最后一块石头的重量][数据流中的第K大元素][前K个高频单词][数据流中的中位数]详细讲解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

  • 1.最后一块石头的重量
    • 1.题目链接
    • 2.算法原理详解
    • 3.代码实现
  • 2.数据流中的第 K 大元素
    • 1.题目链接
    • 2.算法原理详解
    • 3.代码实现
  • 3.前K个高频单词
    • 1.题目链接
    • 2.算法原理详解
    • 3.代码实现
  • 4.数据流的中位数
    • 1.题目链接
    • 2.算法原理详解
    • 3.代码实现


1.最后一块石头的重量

1.题目链接

  • 最后一块石头的重量

2.算法原理详解

  • 思路:利用大根堆
    • 将所有的⽯头放⼊⼤根堆中
    • 每次拿出前两个堆顶元素粉碎⼀下,如果还有剩余,就将剩余的⽯头继续放⼊堆中

3.代码实现

int LastStoneWeight(vector<int>& stones) 
{priority_queue<int> heap; // STL默认大根堆for(auto& x : stones){heap.push(x);}// 模拟过程while(heap.size() > 1){int a = heap.top();heap.pop();int b = heap.top();heap.pop();if(a > b){heap.push(a - b);}}return heap.size() ? heap.top() : 0;
}

2.数据流中的第 K 大元素

1.题目链接

  • 数据流中的第 K 大元素

2.算法原理详解

  • 本题为TOP-K的运用
  • TOP-K问题,一般用一下两种方法来解决
    • O ( N ∗ l o g K ) O(N*logK) O(NlogK)
    • 快速选择算法 O ( N ) O(N) O(N)
  • 用堆解决TOP-K问题
    • 用数据集合中前K个元素来建堆
      • 前k个最大的元素:建小堆
      • 前k个最小的元素:建大堆
    • 用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素
    • 走完以后,堆里面的k个数,就是最大的前k个
  • 流程
    • 创建一个大小为k的堆(大根堆/小根堆)
    • 循环
      • 依次进堆
      • 判断堆的大小是否超过k
  • 如何判断是否用大根堆还是小根堆,为什么呢?
    • TOP-K-MAX:建小堆
      • 依次进堆,当heap.size() > k时,弹出堆顶元素
      • 因为堆顶元素是最小的,绝对不会是TOP-K-MAX
    • TOP-K-MIN:建大堆
      • 依次进堆,当heap.size() > k时,弹出堆顶元素
      • 因为堆顶元素是最大的,绝对不会是TOP-K-MIN

3.代码实现

class KthLargest 
{// 创建一个大小为k的小根堆priority_queue<int, vector<int>, greater<int>> heap;int _k = 0;
public:KthLargest(int k, vector<int>& nums) {_k = k;for(auto& x : nums){heap.push(x);if(heap.size() > _k){heap.pop();}}}int add(int val) {heap.push(val);if(heap.size() > _k){heap.pop();}return heap.top();}
};

3.前K个高频单词

1.题目链接

  • 前K个高频单词

2.算法原理详解

  • 思路:利用"堆"来解决TOP-K问题
    • 预处理原始的字符串数组
      • 哈希表统计每一个单词出现的频次
    • 创建一个大小为k的堆
      • 频次:小根堆
      • 字典序(频次相同的时候):大根堆
    • 循环
      • 让元素一次进堆
      • 判断
    • 提取结果
      • 把数组逆序

3.代码实现

 class Solution 
{typedef pair<string, int> PSI;struct Cmp{bool operator()(PSI& a, PSI& b){// 频次相同,字典序按大根堆排序if(a.second == b.second){return a.first < b.first;}// 频次按小根堆排序return a.second > b.second;}};
public:vector<string> TopKFrequent(vector<string>& words, int k) {// 统计每个单词出现的次数unordered_map<string, int> hash;for(auto& str : words){hash[str]++;}// 创建一个大小为k的堆priority_queue<PSI, vector<PSI>, Cmp> heap;// TOP-Kfor(auto& psi : hash){heap.push(psi);if(heap.size() > k){heap.pop();}}// 提取结果,逆序heapvector<string> ret(k);for(int i = k - 1; i >= 0; i--){ret[i] = heap.top().first;heap.pop();}return ret;}
};

4.数据流的中位数

1.题目链接

  • 数据流的中位数

2.算法原理详解

  • 思路一:直接sort

    • 时间复杂度:
      • add() O ( N ∗ l o g N ) O(N*logN) O(NlogN)
      • find() O ( 1 ) O(1) O(1)
    • 每次add(),都sort一遍,时间复杂度很恐怖
      请添加图片描述
  • 思路二:插入排序的思想

    • 时间复杂度:
      • add() O ( N ) O(N) O(N)
      • find() O ( 1 ) O(1) O(1)
    • 每次add(),都在原数据基础上进行插入排序,时间复杂度有所改善
      请添加图片描述
  • 思路三:利用大小堆来维护数据流中位数

    • 此问题时关于**「堆」的⼀个「经典应⽤」**
    • 时间复杂度:
      • add() O ( l o g N ) O(logN) O(logN)
      • find() O ( 1 ) O(1) O(1)
    • 将整个数组「按照⼤⼩」平分成两部分(如果不能平分,那就让较⼩部分的元素多⼀个)
      • m == n
      • m > n -> m == n + 1
    • 将左侧部分放⼊「⼤根堆」中,然后将右侧元素放⼊「⼩根堆」中
    • 这样就能在 O ( 1 ) O(1) O(1)的时间内拿到中间的⼀个数或者两个数,进⽽求的平均数
      请添加图片描述
  • 细节add()时,如何维护m == n || m > n -> m == n + 1

    • m == n
      请添加图片描述

    • m > n -> m == n + 1
      请添加图片描述


3.代码实现

class MedianFinder 
{priority_queue<int> left; // 大根堆priority_queue<int, vector<int>, greater<int>> right; // 小根堆
public:MedianFinder() {}void AddNum(int num) {if(left.size() == right.size()){if(left.empty() || num <= left.top()){left.push(num);}else{right.push(num);left.push(right.top());right.pop();}}else{if(num <= left.top()){left.push(num);right.push(left.top());left.pop();}else{right.push(num);}}}double FindMedian() {if(left.size() == right.size()){return (left.top() + right.top()) / 2.0;}else{return left.top();}}
};

这篇关于[Algorithm][堆][优先级队列][最后一块石头的重量][数据流中的第K大元素][前K个高频单词][数据流中的中位数]详细讲解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/961790

相关文章

linux系统中java的cacerts的优先级详解

《linux系统中java的cacerts的优先级详解》文章讲解了Java信任库(cacerts)的优先级与管理方式,指出JDK自带的cacerts默认优先级更高,系统级cacerts需手动同步或显式... 目录Java 默认使用哪个?如何检查当前使用的信任库?简要了解Java的信任库总结了解 Java 信

Python中isinstance()函数原理解释及详细用法示例

《Python中isinstance()函数原理解释及详细用法示例》isinstance()是Python内置的一个非常有用的函数,用于检查一个对象是否属于指定的类型或类型元组中的某一个类型,它是Py... 目录python中isinstance()函数原理解释及详细用法指南一、isinstance()函数

Python的pandas库基础知识超详细教程

《Python的pandas库基础知识超详细教程》Pandas是Python数据处理核心库,提供Series和DataFrame结构,支持CSV/Excel/SQL等数据源导入及清洗、合并、统计等功能... 目录一、配置环境二、序列和数据表2.1 初始化2.2  获取数值2.3 获取索引2.4 索引取内容2

uni-app小程序项目中实现前端图片压缩实现方式(附详细代码)

《uni-app小程序项目中实现前端图片压缩实现方式(附详细代码)》在uni-app开发中,文件上传和图片处理是很常见的需求,但也经常会遇到各种问题,下面:本文主要介绍uni-app小程序项目中实... 目录方式一:使用<canvas>实现图片压缩(推荐,兼容性好)示例代码(小程序平台):方式二:使用uni

Python屏幕抓取和录制的详细代码示例

《Python屏幕抓取和录制的详细代码示例》随着现代计算机性能的提高和网络速度的加快,越来越多的用户需要对他们的屏幕进行录制,:本文主要介绍Python屏幕抓取和录制的相关资料,需要的朋友可以参考... 目录一、常用 python 屏幕抓取库二、pyautogui 截屏示例三、mss 高性能截图四、Pill

java时区时间转为UTC的代码示例和详细解释

《java时区时间转为UTC的代码示例和详细解释》作为一名经验丰富的开发者,我经常被问到如何将Java中的时间转换为UTC时间,:本文主要介绍java时区时间转为UTC的代码示例和详细解释,文中通... 目录前言步骤一:导入必要的Java包步骤二:获取指定时区的时间步骤三:将指定时区的时间转换为UTC时间步

Java中实现对象的拷贝案例讲解

《Java中实现对象的拷贝案例讲解》Java对象拷贝分为浅拷贝(复制值及引用地址)和深拷贝(递归复制所有引用对象),常用方法包括Object.clone()、序列化及JSON转换,需处理循环引用问题,... 目录对象的拷贝简介浅拷贝和深拷贝浅拷贝深拷贝深拷贝和循环引用总结对象的拷贝简介对象的拷贝,把一个

MySQL批量替换数据库字符集的实用方法(附详细代码)

《MySQL批量替换数据库字符集的实用方法(附详细代码)》当需要修改数据库编码和字符集时,通常需要对其下属的所有表及表中所有字段进行修改,下面:本文主要介绍MySQL批量替换数据库字符集的实用方法... 目录前言为什么要批量修改字符集?整体脚本脚本逻辑解析1. 设置目标参数2. 生成修改表默认字符集的语句3

MySQL使用EXISTS检查记录是否存在的详细过程

《MySQL使用EXISTS检查记录是否存在的详细过程》EXISTS是SQL中用于检查子查询是否返回至少一条记录的运算符,它通常用于测试是否存在满足特定条件的记录,从而在主查询中进行相应操作,本文给大... 目录基本语法示例数据库和表结构1. 使用 EXISTS 在 SELECT 语句中2. 使用 EXIS

Git打标签从本地创建到远端推送的详细流程

《Git打标签从本地创建到远端推送的详细流程》在软件开发中,Git标签(Tag)是为发布版本、标记里程碑量身定制的“快照锚点”,它能永久记录项目历史中的关键节点,然而,仅创建本地标签往往不够,如何将其... 目录一、标签的两种“形态”二、本地创建与查看1. 打附注标http://www.chinasem.cn