调整法建堆过程的优化

2024-05-08 18:58
文章标签 优化 过程 建堆 调整法

本文主要是介绍调整法建堆过程的优化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!



        用调整法建堆,并在如下几个方面进行优化:(a)递归函数改成while循环;(b)减少比较次数;(c)减少交换次数;

源代码如下:

#include <string>
#include <fstream>
#include <stdlib.h>
#include <iostream>
#include <sys/time.h>
using namespace std;
#define MAX 10000000void readNum(int a[]){string filename;ifstream infile("data_1000w.txt", ios::in);string textline = "";int i = 0;while(getline(infile, textline, '\n')){a[i] = atoi(string(textline).c_str());//cout << textline << endl;i++;}infile.close();
}long getCurrentTime(){struct timeval tv;gettimeofday(&tv, NULL);return tv.tv_sec * 1000 + tv.tv_usec / 1000;
}int verify(int a[]){for(int i = 0; i < MAX - 1; i++){if(a[i] < a[i+1])return -1;}return 0;
}//原函数---------------------------------------------------void minHeapify(int a[], int heapsize, int index)
{int left = 2*index + 1;int right = 2*index + 2;int min = index;int tmp = -1;if(left < heapsize){if(a[min] > a[left]){min = left;}if(right < heapsize && a[min] > a[right]){min = right;}}if(min != index){tmp = a[min];a[min] = a[index];a[index] = tmp;minHeapify(a, heapsize, min);}
}int buildMinHeap_1(int a[], int length)
{int heapsize = length;if(heapsize < 2){return 0;}for(int i =heapsize/2 - 1; i >= 0; i--){minHeapify(a, heapsize, i);}return 1;
}void heapSort_1(int a[], int length){buildMinHeap_1(a,length);int tmp = -1;for(int i = length-1; i>=0; i--){tmp = a[0];a[0] = a[i];a[i] = tmp;minHeapify(a, i, 0);}
}//优化后的函数--------------------------------------------------void minHeapify_2(int a[], int length, int index)
{int left, right, min, tmp;while(2*index + 1 < length){left = 2*index + 1;right = 2*index + 2;min = index;if(left < length){if(a[min] > a[left]){min = left;}if(right < length && a[min] > a[right]){min = right;}}if(min != index){tmp = a[index];a[index] = a[min];a[min] = tmp;}else{break;}index = min;}
}void minHeapify_3(int a[], int length, int index)
{int child, tmp;while(2*index + 1 < length){child = 2*index + 1;if(child != length -1 && a[child+1] < a[child]){child++;}if(a[index] > a[child]){tmp = a[index];a[index] = a[child];a[child] = tmp;}else{break;}index = child;}
}void minHeapify_4(int a[], int length, int index)
{int child, tmp;tmp = a[index];while(2*index + 1 < length){child = 2*index + 1;if(child != length -1 && a[child+1] < a[child]){child++;}if(tmp > a[child]){a[index] = a[child];}else{break;}index = child;}a[index] = tmp;
}void heapSort_2(int a[], int length){int tmp = -1;for(int i = length/2 - 1; i >= 0; i--){minHeapify_2(a, length, i);}for(int i = length-1; i > 0; i--){tmp = a[0];a[0] = a[i];a[i] = tmp;minHeapify_2(a, i, 0);}
}void heapSort_3(int a[], int length){int tmp = -1;for(int i = length/2 - 1; i >= 0; i--){minHeapify_3(a, length, i);}for(int i = length-1; i > 0; i--){tmp = a[0];a[0] = a[i];a[i] = tmp;minHeapify_3(a, i, 0);}
}void heapSort_4(int a[], int length){int tmp = -1;for(int i = length/2 - 1; i >= 0; i--){minHeapify_4(a, length, i);}for(int i = length-1; i > 0; i--){tmp = a[0];a[0] = a[i];a[i] = tmp;minHeapify_4(a, i, 0);}
}//---------------------------------------------------main(){int a[MAX] = {0};int b[MAX] = {0};int c[MAX] = {0};int d[MAX] = {0};/*srand((unsigned)time(NULL));for(int i = 0; i < MAX; i++){a[i] = rand()%MAX;cout << a[i] << endl;}*/readNum(a);readNum(b);readNum(c);readNum(d);cout << "----1111-----" << endl;long time_1_1 = getCurrentTime();heapSort_1(a, MAX);long time_1_2 = getCurrentTime();cout << time_1_2 - time_1_1 << endl;int aa = verify(a);cout << aa << endl;	cout << "----2222-----" << endl;long time_2_1 = getCurrentTime();heapSort_2(b, MAX);long time_2_2 = getCurrentTime();cout << time_2_2 - time_2_1 << endl;int bb = verify(b);cout << bb << endl;	cout << "----3333-----" << endl;long time_3_1 = getCurrentTime();heapSort_3(c, MAX);long time_3_2 = getCurrentTime();cout << time_3_2 - time_3_1 << endl;int cc = verify(c);cout << cc << endl;	cout << "----4444-----" << endl;long time_4_1 = getCurrentTime();heapSort_4(d, MAX);long time_4_2 = getCurrentTime();cout << time_4_2 - time_4_1 << endl;int dd = verify(d);cout << dd << endl;	/*for(int k = 0; k < MAX; k++){cout << d[k] <<endl;}*/
}



        依次记录上述优化的幅度,结果如下图所示:1、2、3、4分别为原算法、递归函数改成while循环、减少比较次数、减少交换次数的运行时间(单位:毫秒)。两幅图分别为100w和1000w数据量的时间耗费。 

100万数据量:

改进后,相对于原函数的优化幅度分别为:8.1%、17.3%、27.6%。


1000万数据量:


改进后,相对于原函数的优化幅度分别为:5.6%、22.3%、30.4%。


        下面讨论为什么同样的程序,不同的数据规模,各种优化方案的优化幅度不一致,考虑两种情况:
         一方面这个可能和待排序的数据有关。由于原始数据是随机的,因此待排序的数据初始的状态是不确定的,它们的本身是否有序对排序有一定的影响。
        另一方面考虑排序算法本身的因素。排序过程比较耗费时间的主要有两个方面:一个是数据的比较、数据交换、递归过程(分配局部栈等开销)。下面从这三个方面进行分析:
        (1)首先,对于第一种优化,即把递归函数改为循环,堆调整函数minHeapify_2比minHeapify_1的改进就是将递归改成了循环,数据的比较次数、数据交换的次数都没有改变。在数据规模增大到10倍以后,数据比较次数、数据交换次数都以10log10的数量级增长,而且占总体时间复杂度的绝大部分;同时minHeapify_1递归过程的时间复杂度并没有同步上升。因此在表现上,将递归改写为循环的优化效果会随着数据规模的上升变得越来越不明显。
        (2)第二,对于第二种优化,即把递归函数改为循环,同时减少了比较次数。堆调整函数minHeapify_3比minHeapify_1的改进就是将递归改成了循环,同时减少了数据的比较次数(由5次减到三次,减少40%),但数据交换的次数没有改变。在数据规模增大到10倍以后,影响时间复杂度的三个因素中数据比较次数相对减少成为影响总体时间复杂度的最明显因素。因此在表现上,这种优化效果会随着数据规模的上升变得越来越明显。同时也说明了虽然单次数据比较比单次数据交换需要的时间少很多,但是在堆排序的问题中,数据比较的频次相当的多,因此在总体的时间消耗中也占据了很大的一部分。
        (3)第三,对于第三种优化,即把递归函数改为循环,同时减少了比较次数和交换次数。堆调整函数minHeapify_4比minHeapify_1的改进就是将递归改成了循环,同时减少了数据的比较次数(由5次减到三次,减少40%),数据交换的次数也大大减少。在数据规模增大到10倍以后,影响时间复杂度的三个因素在改进后的算法都进行了优化。在原函数的时间复杂度随着10log10增长时,优化后的算法时间复杂度并没有同步上升。因此在表现上,这种优化效果会随着数据规模的上升变得越来越明显。

这篇关于调整法建堆过程的优化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/971161

相关文章

oracle 11g导入\导出(expdp impdp)之导入过程

《oracle11g导入导出(expdpimpdp)之导入过程》导出需使用SEC.DMP格式,无分号;建立expdir目录(E:/exp)并确保存在;导入在cmd下执行,需sys用户权限;若需修... 目录准备文件导入(impdp)1、建立directory2、导入语句 3、更改密码总结上一个环节,我们讲了

ShardingProxy读写分离之原理、配置与实践过程

《ShardingProxy读写分离之原理、配置与实践过程》ShardingProxy是ApacheShardingSphere的数据库中间件,通过三层架构实现读写分离,解决高并发场景下数据库性能瓶... 目录一、ShardingProxy技术定位与读写分离核心价值1.1 技术定位1.2 读写分离核心价值二

MyBatis-plus处理存储json数据过程

《MyBatis-plus处理存储json数据过程》文章介绍MyBatis-Plus3.4.21处理对象与集合的差异:对象可用内置Handler配合autoResultMap,集合需自定义处理器继承F... 目录1、如果是对象2、如果需要转换的是List集合总结对象和集合分两种情况处理,目前我用的MP的版本

从原理到实战解析Java Stream 的并行流性能优化

《从原理到实战解析JavaStream的并行流性能优化》本文给大家介绍JavaStream的并行流性能优化:从原理到实战的全攻略,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的... 目录一、并行流的核心原理与适用场景二、性能优化的核心策略1. 合理设置并行度:打破默认阈值2. 避免装箱

Java Kafka消费者实现过程

《JavaKafka消费者实现过程》Kafka消费者通过KafkaConsumer类实现,核心机制包括偏移量管理、消费者组协调、批量拉取消息及多线程处理,手动提交offset确保数据可靠性,自动提交... 目录基础KafkaConsumer类分析关键代码与核心算法2.1 订阅与分区分配2.2 拉取消息2.3

Python实战之SEO优化自动化工具开发指南

《Python实战之SEO优化自动化工具开发指南》在数字化营销时代,搜索引擎优化(SEO)已成为网站获取流量的重要手段,本文将带您使用Python开发一套完整的SEO自动化工具,需要的可以了解下... 目录前言项目概述技术栈选择核心模块实现1. 关键词研究模块2. 网站技术seo检测模块3. 内容优化分析模

Java实现复杂查询优化的7个技巧小结

《Java实现复杂查询优化的7个技巧小结》在Java项目中,复杂查询是开发者面临的“硬骨头”,本文将通过7个实战技巧,结合代码示例和性能对比,手把手教你如何让复杂查询变得优雅,大家可以根据需求进行选择... 目录一、复杂查询的痛点:为何你的代码“又臭又长”1.1冗余变量与中间状态1.2重复查询与性能陷阱1.

Python内存优化的实战技巧分享

《Python内存优化的实战技巧分享》Python作为一门解释型语言,虽然在开发效率上有着显著优势,但在执行效率方面往往被诟病,然而,通过合理的内存优化策略,我们可以让Python程序的运行速度提升3... 目录前言python内存管理机制引用计数机制垃圾回收机制内存泄漏的常见原因1. 循环引用2. 全局变

AOP编程的基本概念与idea编辑器的配合体验过程

《AOP编程的基本概念与idea编辑器的配合体验过程》文章简要介绍了AOP基础概念,包括Before/Around通知、PointCut切入点、Advice通知体、JoinPoint连接点等,说明它们... 目录BeforeAroundAdvise — 通知PointCut — 切入点Acpect — 切面

C++ STL-string类底层实现过程

《C++STL-string类底层实现过程》本文实现了一个简易的string类,涵盖动态数组存储、深拷贝机制、迭代器支持、容量调整、字符串修改、运算符重载等功能,模拟标准string核心特性,重点强... 目录实现框架一、默认成员函数1.默认构造函数2.构造函数3.拷贝构造函数(重点)4.赋值运算符重载函数