「数组」希尔排序 / 区间增量优化(C++)

2024-08-22 00:04

本文主要是介绍「数组」希尔排序 / 区间增量优化(C++),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

概述

思路

核心概念:增量d

算法过程

流程

Code

优化方案

区间增量优化

Code(pro)

复杂度


概述

我们在「数组」冒泡排序|选择排序|插入排序 / 及优化方案(C++)中讲解了插入排序。

它有这么两个特点:

①待排序元素较少时效率高。

②待排序元素较有序时效率高。

正如同快速排序时冒泡排序的究极promax进化版,希尔排序则是充分利用了这两个特点的插入排序promax进化版。


思路

战略是这样的:多次进行小数目的插入排序使得数组变得相对有序。

我们要采取一点策略:

通过多轮小型插入排序使得数组逐渐有序,然后就可以将小型插入排序变成中型插入排序。通过多轮中型插入排序使得数组几乎有序,然后就可以将小型插入排序变成整体插入排序。

通过一轮整体插入排序使得数组完全有序。

这个“小型的插入排序”的目的是使得数组逐渐有序,这意味这我们要在整个数组中挑选几个数出来,对他们进行插入排序。

这种挑选是很有讲究的:

我们挑选的数必须能均等地位于整个数组的不同位置中,这样才能使整个数组愈发有序。

我们挑选的数必须能覆盖整个数组,这样才能使整个数组整体愈发有序。

于是就有了增量的概念。


核心概念:增量d

增量d的本质就是对整个数组进行间隔分组:

我们将arr[i],arr[i+d],arr[i+2d]...分为一组,在组内进行插入排序。

完成一组后再完成下一组,直到所有组都进行了组内插入排序。之后减小增量d重新分组,重复上述过程,直到d=1,进行完整的插入排序。

通常我们初始化d=len/2,然后依次d/=2。(向下取整)

例如:

 len=11;arr[i] 7 1 8 9 5 6 4 2 3 10 0↓d=len/2;
┌--------------------------------------------┐d=5;i  0 1 2 3 4 5 6 7 8 9 10arr[i] 7 1 8 9 5 6 4 2 3 10 0↓d↓group0 7----d----6          0group1   1----d----4group2     8----d----2group3       9----d----3group4         5----d----10↓insertion_sort()↓group0 0         6          7group1   1         4group2     2         8group3       3         9group4         5         10↓after sorted↓arr[i] 0 1 2 3 5 6 4 8 9 10 7
└--------------------------------------------┘↓d/=2;
┌--------------------------------------------┐d=2;i  0 1 2 3 4 5 6 7 8 9 10arr[i] 0 1 2 3 5 6 4 8 9 10 7↓d↓group0 0-d-2   5   4   9    7group1   1-d-3   6   8   10↓insertion_sort()↓group0 0   2   4   5   7    9group1   1   3   6   8   10↓after sorted↓arr[i] 0 1 2 3 4 6 5 8 7 10 9
└--------------------------------------------┘↓d/=2;
┌--------------------------------------------┐d=1;i  0 1 2 3 4 5 6 7 8 9 10arr[i] 0 1 2 3 4 6 5 8 7 10 9↓insertion_sort()↓arr[i] 0 1 2 3 4 5 6 7 8 9 10
└--------------------------------------------┘

我们注意到,d的值和分组数量是相等的

因为arr[i]与arr[i+d]为同组,而arr[i+d]与arr[i]间共有d-1组各不相同,再加上arr[i]这一组,共d组。

这一点将会在分组代码实现时利用到。 

*注意*:分组图只是我们的具象化表达,希尔排序是原地算法,不会使用额外的空间储存每一组。 


算法过程

流程

共有四层循环:

①最外层循环(增量减半缩小层)while (d/=2)控制增量减半

②次外层循环(按照增量分组层)for (int group = 0; group < d; group++)进行分组

③次内层循环for (int i = group+d; i < len; i += d)进行组内插入排序(根据插入排序的原理,首个元素可以跳过)

④最内层循环for ( j= i-d; j >= 0; j -= d)将组内的元素插入到组内的有序区中。

你会发现内部的两层循环就是普通插入排序的是实现,只不过普通插入排序的增量d始终为1。

Code

void shell_sort(int arr[], int len) {int d = len;while (d /= 2) {for (int group = 0; group < d; group++) {for (int i = group+d; i < len; i += d) {int temp = arr[i], j = i - d;for (; j >= 0; j -= d) {if (temp < arr[j])arr[j + d] = arr[j];else break;}arr[j + d] = temp;}}}
}

优化方案

区间增量优化

Knuth大神提出了另一种增量策略:d=d/3+1。(+1是为了使得d==2时下次取到d==1)

你会意识到上一种分组的增量减半缩小层是log₂N级别的,而这种则是log₃N级别的

但是这种优化不一定是最理想的,其实与上一种分组各有胜负:

因为这只是优化了增量减半缩小层,而每层内部进行了更多的比较。

Code(pro)

void SLsort(int arr[], int len) {int d = len;while (d = d/3+1) {for (int group = 0; group < d; group++) {for (int i = group + d; i < len; i += d) {int temp = arr[i], j = i - d;for (; j >= 0; j -= d) {if (temp < arr[j])arr[j + d] = arr[j];else break;}arr[j + d] = temp;}}if (d == 1)break;}
}

*注意*: 需要加入d==1的判断语句来结束最外层循环。


复杂度

时间复杂度:O(n¹·³)(或:O(nlog²n)

空间复杂度:O(1)

事实上,希尔排序的时间复杂度不是nlogn,它的证明极其困难,略去不表。

百万数量级抗压测试

int main()
{   int nums = 5000000;int* arr1 = new int[nums];int* arr2 = new int[nums];for (int i = 0; i < nums; i++) {int x = mt()%1000;arr1[i] =arr2[i]= x;}DWORD tick1 = GetTickCount64();shell_sort(arr1, nums);//show(arr, nums);DWORD tick2 = GetTickCount64();cout <<"Shell's strategy(ms):" << tick2 - tick1 << endl;DWORD tick3 = GetTickCount64();SLsort(arr2, nums);//show(arr, nums);DWORD tick4 = GetTickCount64();cout <<"Knuth's strategy(ms):" << tick4 - tick3 << endl;delete[] arr1;delete[] arr2;return 0;
}

这篇关于「数组」希尔排序 / 区间增量优化(C++)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1094666

相关文章

C++中unordered_set哈希集合的实现

《C++中unordered_set哈希集合的实现》std::unordered_set是C++标准库中的无序关联容器,基于哈希表实现,具有元素唯一性和无序性特点,本文就来详细的介绍一下unorder... 目录一、概述二、头文件与命名空间三、常用方法与示例1. 构造与析构2. 迭代器与遍历3. 容量相关4

C++中悬垂引用(Dangling Reference) 的实现

《C++中悬垂引用(DanglingReference)的实现》C++中的悬垂引用指引用绑定的对象被销毁后引用仍存在的情况,会导致访问无效内存,下面就来详细的介绍一下产生的原因以及如何避免,感兴趣... 目录悬垂引用的产生原因1. 引用绑定到局部变量,变量超出作用域后销毁2. 引用绑定到动态分配的对象,对象

JavaScript对象转数组的三种方法实现

《JavaScript对象转数组的三种方法实现》本文介绍了在JavaScript中将对象转换为数组的三种实用方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友... 目录方法1:使用Object.keys()和Array.map()方法2:使用Object.entr

C++读写word文档(.docx)DuckX库的使用详解

《C++读写word文档(.docx)DuckX库的使用详解》DuckX是C++库,用于创建/编辑.docx文件,支持读取文档、添加段落/片段、编辑表格,解决中文乱码需更改编码方案,进阶功能含文本替换... 目录一、基本用法1. 读取文档3. 添加段落4. 添加片段3. 编辑表格二、进阶用法1. 文本替换2

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

Docker多阶段镜像构建与缓存利用性能优化实践指南

《Docker多阶段镜像构建与缓存利用性能优化实践指南》这篇文章将从原理层面深入解析Docker多阶段构建与缓存机制,结合实际项目示例,说明如何有效利用构建缓存,组织镜像层次,最大化提升构建速度并减少... 目录一、技术背景与应用场景二、核心原理深入分析三、关键 dockerfile 解读3.1 Docke

C++右移运算符的一个小坑及解决

《C++右移运算符的一个小坑及解决》文章指出右移运算符处理负数时左侧补1导致死循环,与除法行为不同,强调需注意补码机制以正确统计二进制1的个数... 目录我遇到了这么一个www.chinasem.cn函数由此可以看到也很好理解总结我遇到了这么一个函数template<typename T>unsigned

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法

JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法

《JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法》:本文主要介绍JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法,每种方法结合实例代码给大家介绍的非常... 目录引言:为什么"相等"判断如此重要?方法1:使用some()+includes()(适合小数组)方法2

从原理到实战解析Java Stream 的并行流性能优化

《从原理到实战解析JavaStream的并行流性能优化》本文给大家介绍JavaStream的并行流性能优化:从原理到实战的全攻略,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的... 目录一、并行流的核心原理与适用场景二、性能优化的核心策略1. 合理设置并行度:打破默认阈值2. 避免装箱