C++原地删除有序数组重复项的N种方法

2025-03-23 14:50

本文主要是介绍C++原地删除有序数组重复项的N种方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《C++原地删除有序数组重复项的N种方法》给定一个排序数组,你需要在原地删除重复出现的元素,使得每个元素只出现一次,返回移除后数组的新长度,不要使用额外的数组空间,你必须在原地修改输入数组并在使用O(...

一、问题

给定一个非严格递增排序的整数数组 nums,请、原地删除重复出现的元素,使得每个元素只出现一次。返回删除后数组的新长度。

要求:

  1. 原地修改: 必须直接修改输入数组 nums。不允许使用额外的空间。
  2. 相对顺序: 元素之间的相对顺序必须保持一致。
  3. 返回唯一元素个数: 返回数组中唯一元素的个数 k
  4. 数组内容: 数组 nums 的前 k 个元素应包含唯一元素,并且按照它们最初在 nums 中出现的顺序排列。 nums 数组中下标 k 及之后的部分的内容可以任意修改,其值不影响结果。

示例:

输入:nums = [1,1,2]
输出:2, nums = [1,2,_] // 下划线表示不重要的位置

输入:nums = [0,0,1,1,1,2,2,3,3,4]
输出:5, nums = [0,1,2,3,4,,,,,_]

解释:

函数应该返回新的长度 k = 5, 并且 nums 的前五个元素为 0, 1, 2, 3, 4。 不需要考虑数组中超出新长度后面的元素。

关键点:

  • 非严格递增: 意味着数组是排序的,但不一定是严格升序 (允许重复元素)。
  • 原地删除: 空间复杂度必须是 O(1)。
  • 相对顺序不变: 删除重复元素后,剩余元素的顺序要与原始python数组中的顺序相同。

二、问题分析

核心目标: 从已排序的数组中移除重复元素,确保每个唯一元素只出现一次,并返回唯一元素的数量。
约束条件:

  • 原地操作: 这是最关键的约束。我们不能创建新的数组来存储结果。必须直接修改原始数组。
  • 相对顺序: 删除重复项后,唯一元素的相对顺序必须与原始数组保持一致。
  • 排序特性: 输入数组是已排序的。这是一个重要的前提,允许我们使用更高效的算法。

解题思路: 由于数组已排序,可以使用双指针方法来解决这个问题。双指针方法通常用于原地操作,且效率较高。

  • 慢指针(i): 指向下一个非重复元素应该放置的位置。
  • 快指针(j): 用于遍历数组,查找非重复元素。

算法步骤:

  1. 初始化:
    • i = 0 (慢指针,指向数组的第一个位置,即第一个唯一元素应该放置的位置)。
    • j = 1 (快指针,从数组的第二个位置开始遍历)。
  2. 遍历数组:
    • 使用 j 遍历数组 nums
    • 如果 nums[j] != nums[i] 说明 nums[j] 是一个新的唯一元素。
      • 将 i 向前移动一位(i++)。
      • 将 nums[j] 复制到 nums[i] 的位置(nums[i] = nums[j])。
    • 否则 (如果 nums[j] == nums[i]): 说明 nums[j] 是一个重复元素,跳过它。
  3. 返回结果: 循环结束后,i + 1 就是数组中唯一元素的数量(因为 i 是索引,从 0 开始)。

示例演示: 假设 numandroids = [0, 0, 1, 1, 1, 2, 2, 3, 3, 4]

步骤ijnums说明
101[0, 0, 1, 1, 1, 2, 2, 3, 3, 4]初始化
202[0, 0, 1, 1, 1, 2, 2, 3, 3, 4]nums[2] != nums[0]i++nums[1] = nums[2]
313[0, 1, 1, 1, 1, 2, 2, 3, 3, 4]nums[3] != nums[1]i++nums[2] = nums[3]
424[0, 1, 2, 1, 1, 2, 2, 3, 3, 4]nums[4] != nums[2]i++nums[3] = nums[4]
535[0, 1, 2, 1, 1, 2, 2, 3, 3, 4]nums[5] != nums[3]i++nums[4] = nums[5]
646[0, 1, 2, 3, 1, 2, 2, 3, 3, 4]nums[6] != nums[4]i++nums[5] = nums[6]
757[0, 1, 2, 3, 4, 2, 2, 3, 3, 4]nums[7] != nums[5]i++nums[6] = nums[7]
868[0, 1, 2, 3, 4, 3, 2, 3, 3, 4]nums[8] != nums[6]i++nums[7] = nums[8]
979[0, 1, 2, 3, 4, 3, 3, 3, 3, 4]nums[9] != nums[7]i++nums[8] = nums[9]
10810[0, 1, 2, 3, 4, 3, 3, 3, 4, 4]循环结束

最终结果:nums = [0, 1, 2, 3, 4, ...],返回 i + 1 = 5

复杂度分析:

  • 时间复杂度: O(n),其中 n 是数组的长度。我们需要遍历数组一次。
  • 空间复杂度: O(1),原地操作,只使用了常数级别的额外空间。

三、算法实现

由于数组已排序,可以使用双指针方法来解决这个问题。

  1. 初始化快慢指针
  2. 遍历数组
  3. 返回结果
class Solution {
public:
    int removeDuplicates(vector<int>& nums) {
        if (nums.size() < 2)
            return nums.size();
        int left = 0;
        int right = 1;
        while (right < nums.size()) {
            if (nums[right] == nums[left])
                ++right;
            else 
                nums[++left] = nums[right++];
        }
        return left + 1;
    }
};

四、问题变体:最多保留两次

删除有序数组中的多余重复项 (最多保留两次): 给定一个已排序的数组 nums,请 原地 删除重复出现的元素,使得每个元素最多出现两次。返回删除后数组的新长度。

要求:

  1. 原地修改: 必须直接修改输入数组 nums。不允许使用额外的数组空间。
  2. O(1) 额外空间: 必须在 O(1) 的额外空间复杂度下完成此操作。
  3. 相对顺序: 元素的相对顺序必须保持一致。
  4. 返回值: 返回删除重复元素后的数组的新长度 k
  5. 数组内容: 数组 nums 的前 k 个元素应该包含处理后的元素,超出 k 长度的部分可以忽略。

示例:

输入:nums = [1,1,1,2,2,3]
输出:5, nums = [1,1,2,2,3,_] // 下划线表示不重要的位置

输入:nums = [0,0,0,1,1,1,2,2,3,3,4]
输出:9, nums = [0,0,1,1,2,2,3,3,4,_]

说明:

  • 对于 nums = [1,1,1,2,2,3],函数应该返回新的长度 k = 5,并且 nums 的前五个元素为 1, 1, 2, 2, 3
  • 对于 nums = [0,0,0,1,1,1,2,2,3,3,4],函数应该返回新的长度 k = 9,并且 nums 的前九个元素为 0, 0, 1, 1, 2, 2, 3, 3, 4

关键点:

  • 有序数组: 输入数组是已排序的,利用这一特性可以优化算法。
  • 最多保留两次: 每个元素最多允许出现两次。
  • 原地修改 + O(1): 限制了算法的选择,必须采用空间复杂度为常数的算法。

五、分析和代码实现

5.1、问题分析

可以将问题分解为以下几个子问题:

  • 识别重复项: 如何有效地识别重复出现的元素? 由于数组是有序的,相邻元素相同则为重复。
  • 计数: 如何记录每个元素出现的次数? 需要一个变量来追踪当前元素出现的次数。
  • 原地修改: 如何在不使用额外空间的情况下,将需要保留的元素移动到数组的前面? 使用双指针方法是关键。
  • 更新长度: 如何计算并返回修改后的数组长度? 慢指针的最终位置 + 1 就是新长度。

算法思路: 基于双指针方法,结合计数器来解决此问题。

  • 慢指针(i): 指向下一个要保留的元素应该放置的位置。
  • 快指针(j): 用于遍历数组,检查元素是否应该被保留。
  • 计数器(count): 记录当前元素连续出现的次数。

5.2、算法实现

算法步骤:

  1. 初始化:

    • i = 0 (慢指针)
    • j = 0 (快指针)
    • count = 1 (初始计数为 1,因为 nums[0] 至少出现一次)
  2. 遍历数组:

    • 循环 j 从 1 到 nums.length - 1
    • 情况 1:nums[j] == nums[j-1] (遇到相同元素)
      • count++ (增加计数器)。
      • 如果 count <= 2 说明当前元素允许被保留。
        • 将 nums[j] 复制到 nums[i] 的位置 ( nums[i] = nums[j] )。
        • i++ (移动慢指针)。
    • 情况 2:nums[j] != nums[j-1] (遇到不同元素)
      • nums[i] = nums[j]
      • i++
      • count=1
  3. 返回结果: 循环结束后,i 就是数组中应该保留的元素个数,因此返回 i

示例演示: 假设 nums = [1,1,1,2,2,3]

步骤ijcountnums说明
1001[1, 1, 1, 2, 2, 3]初始化
2012[1, 1, 1, 2, 2, 3]nums[1] == nums[0]count++count <= 2nums[0] = nums[1]i++
3123[1, 1, 1, 2, 2, 3]nums[2] == nums[1]count++count > 2,跳过
4131[1, 1, 1, 2, 2, 3]nums[3] != nums[2]count = 1nums[1] = nums[3], i++
5242[1, 2, 1, 2, 2, 3]nums[4] == nums[3]count++count <= 2nums[2] = nums[4]i++
6351[1, 2, 2, 2, 2, 3]nums[5] != nums[4]count = 1nums[3] = nums[5], i++

最终结果:nums = [1, 1, 2, 2, 3, ...],返回 i = 5

class Solution {
public:
    int removeDuplicates(vector<int>& nums) {
        int n = nums.size();
        if (n < 3)
            return n;
        int left = 1;
        int count = 1;
        for (int right = 1; right < n; ++right) {
            if (nums[right - 1] == nums[right]) {
                ++coOTDyHspunt;
                if (count <= 2) {
                    nums[left] = nums[right];
                    ++left;
                }
            } else {
                nums[left] = nums[right];
                ++left;
                count = 1;
            }
        }
        return  left;
    }
};

复杂度分析:

  • 时间复杂度: O(n)China编程,其中 n 是数组的长度。需要遍历数组一次。
  • 空间复杂度: O(1),使用了常数级别的额外空间(ijcount)。

5.3、快慢指针(推荐)

原理:

  • slow 指针初始值为 2,因为它表示新数组中前两个元素已经确定(即原数组的前两个元素)。
  • fast 指针从 2 开始遍历数组。
  • 如果 nums[fast] 与 nums[slow - 2] 不相等,则说明 nums[fast] 可以被添加到新数组中,将其赋值给 nums[slow],并同时递增 slow 指针。
  • 如果 nums[fast] 与 nums[slow - 2] 相等,则说明 nums[fast] 是多余的重复元素,直接跳过。
  • 循环结束后,slow 指针的值就是新数组的长度。

示例演示: 假设 nums = [1,1,1,2,2,3]

步骤slowfastnums说明
12php2[1, 1, 1, 2, 2, 3]初始化
223[1, 1, 1, 2, 2, 3]nums[3] != nums[slow - 2] (2 != 1),nums[slow] = nums[fast] (nums[2] = 2),slow++
334[1, 1, 2, 2, 2, 3]nums[4] != nums[slow - 2] (2 != 1),nums[slow] = nums[fast] (nums[3] = 2),slow++
445[1, 1, 2, 2, 2, 3]nums[5] != nums[slow - 2] (3 != 2),nums[slow] = nums[fast] (nums[4] = 3),slow++

最终结果:nums = [1, 1, 2, 2, 3, ...],返回 slow = 5

代码实现:

class Solution {
public:
    int removeDuplicates(vector<int>& nums) {
        int n = nums.size();
        if (n <= 2) {
            return n; // 少于等于两个元素,直接返回
        }

        int slow = 2; // slow指针指向下一个要放置的位置,从第三个位置开始
        int fast = 2; // fast指针用于遍历数组

        while (fast < n) {
            // 如果当前元素与slow指针的前两个元素不同,说明可以保留
            if (nums[fast] != nums[slow - 2]) {
                nums[slow] = nums[fast]; // 将fast指针指向的元素移动到slow指针的位置
                slow++; // slow指针向后移动
            }
            fast++; // fast指针始终向后移动
        }

        return slow; // slow指针的值就是新数组的长度
    }
};

复杂度分析:

  • 时间复杂度: O(n),其中 n 是数组的长度。只需要遍历数组一次。
  • 空间复杂度: O(1),使用了常数级别的额外空间(slowfast)。

5.4、低效率的代码实现

思路:对于超过 2 次的重复元素,超出部分使用循环将它们移动到数组的末尾。

思路是正确的,但存在一些效率问题和潜在的错误。核心问题在于,对于每个需要删除的元素,都进行一次循环移动操作,这会导致时间复杂度过高,尤其是在重复元素较多的情况下。

class Solution {
public:
    int removeDuplicates(vector<int>& nums) {
        int n = nums.size();
        if (n < 3)
            return n;
        int left = 0;
        for (int right = 1; right < n; ++right) {
            if (nums[left] != nums[right]) {
                left = right;
                continue;
            }
            if (right - left > 1) {
                for (int i = right - 1; i < (n - 1); ++i) 
                    std::swap(nums[i], nums[i + 1]);
                --n;
                --right;
            }
        }
        return n;
    }
};

六、总结

双指针方法是一个解决此类原地修改问题的有效方法。通过维护两个指针,一个指向下一个唯一元素的位置,另一个用于遍历数组,我们可以高效地删除重复项并保持相对顺序不变。 理解排序数组的特性对于选择正确的算法至关重要。

以上就是C++原地删除有序数组重复项的N种方法的详细内容,更多关于C++删除有序数组重复项的资料请关注China编程(www.chinasem.cn)其它相关文章!

这篇关于C++原地删除有序数组重复项的N种方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1153896

相关文章

python获取指定名字的程序的文件路径的两种方法

《python获取指定名字的程序的文件路径的两种方法》本文主要介绍了python获取指定名字的程序的文件路径的两种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要... 最近在做项目,需要用到给定一个程序名字就可以自动获取到这个程序在Windows系统下的绝对路径,以下

JavaScript中的高级调试方法全攻略指南

《JavaScript中的高级调试方法全攻略指南》什么是高级JavaScript调试技巧,它比console.log有何优势,如何使用断点调试定位问题,通过本文,我们将深入解答这些问题,带您从理论到实... 目录观点与案例结合观点1观点2观点3观点4观点5高级调试技巧详解实战案例断点调试:定位变量错误性能分

Python中 try / except / else / finally 异常处理方法详解

《Python中try/except/else/finally异常处理方法详解》:本文主要介绍Python中try/except/else/finally异常处理方法的相关资料,涵... 目录1. 基本结构2. 各部分的作用tryexceptelsefinally3. 执行流程总结4. 常见用法(1)多个e

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法

JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法

《JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法》:本文主要介绍JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法,每种方法结合实例代码给大家介绍的非常... 目录引言:为什么"相等"判断如此重要?方法1:使用some()+includes()(适合小数组)方法2

如何通过try-catch判断数据库唯一键字段是否重复

《如何通过try-catch判断数据库唯一键字段是否重复》在MyBatis+MySQL中,通过try-catch捕获唯一约束异常可避免重复数据查询,优点是减少数据库交互、提升并发安全,缺点是异常处理开... 目录1、原理2、怎么理解“异常走的是数据库错误路径,开销比普通逻辑分支稍高”?1. 普通逻辑分支 v

504 Gateway Timeout网关超时的根源及完美解决方法

《504GatewayTimeout网关超时的根源及完美解决方法》在日常开发和运维过程中,504GatewayTimeout错误是常见的网络问题之一,尤其是在使用反向代理(如Nginx)或... 目录引言为什么会出现 504 错误?1. 探索 504 Gateway Timeout 错误的根源 1.1 后端

深入解析C++ 中std::map内存管理

《深入解析C++中std::map内存管理》文章详解C++std::map内存管理,指出clear()仅删除元素可能不释放底层内存,建议用swap()与空map交换以彻底释放,针对指针类型需手动de... 目录1️、基本清空std::map2️、使用 swap 彻底释放内存3️、map 中存储指针类型的对象

MySQL 表空却 ibd 文件过大的问题及解决方法

《MySQL表空却ibd文件过大的问题及解决方法》本文给大家介绍MySQL表空却ibd文件过大的问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考... 目录一、问题背景:表空却 “吃满” 磁盘的怪事二、问题复现:一步步编程还原异常场景1. 准备测试源表与数据

python 线程池顺序执行的方法实现

《python线程池顺序执行的方法实现》在Python中,线程池默认是并发执行任务的,但若需要实现任务的顺序执行,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋... 目录方案一:强制单线程(伪顺序执行)方案二:按提交顺序获取结果方案三:任务间依赖控制方案四:队列顺序消