C++原地删除有序数组重复项的N种方法

2025-03-23 14:50

本文主要是介绍C++原地删除有序数组重复项的N种方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《C++原地删除有序数组重复项的N种方法》给定一个排序数组,你需要在原地删除重复出现的元素,使得每个元素只出现一次,返回移除后数组的新长度,不要使用额外的数组空间,你必须在原地修改输入数组并在使用O(...

一、问题

给定一个非严格递增排序的整数数组 nums,请、原地删除重复出现的元素,使得每个元素只出现一次。返回删除后数组的新长度。

要求:

  1. 原地修改: 必须直接修改输入数组 nums。不允许使用额外的空间。
  2. 相对顺序: 元素之间的相对顺序必须保持一致。
  3. 返回唯一元素个数: 返回数组中唯一元素的个数 k
  4. 数组内容: 数组 nums 的前 k 个元素应包含唯一元素,并且按照它们最初在 nums 中出现的顺序排列。 nums 数组中下标 k 及之后的部分的内容可以任意修改,其值不影响结果。

示例:

输入:nums = [1,1,2]
输出:2, nums = [1,2,_] // 下划线表示不重要的位置

输入:nums = [0,0,1,1,1,2,2,3,3,4]
输出:5, nums = [0,1,2,3,4,,,,,_]

解释:

函数应该返回新的长度 k = 5, 并且 nums 的前五个元素为 0, 1, 2, 3, 4。 不需要考虑数组中超出新长度后面的元素。

关键点:

  • 非严格递增: 意味着数组是排序的,但不一定是严格升序 (允许重复元素)。
  • 原地删除: 空间复杂度必须是 O(1)。
  • 相对顺序不变: 删除重复元素后,剩余元素的顺序要与原始python数组中的顺序相同。

二、问题分析

核心目标: 从已排序的数组中移除重复元素,确保每个唯一元素只出现一次,并返回唯一元素的数量。
约束条件:

  • 原地操作: 这是最关键的约束。我们不能创建新的数组来存储结果。必须直接修改原始数组。
  • 相对顺序: 删除重复项后,唯一元素的相对顺序必须与原始数组保持一致。
  • 排序特性: 输入数组是已排序的。这是一个重要的前提,允许我们使用更高效的算法。

解题思路: 由于数组已排序,可以使用双指针方法来解决这个问题。双指针方法通常用于原地操作,且效率较高。

  • 慢指针(i): 指向下一个非重复元素应该放置的位置。
  • 快指针(j): 用于遍历数组,查找非重复元素。

算法步骤:

  1. 初始化:
    • i = 0 (慢指针,指向数组的第一个位置,即第一个唯一元素应该放置的位置)。
    • j = 1 (快指针,从数组的第二个位置开始遍历)。
  2. 遍历数组:
    • 使用 j 遍历数组 nums
    • 如果 nums[j] != nums[i] 说明 nums[j] 是一个新的唯一元素。
      • 将 i 向前移动一位(i++)。
      • 将 nums[j] 复制到 nums[i] 的位置(nums[i] = nums[j])。
    • 否则 (如果 nums[j] == nums[i]): 说明 nums[j] 是一个重复元素,跳过它。
  3. 返回结果: 循环结束后,i + 1 就是数组中唯一元素的数量(因为 i 是索引,从 0 开始)。

示例演示: 假设 numandroids = [0, 0, 1, 1, 1, 2, 2, 3, 3, 4]

步骤ijnums说明
101[0, 0, 1, 1, 1, 2, 2, 3, 3, 4]初始化
202[0, 0, 1, 1, 1, 2, 2, 3, 3, 4]nums[2] != nums[0]i++nums[1] = nums[2]
313[0, 1, 1, 1, 1, 2, 2, 3, 3, 4]nums[3] != nums[1]i++nums[2] = nums[3]
424[0, 1, 2, 1, 1, 2, 2, 3, 3, 4]nums[4] != nums[2]i++nums[3] = nums[4]
535[0, 1, 2, 1, 1, 2, 2, 3, 3, 4]nums[5] != nums[3]i++nums[4] = nums[5]
646[0, 1, 2, 3, 1, 2, 2, 3, 3, 4]nums[6] != nums[4]i++nums[5] = nums[6]
757[0, 1, 2, 3, 4, 2, 2, 3, 3, 4]nums[7] != nums[5]i++nums[6] = nums[7]
868[0, 1, 2, 3, 4, 3, 2, 3, 3, 4]nums[8] != nums[6]i++nums[7] = nums[8]
979[0, 1, 2, 3, 4, 3, 3, 3, 3, 4]nums[9] != nums[7]i++nums[8] = nums[9]
10810[0, 1, 2, 3, 4, 3, 3, 3, 4, 4]循环结束

最终结果:nums = [0, 1, 2, 3, 4, ...],返回 i + 1 = 5

复杂度分析:

  • 时间复杂度: O(n),其中 n 是数组的长度。我们需要遍历数组一次。
  • 空间复杂度: O(1),原地操作,只使用了常数级别的额外空间。

三、算法实现

由于数组已排序,可以使用双指针方法来解决这个问题。

  1. 初始化快慢指针
  2. 遍历数组
  3. 返回结果
class Solution {
public:
    int removeDuplicates(vector<int>& nums) {
        if (nums.size() < 2)
            return nums.size();
        int left = 0;
        int right = 1;
        while (right < nums.size()) {
            if (nums[right] == nums[left])
                ++right;
            else 
                nums[++left] = nums[right++];
        }
        return left + 1;
    }
};

四、问题变体:最多保留两次

删除有序数组中的多余重复项 (最多保留两次): 给定一个已排序的数组 nums,请 原地 删除重复出现的元素,使得每个元素最多出现两次。返回删除后数组的新长度。

要求:

  1. 原地修改: 必须直接修改输入数组 nums。不允许使用额外的数组空间。
  2. O(1) 额外空间: 必须在 O(1) 的额外空间复杂度下完成此操作。
  3. 相对顺序: 元素的相对顺序必须保持一致。
  4. 返回值: 返回删除重复元素后的数组的新长度 k
  5. 数组内容: 数组 nums 的前 k 个元素应该包含处理后的元素,超出 k 长度的部分可以忽略。

示例:

输入:nums = [1,1,1,2,2,3]
输出:5, nums = [1,1,2,2,3,_] // 下划线表示不重要的位置

输入:nums = [0,0,0,1,1,1,2,2,3,3,4]
输出:9, nums = [0,0,1,1,2,2,3,3,4,_]

说明:

  • 对于 nums = [1,1,1,2,2,3],函数应该返回新的长度 k = 5,并且 nums 的前五个元素为 1, 1, 2, 2, 3
  • 对于 nums = [0,0,0,1,1,1,2,2,3,3,4],函数应该返回新的长度 k = 9,并且 nums 的前九个元素为 0, 0, 1, 1, 2, 2, 3, 3, 4

关键点:

  • 有序数组: 输入数组是已排序的,利用这一特性可以优化算法。
  • 最多保留两次: 每个元素最多允许出现两次。
  • 原地修改 + O(1): 限制了算法的选择,必须采用空间复杂度为常数的算法。

五、分析和代码实现

5.1、问题分析

可以将问题分解为以下几个子问题:

  • 识别重复项: 如何有效地识别重复出现的元素? 由于数组是有序的,相邻元素相同则为重复。
  • 计数: 如何记录每个元素出现的次数? 需要一个变量来追踪当前元素出现的次数。
  • 原地修改: 如何在不使用额外空间的情况下,将需要保留的元素移动到数组的前面? 使用双指针方法是关键。
  • 更新长度: 如何计算并返回修改后的数组长度? 慢指针的最终位置 + 1 就是新长度。

算法思路: 基于双指针方法,结合计数器来解决此问题。

  • 慢指针(i): 指向下一个要保留的元素应该放置的位置。
  • 快指针(j): 用于遍历数组,检查元素是否应该被保留。
  • 计数器(count): 记录当前元素连续出现的次数。

5.2、算法实现

算法步骤:

  1. 初始化:

    • i = 0 (慢指针)
    • j = 0 (快指针)
    • count = 1 (初始计数为 1,因为 nums[0] 至少出现一次)
  2. 遍历数组:

    • 循环 j 从 1 到 nums.length - 1
    • 情况 1:nums[j] == nums[j-1] (遇到相同元素)
      • count++ (增加计数器)。
      • 如果 count <= 2 说明当前元素允许被保留。
        • 将 nums[j] 复制到 nums[i] 的位置 ( nums[i] = nums[j] )。
        • i++ (移动慢指针)。
    • 情况 2:nums[j] != nums[j-1] (遇到不同元素)
      • nums[i] = nums[j]
      • i++
      • count=1
  3. 返回结果: 循环结束后,i 就是数组中应该保留的元素个数,因此返回 i

示例演示: 假设 nums = [1,1,1,2,2,3]

步骤ijcountnums说明
1001[1, 1, 1, 2, 2, 3]初始化
2012[1, 1, 1, 2, 2, 3]nums[1] == nums[0]count++count <= 2nums[0] = nums[1]i++
3123[1, 1, 1, 2, 2, 3]nums[2] == nums[1]count++count > 2,跳过
4131[1, 1, 1, 2, 2, 3]nums[3] != nums[2]count = 1nums[1] = nums[3], i++
5242[1, 2, 1, 2, 2, 3]nums[4] == nums[3]count++count <= 2nums[2] = nums[4]i++
6351[1, 2, 2, 2, 2, 3]nums[5] != nums[4]count = 1nums[3] = nums[5], i++

最终结果:nums = [1, 1, 2, 2, 3, ...],返回 i = 5

class Solution {
public:
    int removeDuplicates(vector<int>& nums) {
        int n = nums.size();
        if (n < 3)
            return n;
        int left = 1;
        int count = 1;
        for (int right = 1; right < n; ++right) {
            if (nums[right - 1] == nums[right]) {
                ++coOTDyHspunt;
                if (count <= 2) {
                    nums[left] = nums[right];
                    ++left;
                }
            } else {
                nums[left] = nums[right];
                ++left;
                count = 1;
            }
        }
        return  left;
    }
};

复杂度分析:

  • 时间复杂度: O(n)China编程,其中 n 是数组的长度。需要遍历数组一次。
  • 空间复杂度: O(1),使用了常数级别的额外空间(ijcount)。

5.3、快慢指针(推荐)

原理:

  • slow 指针初始值为 2,因为它表示新数组中前两个元素已经确定(即原数组的前两个元素)。
  • fast 指针从 2 开始遍历数组。
  • 如果 nums[fast] 与 nums[slow - 2] 不相等,则说明 nums[fast] 可以被添加到新数组中,将其赋值给 nums[slow],并同时递增 slow 指针。
  • 如果 nums[fast] 与 nums[slow - 2] 相等,则说明 nums[fast] 是多余的重复元素,直接跳过。
  • 循环结束后,slow 指针的值就是新数组的长度。

示例演示: 假设 nums = [1,1,1,2,2,3]

步骤slowfastnums说明
12php2[1, 1, 1, 2, 2, 3]初始化
223[1, 1, 1, 2, 2, 3]nums[3] != nums[slow - 2] (2 != 1),nums[slow] = nums[fast] (nums[2] = 2),slow++
334[1, 1, 2, 2, 2, 3]nums[4] != nums[slow - 2] (2 != 1),nums[slow] = nums[fast] (nums[3] = 2),slow++
445[1, 1, 2, 2, 2, 3]nums[5] != nums[slow - 2] (3 != 2),nums[slow] = nums[fast] (nums[4] = 3),slow++

最终结果:nums = [1, 1, 2, 2, 3, ...],返回 slow = 5

代码实现:

class Solution {
public:
    int removeDuplicates(vector<int>& nums) {
        int n = nums.size();
        if (n <= 2) {
            return n; // 少于等于两个元素,直接返回
        }

        int slow = 2; // slow指针指向下一个要放置的位置,从第三个位置开始
        int fast = 2; // fast指针用于遍历数组

        while (fast < n) {
            // 如果当前元素与slow指针的前两个元素不同,说明可以保留
            if (nums[fast] != nums[slow - 2]) {
                nums[slow] = nums[fast]; // 将fast指针指向的元素移动到slow指针的位置
                slow++; // slow指针向后移动
            }
            fast++; // fast指针始终向后移动
        }

        return slow; // slow指针的值就是新数组的长度
    }
};

复杂度分析:

  • 时间复杂度: O(n),其中 n 是数组的长度。只需要遍历数组一次。
  • 空间复杂度: O(1),使用了常数级别的额外空间(slowfast)。

5.4、低效率的代码实现

思路:对于超过 2 次的重复元素,超出部分使用循环将它们移动到数组的末尾。

思路是正确的,但存在一些效率问题和潜在的错误。核心问题在于,对于每个需要删除的元素,都进行一次循环移动操作,这会导致时间复杂度过高,尤其是在重复元素较多的情况下。

class Solution {
public:
    int removeDuplicates(vector<int>& nums) {
        int n = nums.size();
        if (n < 3)
            return n;
        int left = 0;
        for (int right = 1; right < n; ++right) {
            if (nums[left] != nums[right]) {
                left = right;
                continue;
            }
            if (right - left > 1) {
                for (int i = right - 1; i < (n - 1); ++i) 
                    std::swap(nums[i], nums[i + 1]);
                --n;
                --right;
            }
        }
        return n;
    }
};

六、总结

双指针方法是一个解决此类原地修改问题的有效方法。通过维护两个指针,一个指向下一个唯一元素的位置,另一个用于遍历数组,我们可以高效地删除重复项并保持相对顺序不变。 理解排序数组的特性对于选择正确的算法至关重要。

以上就是C++原地删除有序数组重复项的N种方法的详细内容,更多关于C++删除有序数组重复项的资料请关注China编程(www.chinasem.cn)其它相关文章!

这篇关于C++原地删除有序数组重复项的N种方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1153896

相关文章

Java学习手册之Filter和Listener使用方法

《Java学习手册之Filter和Listener使用方法》:本文主要介绍Java学习手册之Filter和Listener使用方法的相关资料,Filter是一种拦截器,可以在请求到达Servl... 目录一、Filter(过滤器)1. Filter 的工作原理2. Filter 的配置与使用二、Listen

Pandas统计每行数据中的空值的方法示例

《Pandas统计每行数据中的空值的方法示例》处理缺失数据(NaN值)是一个非常常见的问题,本文主要介绍了Pandas统计每行数据中的空值的方法示例,具有一定的参考价值,感兴趣的可以了解一下... 目录什么是空值?为什么要统计空值?准备工作创建示例数据统计每行空值数量进一步分析www.chinasem.cn处

Windows 上如果忘记了 MySQL 密码 重置密码的两种方法

《Windows上如果忘记了MySQL密码重置密码的两种方法》:本文主要介绍Windows上如果忘记了MySQL密码重置密码的两种方法,本文通过两种方法结合实例代码给大家介绍的非常详细,感... 目录方法 1:以跳过权限验证模式启动 mysql 并重置密码方法 2:使用 my.ini 文件的临时配置在 Wi

MySQL重复数据处理的七种高效方法

《MySQL重复数据处理的七种高效方法》你是不是也曾遇到过这样的烦恼:明明系统测试时一切正常,上线后却频频出现重复数据,大批量导数据时,总有那么几条不听话的记录导致整个事务莫名回滚,今天,我就跟大家分... 目录1. 重复数据插入问题分析1.1 问题本质1.2 常见场景图2. 基础解决方案:使用异常捕获3.

最详细安装 PostgreSQL方法及常见问题解决

《最详细安装PostgreSQL方法及常见问题解决》:本文主要介绍最详细安装PostgreSQL方法及常见问题解决,介绍了在Windows系统上安装PostgreSQL及Linux系统上安装Po... 目录一、在 Windows 系统上安装 PostgreSQL1. 下载 PostgreSQL 安装包2.

SQL中redo log 刷⼊磁盘的常见方法

《SQL中redolog刷⼊磁盘的常见方法》本文主要介绍了SQL中redolog刷⼊磁盘的常见方法,将redolog刷入磁盘的方法确保了数据的持久性和一致性,下面就来具体介绍一下,感兴趣的可以了解... 目录Redo Log 刷入磁盘的方法Redo Log 刷入磁盘的过程代码示例(伪代码)在数据库系统中,r

redis过期key的删除策略介绍

《redis过期key的删除策略介绍》:本文主要介绍redis过期key的删除策略,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录第一种策略:被动删除第二种策略:定期删除第三种策略:强制删除关于big key的清理UNLINK命令FLUSHALL/FLUSHDB命

C++如何通过Qt反射机制实现数据类序列化

《C++如何通过Qt反射机制实现数据类序列化》在C++工程中经常需要使用数据类,并对数据类进行存储、打印、调试等操作,所以本文就来聊聊C++如何通过Qt反射机制实现数据类序列化吧... 目录设计预期设计思路代码实现使用方法在 C++ 工程中经常需要使用数据类,并对数据类进行存储、打印、调试等操作。由于数据类

Python实现图片分割的多种方法总结

《Python实现图片分割的多种方法总结》图片分割是图像处理中的一个重要任务,它的目标是将图像划分为多个区域或者对象,本文为大家整理了一些常用的分割方法,大家可以根据需求自行选择... 目录1. 基于传统图像处理的分割方法(1) 使用固定阈值分割图片(2) 自适应阈值分割(3) 使用图像边缘检测分割(4)

Java中Switch Case多个条件处理方法举例

《Java中SwitchCase多个条件处理方法举例》Java中switch语句用于根据变量值执行不同代码块,适用于多个条件的处理,:本文主要介绍Java中SwitchCase多个条件处理的相... 目录前言基本语法处理多个条件示例1:合并相同代码的多个case示例2:通过字符串合并多个case进阶用法使用