数据结构入门:探索数据结构第一步

2024-06-13 17:52

本文主要是介绍数据结构入门:探索数据结构第一步,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

0.引言

在我们的日常生活中,经常需要管理大量的数据,就譬如学校中有好几千个学生,中国有十三亿人口,对于那么多的数据进行查找、插入、排序等操作就会比较慢。人们为了解决这些问题,提高对数据的管理效率,提出了一门学科:数据结构与算法

1.什么是数据结构

数据结构是由“数据”和“结构”两词组合而来。

什么是数据?

常见的数值1、2、3、4......、学生管理系统中保存的学生信息(学号、年龄、年级等到)都是数据

什么是结构?

我们想要大量的使用某一个类型的数据时,需要手动定义大量的独立的变量对于程序来说,可读性非常差,因此我们会借助数组这样的数据结构将大量的数据组织在一起,结构就可以理解为组织数据的方式。

打个比喻,如果我们把叫“裤衩”的羊放生到草原上,我们自然很难找到它;但,如果我们把这只羊放到羊圈里,我们就可以很轻松的找到它。

2.什么是算法

对于我们在这个地方的学习而言,算法就是一个计算过程,它指的是一系列的计算步骤,用来将输入的数据转化成为输出的结果。

而在我们的课程内,我们需要学习的算法是:搜索、排序,递归、分治、回溯、DP、贪心。

算法是一个很让人头疼的东西,学习算法就像学习数学,而且初学时往往一道题做着做着几个小时就过去了......  但,持之以恒,每个类型的题目都积累了一定数量了之后,算法对于我们而言便小菜一碟了。

在我们数据结构这本书上,我们会学到的算法是搜索和排序以及一部分的递归算法

3.复杂度分析

3.1算法评估

我们的学习数学的过程中,经常会遇到一题多解的情况出现,而其中总有一种方法会被称为最优解。

我们对一个编程问题的解决也是如此,可能两段程序拥有相同的入口,也可以达到相同的目标。

那么,我们如何判断两段程序的优劣呢?

我们在判断程序的优劣,自然而然的就可以想到两个方面的问题:

  • 时间效率:算法运行的快慢
  • 空间效率:算法所占空间的大小

3.2评估方法

评估时间的方法:

  • 实验分析法
  • 理论分析法

3.2.1实验分析法

实验分析法简单来说就是将不同的算法输入到同一台电脑上,统计时间的快慢。但是这种方法有两个缺陷:

  1. 无法排查实验自身条件与环境的条件的影响:比如同一种算法在不同配置的电脑上的运算速度可能不同,甚至结果完全相反。我们很难排查所有的情况
  2. 成本太高:同一种算法可能在数据少时表现不明显,在数据多时速率教快(学到排序后大家就可以理解这一句话了)。而且哪来那么多电脑给你做实验......

3.2.2理论分析法        

由于实验分析法的局限性,就有人提出了一种理论测评的方法,就是渐进复杂度分析,简称复杂度分析。

这种方法体现算法运行所需的时空资源与输入数据大小之间的关系,能够有效的反应处算法的优劣。

4.时间复杂度和空间复杂度

4.1空间复杂度

一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度。

我们现在假设每条语句执行所用的时间为1ns

那么,以下这段代码执行所需时间:

int main()
{int a = 3;//1int b = 5;//1int c = a + b;//1int n = 0;//1scanf("%d ", &n);//1for (int i = 0; i < n; i++){printf("%d ", i);//n}printf("%d ", c);//1return 0;
}

计算时间如下:

                       T\left ( n \right )=1+1+1+1+1+1+n=6+n 

如果,n趋于正无穷时,那么,式子内的常数6的影响是微乎其微的,我们就可以将其忽略掉。

现在,我们改写一下这段代码

int main()
{int a = 3;//1int b = 5;//1int c = a + b;//1int n = 0;//1scanf("%d ", &n);//1for (int i = 0; i < 3n; i++){printf("%d ", i);//3n}printf("%d ", c);//1return 0;
}

此时,它的时间为:                        

                         T\left ( n \right )=1+1+1+1+1+1+3n=6+3n

在刚刚,我们已经发现常数可以忽略了,现在我们同样让n趋于正无穷,这时我们发现,3n和n的极限都是正无穷,那么,它的系数影响的也不大了。因此,我们也可以把系数忽略掉。

现在,我们再改写一下代码:

int main()
{int a = 3;//1int b = 5;//1int c = a + b;//1int n = 0;//1scanf("%d ", &n);//1for (int i = 0; i < 3n; i++){printf("%d ", i);//n}for (int i = 0; i < n^2; i++){printf("%d ", i);//n的平方}printf("%d ", c);//1return 0;
}

此时,它的时间为:

                  T\left ( n \right )=1+1+1+1+1+1+3n+n^{2}=6+3n+n^{2}

显而易见的是,随着n的扩大,n^2的变化率必然是要比n高的。

譬如,当n等于一千时,n^2就是一百万了。

假如说一个国家有一百万零一千个兵,那么,战死了一千个兵会影响到别的国家对这个国家的评估吗?

这是显然不会的。

同理,在我们对算法的评估中,我们也不会在乎这个影响,因此,我们也可以将n忽略掉。

根据刚刚所说的内容,我们继续向外推导,如果一个数是指数,那么自然也就可以忽略这个平方了。

现在给大家介绍一个概念:“阶”

在数学和计算机科学中,"阶"通常指的是函数的增长速度,特别是在描述算法的时间复杂度时。阶通常与函数的输入规模n相关,用来表示随着输入规模n的增加,函数值增长的速度。

通过上述的推导过程,我们可以得到这么一个结论:

  • 最高阶项的增长速度远超过其他低阶项,因此低阶项的影响可以忽略不计。

也就是说,阶数高的可以忽略阶数低的

现在,我们发现,时间复杂度的计算可以简化为两个步骤:

  • 忽略除最高阶以外的所有项
  • 忽略所有系数

这里需要我们大家注意的一点是:我们对时间复杂度的理论推导是基于理论的,而不是基于实例。

然后现在我们学习一下如何记录时间复杂度:

譬如上面的一段代码,时间复杂度为O(n^2),这种方法称为大O的渐进表示法。

现在给大家写一个O(1)的代码

int main()
{int a = 3;//1int b = 5;//1int c = a + b;//1return 0;
}

 时间:

                                      T\left ( n \right )=1+1+1=3X1

我们认为3是1的系数,因此这段代码的时间复杂度为O(1),表示常数阶。

最后一个需要大家注意的点是:

  • 在计算复杂度时,我们考虑最坏的情况,不是最坏的情况算出的时间复杂度都是错误的。

4.2空间复杂度

空间复杂度也是一个数学表达式,它的计算方式和空间复杂度是一样的。

在这里,它计算的是一个算法在运行过程中临时占用存储空间大小的量度。

这里,我们关心的是临时变量占用存储空间的量度,而不是具体的变量大小。

也就是说,我们关心的是创建的临时变量的个数,而不关心具体的大小。

下面给大家算几个实例:

//这段代码在有的编译器过不了,大家可能无法运行
void func()
{int n = 0;scanf("%d ", &n);int arr[n];//开辟了n个空间     
}

这段代码中,开辟了n个空间,空间复杂度为O(n)。

void Swap(int  a,int b)
{int c = a;a = b;b = c;
}

开辟了一个整型的空间,空间复杂度为O(1) 

由于1KB=1024Byte ,所以1MB=1024*1024=1048576字节,大概就是一百万字节。

一百万字节能存的变量可太多了,因此我们现在更加关注时间复杂度而不是空间复杂度。

5.常见时间复杂度

这里分析两段代码的复杂度,分别是冒泡排序和折半查找

冒泡排序:

void bubble_sort(int* arr, int sz)
{for (int i = 0; i < sz-1; i++){int flag = 1;for (int j = 0; j < sz-1- i; j++)//每次都可以少比较一个数{if (arr[j] > arr[j + 1]){flag = 0;int tmp = arr[j];arr[j] = arr[j + 1];arr[j + 1] = tmp;}}if (flag == 1)break;}
}
int main()
{int arr[] = { 8,3,2,7,10,9,1,0,7,4};int sz = sizeof(arr) / sizeof(arr[0]);bubble_sort(arr, sz);for (int i= 0; i < sz; i++){printf("%d ", arr[i]);}return 0;
}

时间复杂度O(n^2);空间复杂度O(1)

折半查找:

int binarySearch(int arr[], int size, int key) {int left = 0;int right = size - 1;while (left <= right) {int mid = left + (right - left) / 2; // 防止溢出if (arr[mid] == key) {return mid; // 找到键值,返回下标} else if (arr[mid] < key) {left = mid + 1; // 键值在右侧子数组} else {right = mid - 1; // 键值在左侧子数组}}return -1; // 未找到键值,返回-1
}

 时间复杂度:O(logn)  空间复杂度:O(1)

结构体

这篇关于数据结构入门:探索数据结构第一步的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1058008

相关文章

Spring WebClient从入门到精通

《SpringWebClient从入门到精通》本文详解SpringWebClient非阻塞响应式特性及优势,涵盖核心API、实战应用与性能优化,对比RestTemplate,为微服务通信提供高效解决... 目录一、WebClient 概述1.1 为什么选择 WebClient?1.2 WebClient 与

Spring Boot 与微服务入门实战详细总结

《SpringBoot与微服务入门实战详细总结》本文讲解SpringBoot框架的核心特性如快速构建、自动配置、零XML与微服务架构的定义、演进及优缺点,涵盖开发环境准备和HelloWorld实战... 目录一、Spring Boot 核心概述二、微服务架构详解1. 微服务的定义与演进2. 微服务的优缺点三

从入门到精通详解LangChain加载HTML内容的全攻略

《从入门到精通详解LangChain加载HTML内容的全攻略》这篇文章主要为大家详细介绍了如何用LangChain优雅地处理HTML内容,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录引言:当大语言模型遇见html一、HTML加载器为什么需要专门的HTML加载器核心加载器对比表二

从入门到进阶讲解Python自动化Playwright实战指南

《从入门到进阶讲解Python自动化Playwright实战指南》Playwright是针对Python语言的纯自动化工具,它可以通过单个API自动执行Chromium,Firefox和WebKit... 目录Playwright 简介核心优势安装步骤观点与案例结合Playwright 核心功能从零开始学习

从入门到精通MySQL联合查询

《从入门到精通MySQL联合查询》:本文主要介绍从入门到精通MySQL联合查询,本文通过实例代码给大家介绍的非常详细,需要的朋友可以参考下... 目录摘要1. 多表联合查询时mysql内部原理2. 内连接3. 外连接4. 自连接5. 子查询6. 合并查询7. 插入查询结果摘要前面我们学习了数据库设计时要满

从入门到精通C++11 <chrono> 库特性

《从入门到精通C++11<chrono>库特性》chrono库是C++11中一个非常强大和实用的库,它为时间处理提供了丰富的功能和类型安全的接口,通过本文的介绍,我们了解了chrono库的基本概念... 目录一、引言1.1 为什么需要<chrono>库1.2<chrono>库的基本概念二、时间段(Durat

解析C++11 static_assert及与Boost库的关联从入门到精通

《解析C++11static_assert及与Boost库的关联从入门到精通》static_assert是C++中强大的编译时验证工具,它能够在编译阶段拦截不符合预期的类型或值,增强代码的健壮性,通... 目录一、背景知识:传统断言方法的局限性1.1 assert宏1.2 #error指令1.3 第三方解决

从入门到精通MySQL 数据库索引(实战案例)

《从入门到精通MySQL数据库索引(实战案例)》索引是数据库的目录,提升查询速度,主要类型包括BTree、Hash、全文、空间索引,需根据场景选择,建议用于高频查询、关联字段、排序等,避免重复率高或... 目录一、索引是什么?能干嘛?核心作用:二、索引的 4 种主要类型(附通俗例子)1. BTree 索引(

Redis 配置文件使用建议redis.conf 从入门到实战

《Redis配置文件使用建议redis.conf从入门到实战》Redis配置方式包括配置文件、命令行参数、运行时CONFIG命令,支持动态修改参数及持久化,常用项涉及端口、绑定、内存策略等,版本8... 目录一、Redis.conf 是什么?二、命令行方式传参(适用于测试)三、运行时动态修改配置(不重启服务

MySQL DQL从入门到精通

《MySQLDQL从入门到精通》通过DQL,我们可以从数据库中检索出所需的数据,进行各种复杂的数据分析和处理,本文将深入探讨MySQLDQL的各个方面,帮助你全面掌握这一重要技能,感兴趣的朋友跟随小... 目录一、DQL 基础:SELECT 语句入门二、数据过滤:WHERE 子句的使用三、结果排序:ORDE