机器学习之利用k-means算法对点云数据进行目标分割,提取其中的建筑物、房屋等

本文主要是介绍机器学习之利用k-means算法对点云数据进行目标分割,提取其中的建筑物、房屋等,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

原始点云数据在CloudCompare的显示如下:

  利用k-means算法提取出其中的建筑物、房屋等,我这里的代码是根据k-means算法的原理编写的代码,这样有助于大家对k-means算法的运行原理有一个深层次的了解,当然也可以直接调用sklearn里的算法,但是那样的话对于将来发展是不利的,毕竟知道算法的原理并根据原理编写代码学到的知识还是更多一些的。

代码如下:

#Author ZTY
import csv
import numpy as np
def kmean(x,k,maxtimes):m,n = np.shape(x)# 建立一个比数据集多一列的零矩阵,多的一列用来存放标签dataset = np.zeros([m,n+1])dataset[:,:-1] = x#根据要聚类的数量,初始化相应数量的中心点,可以随机选择n个,也可以选前n个作为初始点#middle = dataset[np.random.randint(m,size=k),:]middle = dataset[0:3,:]#为选定的中心点赋予标签middle[:,-1] = range(1,k+1)times = 0oldmiddle = None#迭代更新中心点时,判断何时停止while not shouldstop(oldmiddle,middle,times,maxtimes):print('times:',times)print('dataset:',dataset)print('middle:',middle)oldmiddle = np.copy(middle)times = times + 1#根据中心点,更新其他各个点的标签update(dataset,middle)#获取新的中心点middle = getmiddles(dataset,k)return datasetdef shouldstop(oldmiddle,middle,times,maxtimes):if times > maxtimes:return Truereturn np.array_equal(oldmiddle,middle)def update(dataset,middle):m,n =dataset.shapefor i in range(0,m):dataset[i,-1] = getLabelFromCloestCentroid(dataset[i,:-1],middle)#找出各个点距离最近的中心点,将中心点的标签赋予当前点
def getLabelFromCloestCentroid(datasetRow,middle):label = middle[0,-1]minDist = np.linalg.norm(datasetRow - middle[0,:-1])#np.linalg.norm(a-b)用来计算a,b两点之间的距离,a.b如果是list,必须要np.array(a)进行格式转换for i in range(1,middle.shape[0]):dist = np.linalg.norm(datasetRow - middle[i,:-1])if dist < minDist:minDist = distlabel = middle[i,-1]print('minDist',minDist)print('label',label)return labeldef getmiddles(datatset,k):result = np.zeros((k,datatset.shape[1]))for i in range(1,k+1):oneCluster = datatset[datatset[:,-1]==i,:-1]result[i-1,:-1] = np.mean(oneCluster,axis=0)result[i-1,-1] = ireturn resultfile = open(r'全部点云数据.csv','r')
reader = csv.reader(file)
reader = list(reader)
m,n = np.shape(reader)
for i in range(0,m):for j in range(0,3):#转换数据类型reader[i][j] = float(reader[i][j])
m,n = np.shape(reader)
list1 = np.zeros([m,2])
for i in range(0,m):for j in range(2,4):#获取数据的z指与强度值list1[i][j-2] = reader[i][j]# x = np.vstack((a,b,c,d))
result = kmean(list1,3,10)
print('result:',result[0])
print(reader[0])
reader0 = np.zeros([m,5])
for i in range(0,m):for j in range(0,4):reader0[i][j] = reader[i][j]
for i in range(0,m):reader0[i][-1] = int(result[i][-1])
print(reader0)w1=open("1.txt","w")
w2=open("2.txt","w")
w3=open("3.txt","w")
w4=open("4.txt","w")for i in range(m):if(reader0[i][-1]==1):w1.write("%s %s %s %s\n"%(reader0[i][0],reader0[i][1],reader0[i][2],reader0[i][3]))if(reader0[i][-1]==2):w2.write("%s %s %s %s\n" % (reader0[i][0], reader0[i][1], reader0[i][2],reader0[i][3]))if (reader0[i][-1] ==3):w3.write("%s %s %s %s\n" % (reader0[i][0], reader0[i][1], reader0[i][2],reader0[i][3]))if (reader0[i][-1] == 4):w4.write("%s %s %s %s\n" % (reader0[i][0], reader0[i][1], reader0[i][2],reader0[i][3]))

  以上代码将k值设置为4,也就是将点云聚成4类。输出为4个txt数据,加载进软件,效果图如下,分别是提取的道路,建筑物:

还是利用上述代码,将道路数据放进代码,将K设置为2,可以将道路数据聚类为两类,提取出道路的主干和边界:

PS:附上数据链接  https://download.csdn.net/download/qq_39343904/10863193

 

 

这篇关于机器学习之利用k-means算法对点云数据进行目标分割,提取其中的建筑物、房屋等的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/523270

相关文章

深入理解Mysql OnlineDDL的算法

《深入理解MysqlOnlineDDL的算法》本文主要介绍了讲解MysqlOnlineDDL的算法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小... 目录一、Online DDL 是什么?二、Online DDL 的三种主要算法2.1COPY(复制法)

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

C#使用iText获取PDF的trailer数据的代码示例

《C#使用iText获取PDF的trailer数据的代码示例》开发程序debug的时候,看到了PDF有个trailer数据,挺有意思,于是考虑用代码把它读出来,那么就用到我们常用的iText框架了,所... 目录引言iText 核心概念C# 代码示例步骤 1: 确保已安装 iText步骤 2: C# 代码程

Pandas处理缺失数据的方式汇总

《Pandas处理缺失数据的方式汇总》许多教程中的数据与现实世界中的数据有很大不同,现实世界中的数据很少是干净且同质的,本文我们将讨论处理缺失数据的一些常规注意事项,了解Pandas如何表示缺失数据,... 目录缺失数据约定的权衡Pandas 中的缺失数据None 作为哨兵值NaN:缺失的数值数据Panda

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

Python进行word模板内容替换的实现示例

《Python进行word模板内容替换的实现示例》本文介绍了使用Python自动化处理Word模板文档的常用方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友... 目录技术背景与需求场景核心工具库介绍1.获取你的word模板内容2.正常文本内容的替换3.表格内容的

python库pydantic数据验证和设置管理库的用途

《python库pydantic数据验证和设置管理库的用途》pydantic是一个用于数据验证和设置管理的Python库,它主要利用Python类型注解来定义数据模型的结构和验证规则,本文给大家介绍p... 目录主要特点和用途:Field数值验证参数总结pydantic 是一个让你能够 confidentl

Git进行版本控制的实战指南

《Git进行版本控制的实战指南》Git是一种分布式版本控制系统,广泛应用于软件开发中,它可以记录和管理项目的历史修改,并支持多人协作开发,通过Git,开发者可以轻松地跟踪代码变更、合并分支、回退版本等... 目录一、Git核心概念解析二、环境搭建与配置1. 安装Git(Windows示例)2. 基础配置(必

JAVA实现亿级千万级数据顺序导出的示例代码

《JAVA实现亿级千万级数据顺序导出的示例代码》本文主要介绍了JAVA实现亿级千万级数据顺序导出的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 前提:主要考虑控制内存占用空间,避免出现同时导出,导致主程序OOM问题。实现思路:A.启用线程池

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建