Photometric Stereo 光度立体三维重建(三)——由法向量恢复深度

本文主要是介绍Photometric Stereo 光度立体三维重建(三)——由法向量恢复深度,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文分为三部分,第一部分是使用最小二乘法求解物体表面法向量,第二部分是利用求解得到的法向量求出物体表面的深度(物体表面的高度场),第三部分是将求出的高度场写成obj文件后使用MeshLab显示

1. 最小二乘求解物体表面法向量

Python代码
代码所使用的数据来自https://github.com/yasumat/RobustPhotometricStereo

import numpy as np
import cv2
import glob
from sklearn.preprocessing import normalize# 光源位置数据路径以及物体各帧图像的路径
lights_path = r'.\RobustPhotometricStereo\data\bunny\lights.npy'
bunny_path = r'.\RobustPhotometricStereo\data\bunny\bunny_lambert\*.npy'# 读取光源方向
# 读取到的是 L.T
Lt = np.load(lights_path) # 读取图像
M = []
for fname in sorted(glob.glob(bunny_path)):im = np.load(fname).astype(np.float32)im = cv2.cvtColor(im, cv2.COLOR_RGB2GRAY)if M == []:height, width = im.shapeM = im.reshape((-1, 1))else:M = np.append(M, im.reshape((-1, 1)), axis=1)
M = np.asarray(M)# 光度立体计算 使用最小二乘法
# M = NL <-> M.T = L.T N.T
N = np.linalg.lstsq(Lt, M.T)[0].T
N = normalize(N, axis=1)# 可视化
N = np.reshape(N, (height, width, 3))
N[:,:,0], N[:,:,2] = N[:,:,2], N[:,:,0].copy()
N = (N + 1.0) / 2.0
cv2.imshow('normal map', N)
cv2.waitKey()
cv2.destroyAllWindows()

生成的法向量图:
在这里插入图片描述
在以上提到的github项目里,有更多求解法向量的方法

2. 恢复物体表面深度(恢复高度场)

2.1 基本原理

参考:1.http://pages.cs.wisc.edu/~csverma/CS766_09/Stereo/stereo.html
2.https://www.zhihu.com/question/388447602/answer/1200616778
在这里插入图片描述

由图可知,物体surface patch的法向量n一定与v1和v2正交,该patch与图像平面(i,j)处的像素相对应,可以获得以下关系:
在这里插入图片描述
整理可得:
在这里插入图片描述
我们将物体区域内所有像素对应的深度排列成k维列向量z,k是物体区域像素总数,可以得到:
在这里插入图片描述
其中A的每一行只有两个非零元素1和-1,以其中一组方程组为例,上式的构造为:
在这里插入图片描述
求解这个稀疏线性方程组,便可以得到物体的深度,稀疏方程组的求解可以使用共轭梯度下降,Cholesky分解,LU分解等方法。

2.2 代码实现

这一节是基于上面所提到的github项目的,代码也是添加在其中

要在这个项目上基础上实现该功能,首先要对项目里demo.py中一段代码进行修改:

# Evaluate the estimate
N_gt = psutil.load_normalmap_from_npy(filename=GT_NORMAL_FILENAME)    # read out the ground truth surface normal
N_gt = np.reshape(N_gt, (rps.height*rps.width, 3))    # reshape as a normal array (p \times 3)
angular_err = psutil.evaluate_angular_error(N_gt, rps.N, rps.background_ind)    # compute angular error
print("Mean angular error [deg]: ", np.mean(angular_err[:]))
# 这里原代码有坑,他传入rps.N时,在函数里面转换了通道,因此如果用rps.N来恢复深度图,会出现错误,现在改为copy,就没问题了
psutil.disp_normalmap(normal=rps.N.copy(), height=rps.height, width=rps.width)
print("done.")

然后在demo.py的后面添加:

# 计算出深度图
rps.compute_depth()
rps.save_depthmap(filename="./est_depth")
psutil.disp_depthmap(depth=rps.depth, mask=rps.mask)

其中计算深度图的函数为

2.2.1 compute_depth()

我们前面提到过,numpixels的数量是mask里面非0像素数量,即物体的掩膜像素。

def compute_depth(self):"""计算出深度图原理参考: Mz = vM shape(2*numpixel, numpixel)z shape(numpixel, 1)v shape(2*numpixel, 1)1.http://pages.cs.wisc.edu/~csverma/CS766_09/Stereo/stereo.html2.https://www.zhihu.com/question/388447602/answer/1200616778"""im_h, im_w = self.mask.shapeN = np.reshape(self.N, (self.height, self.width, 3))# 得到掩膜图像非零值索引(即物体区域的索引)obj_h, obj_w = np.where(self.mask != 0)# 得到非零元素的数量no_pix = np.size(obj_h)# 构建一个矩阵 里面的元素值是掩膜图像索引的值full2obj = np.zeros((im_h, im_w))for idx in range(np.size(obj_h)):full2obj[obj_h[idx], obj_w[idx]] = idx# Mz = vM = scipy.sparse.lil_matrix((2*no_pix, no_pix))v = np.zeros((2*no_pix, 1))#--------- 填充M和v -----------## failed_rows = []for idx in range(no_pix):# 获取2D图像上的坐标h = obj_h[idx]w = obj_w[idx]# 获取表面法线n_x = N[h, w, 0]n_y = N[h, w, 1]n_z = N[h, w, 2]# z_(x+1, y) - z(x, y) = -nx / nzrow_idx = idx * 2if self.mask[h, w+1]:idx_horiz = full2obj[h, w+1]M[row_idx, idx] = -1M[row_idx, idx_horiz] = 1v[row_idx] = -n_x / n_zelif self.mask[h, w-1]:idx_horiz = full2obj[h, w-1]M[row_idx, idx_horiz] = -1M[row_idx, idx] = 1v[row_idx] = -n_x / n_z# else:#     failed_rows.append(row_idx)# z_(x, y+1) - z(x, y) = -ny / nzrow_idx = idx * 2 + 1if self.mask[h+1, w]:idx_vert = full2obj[h+1, w]M[row_idx, idx] = 1M[row_idx, idx_vert] = -1v[row_idx] = -n_y / n_zelif self.mask[h-1, w]:idx_vert = full2obj[h-1, w]M[row_idx, idx_vert] = 1M[row_idx, idx] = -1v[row_idx] = -n_y / n_z# else:#     failed_rows.append(row_idx)# # 将全零的行删除 对于稀疏矩阵M,要先将其恢复成稠密矩阵进行行删除再转为稀疏矩阵# M = M.todense()# M = np.delete(M, failed_rows, 0)# M = scipy.sparse.lil_matrix(M)# v = np.delete(v, failed_rows, 0)# 求解线性方程组 Mz = v  <<-->> M.T M z= M.T vMtM = M.T @ MMtv = M.T @ vz = scipy.sparse.linalg.spsolve(MtM, Mtv)std_z = np.std(z, ddof=1)mean_z = np.mean(z)z_zscore = (z - mean_z) / std_z# 因奇异值造成的异常outlier_ind = np.abs(z_zscore) > 10z_min = np.min(z[~outlier_ind])z_max = np.max(z[~outlier_ind])# 将z填充回正常的2D形状Z = self.mask.astype('float')for idx in range(no_pix):# 2D图像中的位置h = obj_h[idx]w = obj_w[idx]Z[h, w] = (z[idx] - z_min) / (z_max - z_min) * 255self.depth = Z

2.2.2 辅助函数

保存深度图:

def save_depthmap(self, filename=None):"""将深度图保存为npy格式:param filename: filename of a depth map:retur: None"""psutil.save_depthmap_as_npy(filename=filename, depth=self.depth)
def save_depthmap_as_npy(filename=None, depth=None):"""将深度图保存为npy:param filename: filename of the depth array:param normal: surface depth array:return: None"""if filename is None:raise ValueError("filename is None")np.save(filename, depth)

显示深度图

def disp_depthmap(depth=None, mask=None, delay=0, name=None):"""显示深度图:param depth: array of surface depth :param delay: duration (ms) for visualizing normal map. 0 for displaying infinitely until a key is pressed.:param name: display name:return: None"""if depth is None:raise ValueError("Surface depth `depth` is None")if mask is not None:depth = depth * maskdepth = np.uint8(depth)if name is None:name = 'depth map'cv2.imshow(name, depth)cv2.waitKey(delay)cv2.destroyAllWindows(name)cv2.waitKey(1)

生成的深度图:
在这里插入图片描述

3. 写入obj文件用MeshLab进行可视化

import scipy.io as sio
import cv2
import numpy as npdepth = np.load('est_depth.npy')
r, c = depth.shapef = open('bunny.obj', 'w')for i in range(r):for j in range(c):if depth[i, j] > 0:seq = 'v' + ' ' + str(float(i)) + ' ' + str(float(j)) + ' ' + str(depth[i, j]) + '\n'f.writelines(seq)f.close()

点云图:

在这里插入图片描述
我组建了一个光度立体技术的交流群,有兴趣的朋友可以一起来讨论一下!
在这里插入图片描述

这篇关于Photometric Stereo 光度立体三维重建(三)——由法向量恢复深度的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/787236

相关文章

SQL 注入攻击(SQL Injection)原理、利用方式与防御策略深度解析

《SQL注入攻击(SQLInjection)原理、利用方式与防御策略深度解析》本文将从SQL注入的基本原理、攻击方式、常见利用手法,到企业级防御方案进行全面讲解,以帮助开发者和安全人员更系统地理解... 目录一、前言二、SQL 注入攻击的基本概念三、SQL 注入常见类型分析1. 基于错误回显的注入(Erro

Mysql利用binlog日志恢复数据实战案例

《Mysql利用binlog日志恢复数据实战案例》在MySQL中使用二进制日志(binlog)恢复数据是一种常见的用于故障恢复或数据找回的方法,:本文主要介绍Mysql利用binlog日志恢复数据... 目录mysql binlog核心配置解析查看binlog日志核心配置项binlog核心配置说明查看当前所

Java枚举类型深度详解

《Java枚举类型深度详解》Java的枚举类型(enum)是一种强大的工具,它不仅可以让你的代码更简洁、可读,而且通过类型安全、常量集合、方法重写和接口实现等特性,使得枚举在很多场景下都非常有用,本文... 目录前言1. enum关键字的使用:定义枚举类型什么是枚举类型?如何定义枚举类型?使用枚举类型:2.

Java中Redisson 的原理深度解析

《Java中Redisson的原理深度解析》Redisson是一个高性能的Redis客户端,它通过将Redis数据结构映射为Java对象和分布式对象,实现了在Java应用中方便地使用Redis,本文... 目录前言一、核心设计理念二、核心架构与通信层1. 基于 Netty 的异步非阻塞通信2. 编解码器三、

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

Java 虚拟线程的创建与使用深度解析

《Java虚拟线程的创建与使用深度解析》虚拟线程是Java19中以预览特性形式引入,Java21起正式发布的轻量级线程,本文给大家介绍Java虚拟线程的创建与使用,感兴趣的朋友一起看看吧... 目录一、虚拟线程简介1.1 什么是虚拟线程?1.2 为什么需要虚拟线程?二、虚拟线程与平台线程对比代码对比示例:三

Python函数作用域与闭包举例深度解析

《Python函数作用域与闭包举例深度解析》Python函数的作用域规则和闭包是编程中的关键概念,它们决定了变量的访问和生命周期,:本文主要介绍Python函数作用域与闭包的相关资料,文中通过代码... 目录1. 基础作用域访问示例1:访问全局变量示例2:访问外层函数变量2. 闭包基础示例3:简单闭包示例4

深度解析Python中递归下降解析器的原理与实现

《深度解析Python中递归下降解析器的原理与实现》在编译器设计、配置文件处理和数据转换领域,递归下降解析器是最常用且最直观的解析技术,本文将详细介绍递归下降解析器的原理与实现,感兴趣的小伙伴可以跟随... 目录引言:解析器的核心价值一、递归下降解析器基础1.1 核心概念解析1.2 基本架构二、简单算术表达

深度解析Java @Serial 注解及常见错误案例

《深度解析Java@Serial注解及常见错误案例》Java14引入@Serial注解,用于编译时校验序列化成员,替代传统方式解决运行时错误,适用于Serializable类的方法/字段,需注意签... 目录Java @Serial 注解深度解析1. 注解本质2. 核心作用(1) 主要用途(2) 适用位置3

Java MCP 的鉴权深度解析

《JavaMCP的鉴权深度解析》文章介绍JavaMCP鉴权的实现方式,指出客户端可通过queryString、header或env传递鉴权信息,服务器端支持工具单独鉴权、过滤器集中鉴权及启动时鉴权... 目录一、MCP Client 侧(负责传递,比较简单)(1)常见的 mcpServers json 配置