立体匹配网络中的domain adaptation问题:AdaStereo

2023-10-09 05:59

本文主要是介绍立体匹配网络中的domain adaptation问题:AdaStereo,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 概述
  • 损失函数

概述

  • 希望讨论的问题是什么?
    以PSMNet为例,其在Middlebury数据集上进行预训练得到的模型,在KITTI上的推理效果或许就不好。这篇文章就想聊聊怎么去处理不同场景下的模型的适应问题。又或者说,模型的泛化问题。

  • 参考论文及相关信息为:
    在这里插入图片描述
    是商汤2020年的工作。

  • 论文的效果怎么样?
    在这里插入图片描述

  • 能否简要概述是怎么解决的问题?
    假定现在有两个数据集,一个是合成数据集,数据量非常大,另一个是真实场景数据集,数据量相对小很多,文章认为这两个数据集之间的gap主要在于以下几个层面:

    1. input image

    1. “At the input image level, color and brightness are the obvious gaps.”
    2. 通过提出一个 non-adversarial progressive color transfer算法将输入的color space与target影像的场景进行对齐,这个过程通过网络训练完成。

    2. internal cost volume

    1. ‘…significant differences in distributions’
    2. 使用了cost normalization 层,用于配准cost distribution。主要使用了两个归一化操作:channel normalization以及pixel normalization

    3. output disparity

    1. ‘Moreover, geometries of the output disparity maps are inconsistent as well’
    2. self- supervised occlusion-aware reconstruction,

提出了AdaStereo,旨在构建一个标准的场景自适应网络,网络结构为:
在这里插入图片描述

已知:

  1. 作为source的大量合成数据集 ( I s t , I s r ) (I_s^t,I_s^r) (Ist,Isr)
  2. 合成数据集的真实视差 d s l ^ \hat{d_s^l} dsl^
  3. 作为target的少量真实数据集 ( I t l , I t r ) (I_t^l,I_t^r) (Itl,Itr)

希望的推理输出:

  1. 真实场景的视差 d t l d_t^l dtl

损失函数

整体的损失函数为:
L = L s m a i n + λ s o c c L s o c c + λ t a r L t a r + λ t o c c L t o c c + λ t s m L t s m L=L_{s}^{m a i n}+\lambda_{s}^{o c c} L_{s}^{o c c}+\lambda_{t}^{a r} L_{t}^{a r}+\lambda_{t}^{o c c} L_{t}^{o c c}+\lambda_{t}^{s m} L_{t}^{s m} L=Lsmain+λsoccLsocc+λtarLtar+λtoccLtocc+λtsmLtsm
其中的 λ \lambda λ为对应的loss weights。

损失函数中的五项具体为:

  1. source domain层面的视差回归loss:
    L s m a i n = S m o o t h L 1 ( d s l − d s l ^ ) L_s^{main} = Smooth_{L1}(d_s^l-\hat{d_s^l}) Lsmain=SmoothL1(dsldsl^)

  2. 在souce domain层面的occlusion mask训练损失,使用binary cross entropy loss:
    L s o c c = B C E ( O s l , O s l ^ ) L_s^{occ} = BCE(O_s^l,\hat{O_s^l}) Lsocc=BCE(Osl,Osl^)

  3. 在target domain层面,the occlusion-aware appearance reconstruction loss:
    L t a r = α 1 − S S I M ( I t l ⊙ ( 1 − O t l ) , I t l ‾ ⊙ ( 1 − O t l ) ) 2 + ( 1 − α ) ∥ I t l ⊙ ( 1 − O t l ) − I t l ‾ ⊙ ( 1 − O t l ) ∥ 1 \begin{aligned} L_{t}^{a r}=& \alpha \frac{1-S S I M\left(I_{t}^{l} \odot\left(1-O_{t}^{l}\right), \overline{I_{t}^{l}} \odot\left(1-O_{t}^{l}\right)\right)}{2} \\ &+(1-\alpha)\left\|I_{t}^{l} \odot\left(1-O_{t}^{l}\right)-\overline{I_{t}^{l}} \odot\left(1-O_{t}^{l}\right)\right\|_{1} \end{aligned} Ltar=α21SSIM(Itl(1Otl),Itl(1Otl))+(1α)Itl(1Otl)Itl(1Otl)1

    其中, ⊙ \odot 表示逐元素的乘法,SSIM表示simplified single scale SSIM项(3*3的block filter),以及 α \alpha α设置为0.85。

  4. 在target domain中,在occulusion mask上使用 L 1 L1 L1正则项:
    L t o c c = ∣ ∣ O t l ∣ ∣ 1 L_t^{occ}=||O_t^l||_1 Ltocc=Otl1

  5. 在target-domain上,使用edge-aware项作为target-domain中的视差平滑项,其中 ∂ \partial 表示gradient,
    L t s m = ∣ ∂ x d t l ∣ e − ∣ ∂ x I t l ∣ + ∣ ∂ y d t l ∣ e − ∣ ∂ y I t l ∣ L_{t}^{s m}=\left|\partial_{x} d_{t}^{l}\right| e^{-\left|\partial_{x} I_{t}^{l}\right|}+\left|\partial_{y} d_{t}^{l}\right| e^{-\left|\partial_{y} I_{t}^{l}\right|} Ltsm=xdtlexItl+ydtleyItl

这篇关于立体匹配网络中的domain adaptation问题:AdaStereo的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/170819

相关文章

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

解决RocketMQ的幂等性问题

《解决RocketMQ的幂等性问题》重复消费因调用链路长、消息发送超时或消费者故障导致,通过生产者消息查询、Redis缓存及消费者唯一主键可以确保幂等性,避免重复处理,本文主要介绍了解决RocketM... 目录造成重复消费的原因解决方法生产者端消费者端代码实现造成重复消费的原因当系统的调用链路比较长的时

深度解析Nginx日志分析与499状态码问题解决

《深度解析Nginx日志分析与499状态码问题解决》在Web服务器运维和性能优化过程中,Nginx日志是排查问题的重要依据,本文将围绕Nginx日志分析、499状态码的成因、排查方法及解决方案展开讨论... 目录前言1. Nginx日志基础1.1 Nginx日志存放位置1.2 Nginx日志格式2. 499

kkFileView启动报错:报错2003端口占用的问题及解决

《kkFileView启动报错:报错2003端口占用的问题及解决》kkFileView启动报错因office组件2003端口未关闭,解决:查杀占用端口的进程,终止Java进程,使用shutdown.s... 目录原因解决总结kkFileViewjavascript启动报错启动office组件失败,请检查of

SpringBoot 异常处理/自定义格式校验的问题实例详解

《SpringBoot异常处理/自定义格式校验的问题实例详解》文章探讨SpringBoot中自定义注解校验问题,区分参数级与类级约束触发的异常类型,建议通过@RestControllerAdvice... 目录1. 问题简要描述2. 异常触发1) 参数级别约束2) 类级别约束3. 异常处理1) 字段级别约束

Python错误AttributeError: 'NoneType' object has no attribute问题的彻底解决方法

《Python错误AttributeError:NoneTypeobjecthasnoattribute问题的彻底解决方法》在Python项目开发和调试过程中,经常会碰到这样一个异常信息... 目录问题背景与概述错误解读:AttributeError: 'NoneType' object has no at

Spring的RedisTemplate的json反序列泛型丢失问题解决

《Spring的RedisTemplate的json反序列泛型丢失问题解决》本文主要介绍了SpringRedisTemplate中使用JSON序列化时泛型信息丢失的问题及其提出三种解决方案,可以根据性... 目录背景解决方案方案一方案二方案三总结背景在使用RedisTemplate操作redis时我们针对

Kotlin Map映射转换问题小结

《KotlinMap映射转换问题小结》文章介绍了Kotlin集合转换的多种方法,包括map(一对一转换)、mapIndexed(带索引)、mapNotNull(过滤null)、mapKeys/map... 目录Kotlin 集合转换:map、mapIndexed、mapNotNull、mapKeys、map

nginx中端口无权限的问题解决

《nginx中端口无权限的问题解决》当Nginx日志报错bind()to80failed(13:Permissiondenied)时,这通常是由于权限不足导致Nginx无法绑定到80端口,下面就来... 目录一、问题原因分析二、解决方案1. 以 root 权限运行 Nginx(不推荐)2. 为 Nginx

解决1093 - You can‘t specify target table报错问题及原因分析

《解决1093-Youcan‘tspecifytargettable报错问题及原因分析》MySQL1093错误因UPDATE/DELETE语句的FROM子句直接引用目标表或嵌套子查询导致,... 目录报js错原因分析具体原因解决办法方法一:使用临时表方法二:使用JOIN方法三:使用EXISTS示例总结报错原