MIT 更新最大自然灾害图像数据集,囊括 19 种灾害事件

2024-04-13 21:58

本文主要是介绍MIT 更新最大自然灾害图像数据集,囊括 19 种灾害事件,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

来源:HyperAI超神经

本文约2600字,建议阅读9分钟

本文为你分享迄今为止规模最大、质量最高的自然灾害卫星图像数据集。

标签:自然灾害 数据集

[ 摘要 ]麻省理工学院在最近 ECCV 2020 上提交的一篇论文中,发布了一套自然灾害图像数据集。这是迄今为止规模最大、质量最高的自然灾害卫星图像数据集。

2020 年,多灾多难的一年。年初爆发的疫情,夏天南方的洪灾,近期美国加州的野火……

洪灾、山火、地震之类的自然灾害,总是威胁着人们的生命财产安全。而在无法避免其发生的情况下,如果能够及时、迅速地发现一些细微的变化,就能更好地制定相应救援方案,更合理地进行资源配置,同时也有助于进行相关新闻的报道。

因此,麻省理工学院的工程学硕士生 Ethan Weber 和合作者 Hassan Kan,在最新论文《Building Disaster Damage Assessment in Satellite Imagery with Multi-Temporal Fusion》(《具有多时相融合的卫星影像中的建筑物灾害破坏评估》)中提出了一个深度学习模型,能够对受损区域的卫星图像进行更快、更精准的评估,从而为急救人员争取更多的时间、最大程度地减少损失。

该论文在近期 CV 顶会 ECCV 2020 上发表

论文地址:https://arxiv.org/pdf/2004.05525.pdf

与此同时,他们还发布了一个最新的用于损坏评估的卫星图像数据集,让图像事件检测的相关研究更进一步,研究人员能实现更精确的定位和量化损失。

用 AI 与时间赛跑:加速灾情评估

对于自然灾害,现场应急小组减少反应时间,迅速响应、采取行动,对于减少损失和挽救生命至关重要。此外,为了更好地在受灾地区部署资源,应急人员必须了解损失的确切位置和严重性,这些同样重要。

目前,应急人员通常通过人力观察卫星图像的方法,来评估灾害损坏程度,但评估过程可能要花费数小时之久,这对于抢救工作极为不利。

人员观察分析卫星图像耗时耗力

是目前自然灾害评估工作中的一个瓶颈

Ethan Weber 的这项研究贡献在于,创建自动分析图像的工具,减少图像分析时间,赢得与时间的赛跑。

另外,其研究通过共享权值的 CNN(卷积神经网络),独立地提供灾前和灾后图像,可以获得更好的性能。

他们还提出了一种新的计算机视觉模型,该模型能够检测在 Twitter 和 Flickr 等社交媒体平台上发布的图片中的事件。

论文中提出的建筑损坏预测、评估模型架构

标记 19 种自然灾害的 22068 张图像

除了提出新模型外,该研究团队还重磅发布了一个新的事件数据集:xBD 数据集。

该数据集包含 22068 张图像,标记有 19 种不同的事件,包括地震,洪水,野火、火山爆发和车祸等。这些图像包括了灾前、灾后图像,图像可用于构建定位和损伤评估这两项任务。

飓风灾前图像(左图)与灾后图像(右图)

据介绍,xBD 数据集是迄今为止第一个建筑破坏评估数据集,是带注释的高分辨率卫星图像中规模最大、质量最高的公共数据集之一。其基本信息如下:

xBD Dataset

发布机构:MIT

包含数量:22068 张图像

数据格式:png

数据大小:31.2GB

更新时间:2020 年 8 月

下载地址:https://hyper.ai/datasets/13272

这些图像分辨率为 1024×1024,其中每个建筑物都有标识符,并在灾前灾后图片中保持一致。

但研究者发现建筑物的分辨率往往太小,模型无法准确绘制建筑物边界。为此,他们在 4 张 512×512 的图像上训练和运行模型,形成左上角、右上角、左下角和右下角象限。

根据这些灾前和灾后数据,损伤评估可以被定义为单时间和多时间任务。在单时间设置中,只有灾后图像被输入模型,该模型必须预测每个像素的损伤水平。在多时间背景下,灾前灾后图像都被输入到模型中,该模型必须在后图像上预测损伤程度。

团队综合多方资料,制定的损坏评估量表

数据集从何而来?

团队表示,这套新数据集旨在填补该领域的空白。现有数据集的图像数量和事件类别的多样性都受到限制。

作者还解释了如何创建数据集、如何创建模型以检测图像中的事件,以及如何过滤嘈杂的社交媒体数据中的事件。

他们的其中一项工作是,过滤了 4000 万张 Flickr 图片,来寻找灾害事件。另外一些工作则是可对地震,洪水和其他自然灾害期间,发布在 Twitter 上的图像进行过滤。

比如,该团队将与自然灾害相关的推文过滤为特定事件,并通过将推文频率与美国国家海洋和大气管理局(NOAA)提供的数据库相关联,来验证这一过程。

Ethan Weber 说:“我对这个数据集能够进行进一步的研究以检测图像中的事件感到兴奋,它也非常有效地激发了人们对计算机视觉界的兴趣。”

他还表示,社交媒体和卫星图像都是有助于应急响应的数据形式。社交媒体提供实地观察,而卫星图像提供宏观的观察(expansive insights),例如确定哪些地区受野火影响最大。

每逢灾害发生,网友通常会在社交媒体上发布实地拍摄照片

正是意识到这种相互联系,Ethan Weber 和他的校友合作,在损害评估方面做出了卓越的成绩。

Ethan Weber 说:“现在我们有了数据,对定位和量化破坏很感兴趣。我们正在与应急组织合作,以保持专注并开展具有现实利益的研究。”

访问 https://hyper.ai/datasets/13127 或点击原文阅读,即可高速下载该数据集。

编辑:黄继彦

这篇关于MIT 更新最大自然灾害图像数据集,囊括 19 种灾害事件的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/901329

相关文章

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

C#使用iText获取PDF的trailer数据的代码示例

《C#使用iText获取PDF的trailer数据的代码示例》开发程序debug的时候,看到了PDF有个trailer数据,挺有意思,于是考虑用代码把它读出来,那么就用到我们常用的iText框架了,所... 目录引言iText 核心概念C# 代码示例步骤 1: 确保已安装 iText步骤 2: C# 代码程

Pandas处理缺失数据的方式汇总

《Pandas处理缺失数据的方式汇总》许多教程中的数据与现实世界中的数据有很大不同,现实世界中的数据很少是干净且同质的,本文我们将讨论处理缺失数据的一些常规注意事项,了解Pandas如何表示缺失数据,... 目录缺失数据约定的权衡Pandas 中的缺失数据None 作为哨兵值NaN:缺失的数值数据Panda

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

python库pydantic数据验证和设置管理库的用途

《python库pydantic数据验证和设置管理库的用途》pydantic是一个用于数据验证和设置管理的Python库,它主要利用Python类型注解来定义数据模型的结构和验证规则,本文给大家介绍p... 目录主要特点和用途:Field数值验证参数总结pydantic 是一个让你能够 confidentl

JAVA实现亿级千万级数据顺序导出的示例代码

《JAVA实现亿级千万级数据顺序导出的示例代码》本文主要介绍了JAVA实现亿级千万级数据顺序导出的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 前提:主要考虑控制内存占用空间,避免出现同时导出,导致主程序OOM问题。实现思路:A.启用线程池

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性

C#实现千万数据秒级导入的代码

《C#实现千万数据秒级导入的代码》在实际开发中excel导入很常见,现代社会中很容易遇到大数据处理业务,所以本文我就给大家分享一下千万数据秒级导入怎么实现,文中有详细的代码示例供大家参考,需要的朋友可... 目录前言一、数据存储二、处理逻辑优化前代码处理逻辑优化后的代码总结前言在实际开发中excel导入很

MyBatis-plus处理存储json数据过程

《MyBatis-plus处理存储json数据过程》文章介绍MyBatis-Plus3.4.21处理对象与集合的差异:对象可用内置Handler配合autoResultMap,集合需自定义处理器继承F... 目录1、如果是对象2、如果需要转换的是List集合总结对象和集合分两种情况处理,目前我用的MP的版本