Sora走红,浅谈GIS在AI方面的应用

2024-02-20 19:12

本文主要是介绍Sora走红,浅谈GIS在AI方面的应用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. 龙年第一个爆火的,竟然是AI?

2024年2月16日,就在我们忙着过春节时,大洋彼岸,OpenAI又悄无声息地放出了“王炸”:颠覆人类对AI视频认知的文生视频大模型——Sora。

虽然未经提前预热,但Sora很快成为科技圈的重磅热点,引发360创始人周鸿祎等人下场讨论。

周鸿祎认为:Sora的诞生意味着AGI(通用人工智能)实现可能从10年缩短至一两年!

各社交媒体上,引发了大量关于sora的讨论:

短短数日,在抖音上,关于sora的讨论量也达到1.7亿:

 

图片

2. Sora是什么?能做什么?

Sora,是指OpenAl在2024年2月16日发布的首个文本生成视频模型。Sora可以根据用户的提示,生成长达一分钟的视频,同时保持较高的视觉质量。

从2022年11月Chat GPT的横空出世,到2024年初Sora的爆火,再到国产AI软件层出不穷,AI技术正在以惊人的速度发展。

暂时抛开“版权”“隐私”和“伦理”问题,很明显,无论是否准备好,我们正在迅速迈向一个由AI驱动的世界。

AI的应用领域十分广泛,我们回归到熟悉的领域:地理信息系统。

那么,AI和GIS能擦出什么样的火花?AI能带动GIS发展吗?还是说GIS能助力AI,成为AI发展的王牌助手?

在讨论这个问题之前,我们先简单了解一下AI是什么?

 

3. 什么是AI?

人工智能(Artificial Intelligence,简称AI)是一门研究如何使计算机系统具备智能行为的学科。其目标是使机器能够执行需要智能的任务,模拟甚至超越人类的某些智能能力。人工智能涉及多个领域,包括机器学习、深度学习、自然语言处理、计算机视觉、专家系统等。

图片

AI的发展历程

图片

AI的市场规模

4. 什么是计算机视觉?

由于AI应用范围比较广泛,这里重点介绍计算机视觉方面,跟GIS联系较为紧密。

计算机视觉是AI领域的一个重要分支,致力于使计算机系统具备对图像和视频进行理解和解释的能力。

它涉及使用计算机算法和模型,使计算机能够模拟人类视觉系统的功能,从而实现对图像和视频的感知、分析和理解。

常见的计算机视觉任务,主要主要有四类:

图像分类:图像分类是将图像分为不同类别的任务,通过训练模型使计算机能够自动识别图像中的对象。

物体识别:物体识别涉及识别图像中的整个物体,并理解其在场景中的位置和角度。

目标检测目标检测是识别图像中特定物体或目标的过程,可以用于自动驾驶、安防监控等应用。

三维重建三维重建涉及从二维图像中还原出三维场景的空间结构,常用于计算机辅助设计和虚拟现实。

5. AI在GIS软件方面的应用

以mapgis为例,下面是AI在GIS方面应用的一个整体框架:

这个框架呢主要就是分了四层,第一底层是数据层,主要就是我们MapGIS SDE和MapGIS的data store;第二层是一个框架层,主要就是这些个人工智能的框架,能够对这些算法进行支持;主要我们使用的最多的应该是TensorFlow和PyTorch。

第三个就是针对不同任务,进行一个细致划分的一个功能层。主要包括模型库、流程工具和功能库,这个模型库里边,主要就是我们已经封装好的一些算法,比如说什么常见的一些CNN RNN,还有这个对抗生成网络GAN,还有这个长短长短期记忆网络,或者是YOLO。

这些网络流程工具主要用来处理视觉上面的一些数据。因为我们视觉方面的数据大部分都是一些遥感图像,所以就需要涉及到数据准备一些工作。

这些AI工具最擅长的是应用层主要就是什么地理实体提取和变化检测之类的一些数据处理方面,就是通过data store进行一个管理,主要管理的就是影像和矢量图层。

图片

人工智能数据处理框架图

6. 这些工具主要有哪些功能呢?

标准数据增强:

主要包括线性拉伸、随机旋转、数据归一化等手段进行标准的数据增理

图片

图像裁剪增强:

RandErasing方法,随机生成掩膜来增加模型对复杂地物的适应性

图片

图像混叠类增强:

可增强模型的抗干扰能力

图片

7. 常见的AI算法

说到底层技术,不得不谈到算法,AI的核心还是模型和算法。GIS方面应用较多的AI算法有以下几类,这里仅距离说明。

1、影像分类:

影像分类是指对影像的类别进行定性地分析,在多幅相似或不同的遥感影像中可以精确地分辨出遥感影像的类别(或影像所描述的场景),针对大范围影像分类结果返回一个大小均匀的矢量网格,每个网格带有其对应位置影像的类别标签:针对单张图片,影像分类结果返回的是图片的类别信息,总体来说影像分类是一种高于像元级别的粗粒度分类方法。

该方法不仅仅适用基于小范围遥感影像的语义分析对遥感影像数据进行分析和管理,还可以基于对图像的场景理解,对图像的类别做出评估。

自动化图像分类: 

图像分类网络通过学习大量标记好的图像数据,能够自动识别和分类图像中的内容。这使得大规模图像的分类工作可以高效自动完成,减轻了人工劳动负担。

提高图像识别准确性:

图像分类网络通过深度学习算法,能够学习图像中的复杂特征和模式,从而提高了图像识别的准确性。这对于各种应用场景,如医学影像、安防监控、自动驾驶等,具有重要意义。

推动深度学习发展:

图像分类网络是深度学习领域的代表性应用之一。其成功应用推动了深度学习技术的发展,为其他复杂任务的解决提供了经验和基础

2、语义分割

是计算机视觉领域中一种重要的图像分析任务,其目标是将图像中的每个像素分配到预定义的类别中,从而实现对图像的精细化理解。与目标检测不同,语义分割不仅关注物体的位置,还关注物体的边界和形状,使得每个像素都被赋予语义标签。

图片

U-Net(全卷积网络)是一种用于图像分割任务的深度学习架构,由德国图灵奖获得者Ronneberger等人于2015年提出。U-Net的设计灵感来源于生物医学图像分割的需求,尤其是医学图像中器官和病变的精确分割。

图片

U-net网络结构示意图

DeepLab是一系列用于语义分割任务的深度学习模型,由Google提出。这一系列模型以卷积神经网络为基础,通过引入深度可分离卷积和空洞卷积等技术,致力于解决图像分割中的细节捕捉和计算效率的问题。

图片

DeepLab v2模型示意图

其他的这里就不一一赘述。

需要更多详细介绍的同学,可以戳下面备注【人工智能与GIS】,领取详细视频讲解:

免费领取GIS开发相关学习资料

8. AI在GIS中的应用

图片

模型说明:

  • 适用功能:影像分析,二元分类和多元分类。

  • 适用场景建筑物、道路等地物提取。

输入数据类型

  • 影像数据

算法特点:

  • 速度快、精度高、网络结构清晰

图片

结果说明:

通过对测试数据进行预测后,计算出了精度(Accuracy)、召回率(Recall)和F1指标(F1 score)我们可以看出,加入了注意力机制,模型的精度极大提升。

9. AI未来的发展方向之:语言大模型(LLM)

图片

最后,谈一下红极一时的chatgpt对人工智能发展的一些贡献和特点。

Chatgpt主要贡献:

  • 强化学习中引入人类反馈的学习方法

  • 高质量微调数据指令集的重要性

核心能力:生成、总结、提取、分类、检索和改写

图片

10. ChatGPT的主要技术:

Transformer架构: ChatGPT基于Transformer架构。Transformer是一种使用自注意力机制(Self-Attention Mechanism)的深度学习模型,适用于处理序列数据,如自然语言。自监督预训练: ChatGPT采用了自监督预训练的方法。这意味着在模型在特定任务上进行微调之前,它首先在大规模的语料库上进行了预训练。GPT模型通过学习预测序列中缺失的一部分内容,从而学到了语言的结构和上下文理解。

大规模参数: GPT-3是一个参数规模庞大的模型,具有1750亿个参数,这使得家在各种任务上表现出色,包括聊天式对话。

微调: ChatGPT可能会在特定的任务上进行微调,以适应更具体的应用。微调过程通常涉及在特定任务的有标签数据上对模型进行额外的训练。

上下文处理: GPT模型使用自注意力机制,能够有效地处理长文本序列,这对于处理上下文丰富的对话非常有用。

12. GIS+GIS=GeoGPT:

将语言大模型和GIS工具集结合在一起,降低非专业用户解决地理空间任务的门槛。主要应用在:间数据抓取、空间查询、设施选址和制图等方面。

图片

简单概括一下上述GIS tool pool的流程:

首先用户提需求,通过AI模型的反复分析,分解为各个指令,再从GIS的相关应用词里面抽取一部分符合任务描述要求的工具,组成一个流程图,最后输出的一个结果。

再看下面这个图:

图片

这个图就是一个学校的选址的流程。

要求1:我想要离公园近一点;

要求2:我还想要离工厂远一点;

这里就涉及到GIS中的缓冲区的概念。

右边的图中可以看到公园和那个公交站的一个交叉区域,通过离工厂的一个半径,最后筛选出来,适合选址的一个区域。

这样做的主要优势在于,能够就是降低非专业用户的门槛——非GIS专业的认,也能够通关AI模型,解决地理空间任务和问题。

关于GIS和AI的内容,我们暂时介绍到这里。

想查看完整版视频讲解,请戳下方按钮备注【人工智能与GIS】即可获取。

免费领取GIS开发相关学习资料icon-default.png?t=N7T8https://www.wjx.cn/vm/eqvTtp6.aspx# 

 

Sora大模型为数字经济创新发展打开了一扇大门,形成了引领人工智能产业发展的一个新的通道,这不仅带来很大启发,更大地带来了产业的冲击。”杭州新春第一会上市委书记刘捷这样说到:“杭州数字经济高速发展,在这一轮人工智能发展新机遇上,唯有加快改革、加快发展,适应和抢抓新机遇。”

在新型城镇化建设深入推进、“数字中国”战略持续实施、“双碳”目标加快落实、数字技术与实体经济深度融合、数字化转型全面提速的背景下,智慧城市建设迎来新机遇。

数字化经济不断发展,数字化人才的需求也逐渐浮出水面!

成为数字化人才的第一步,学习一项专业技能!

在新中地GIS开发特训营,各位学员通过渐进式的GIS开发技能提升、多层次的职场能力培养、全方位就业服务体系。他们不仅具备了GIS开发能力和丰富的项目经验,也具备了职场必需的表达沟通和总结汇报能力,在职业发展中极具竞争力!

7天免费试听GIS开发课程

☑0基础可学   ☑助力考研   ☑优选赛道

扫码填表即可免费获取7天课程

附送送海量GIS资料

2024GIS开发特训营免费体验券

这篇关于Sora走红,浅谈GIS在AI方面的应用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/729255

相关文章

CSS中的Static、Relative、Absolute、Fixed、Sticky的应用与详细对比

《CSS中的Static、Relative、Absolute、Fixed、Sticky的应用与详细对比》CSS中的position属性用于控制元素的定位方式,不同的定位方式会影响元素在页面中的布... css 中的 position 属性用于控制元素的定位方式,不同的定位方式会影响元素在页面中的布局和层叠关

SpringBoot3应用中集成和使用Spring Retry的实践记录

《SpringBoot3应用中集成和使用SpringRetry的实践记录》SpringRetry为SpringBoot3提供重试机制,支持注解和编程式两种方式,可配置重试策略与监听器,适用于临时性故... 目录1. 简介2. 环境准备3. 使用方式3.1 注解方式 基础使用自定义重试策略失败恢复机制注意事项

Python使用Tkinter打造一个完整的桌面应用

《Python使用Tkinter打造一个完整的桌面应用》在Python生态中,Tkinter就像一把瑞士军刀,它没有花哨的特效,却能快速搭建出实用的图形界面,作为Python自带的标准库,无需安装即可... 目录一、界面搭建:像搭积木一样组合控件二、菜单系统:给应用装上“控制中枢”三、事件驱动:让界面“活”

如何确定哪些软件是Mac系统自带的? Mac系统内置应用查看技巧

《如何确定哪些软件是Mac系统自带的?Mac系统内置应用查看技巧》如何确定哪些软件是Mac系统自带的?mac系统中有很多自带的应用,想要看看哪些是系统自带,该怎么查看呢?下面我们就来看看Mac系统内... 在MAC电脑上,可以使用以下方法来确定哪些软件是系统自带的:1.应用程序文件夹打开应用程序文件夹

Python Flask 库及应用场景

《PythonFlask库及应用场景》Flask是Python生态中​轻量级且高度灵活的Web开发框架,基于WerkzeugWSGI工具库和Jinja2模板引擎构建,下面给大家介绍PythonFl... 目录一、Flask 库简介二、核心组件与架构三、常用函数与核心操作 ​1. 基础应用搭建​2. 路由与参

Spring Boot中的YML配置列表及应用小结

《SpringBoot中的YML配置列表及应用小结》在SpringBoot中使用YAML进行列表的配置不仅简洁明了,还能提高代码的可读性和可维护性,:本文主要介绍SpringBoot中的YML配... 目录YAML列表的基础语法在Spring Boot中的应用从YAML读取列表列表中的复杂对象其他注意事项总

电脑系统Hosts文件原理和应用分享

《电脑系统Hosts文件原理和应用分享》Hosts是一个没有扩展名的系统文件,当用户在浏览器中输入一个需要登录的网址时,系统会首先自动从Hosts文件中寻找对应的IP地址,一旦找到,系统会立即打开对应... Hosts是一个没有扩展名的系统文件,可以用记事本等工具打开,其作用就是将一些常用的网址域名与其对应

CSS 样式表的四种应用方式及css注释的应用小结

《CSS样式表的四种应用方式及css注释的应用小结》:本文主要介绍了CSS样式表的四种应用方式及css注释的应用小结,本文通过实例代码给大家介绍的非常详细,详细内容请阅读本文,希望能对你有所帮助... 一、外部 css(推荐方式)定义:将 CSS 代码保存为独立的 .css 文件,通过 <link> 标签

Spring AI 实现 STDIO和SSE MCP Server的过程详解

《SpringAI实现STDIO和SSEMCPServer的过程详解》STDIO方式是基于进程间通信,MCPClient和MCPServer运行在同一主机,主要用于本地集成、命令行工具等场景... 目录Spring AI 实现 STDIO和SSE MCP Server1.新建Spring Boot项目2.a

Python使用Reflex构建现代Web应用的完全指南

《Python使用Reflex构建现代Web应用的完全指南》这篇文章为大家深入介绍了Reflex框架的设计理念,技术特性,项目结构,核心API,实际开发流程以及与其他框架的对比和部署建议,感兴趣的小伙... 目录什么是 ReFlex?为什么选择 Reflex?安装与环境配置构建你的第一个应用核心概念解析组件