电子科大周涛:半路出家的物理人怎么玩转大数据和AI | 上海市北·GMIS

本文主要是介绍电子科大周涛:半路出家的物理人怎么玩转大数据和AI | 上海市北·GMIS,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

大数据文摘出品

记者:时慧、毅航

 

上海市北·GMIS全球人工智能峰会在7月20日这天迎来了电子科技大学周涛教授。

 

本次讲座,周教授虽自谦理论物理出身、只是半路出家,但他用丰硕的项目成果和深入浅出的幽默语言,展示了大数据和AI如何推动治理和监管的革命。

 

基于街景的城市感知

 

如何利用街景来感知我们的城市,助力城市管理?

 

针对这个问题,周教授团队做了一个有趣的实验。实验选取2000张google街景图片,在网站上征集志愿者参与,判断两张照片里的街景哪个看起来更安全。

 

实验将采集的50多万个标注数据进行排序,再把得到的list给map到[0,1]的空间上,更高的分数表示更安全,从而得到训练集。训练好的系统可以对新的街景照片打分,判断安全程度。计算机打分的数据与真人打分进行比对,其有效性得到了验证。

 

接着实验进一步延伸,借助系统判断城市中的某一处街区在5至10年的发展变化,通过比较街区前后分数变化可以判断街区是否更美好了。由此,城市建设和管理水平得到有效评估。

 

 

通过对图片分析,还可以发现贫民窟。现实社会是,贫民窟的面积和范围比我们想象的还大,而且,政府也可以利用该系统评判自己花出去的改善民生的钱有没有用到实处,亦或只是赢得属下的马屁而沾沾自喜。

 

基于行为数据的金融监管

 

面对中小科技企业因没有抵押物而贷款难的问题,周教授团队开发了针对企业征信、信贷的产品——信易贷。

 

它的商业模型很简单,就是小微企业申请贷款,通过模型判断分数;之后政府贴息、并开放一些数据,比如税收,公积金等等;然后担保机构就进行担保征信,其他的资金方再来放钱。

 

信易贷的数据来源分四类。第一类是行为数据,举个例子,比如说一个企业可能会存在诉讼的问题,全中国有300多家地级别法院,周教授爬虫爬取法院历年来涉及诉讼的信息,通过查看企业是否有大量合同欺诈诉讼和仲裁案件,来评估借贷的风险性。

 

招聘信息也是企业行为数据的重要组成。作为一个互联网企业,可能多家招聘网站上都有招聘信息,招多少人,招什么职位,平均薪水如何,有没有公司的人已经在修改简历等等。这些数据虽然是公开的,但却很有用。如果推断出企业员工数在大幅度的萎缩,有人在离职,那么可以进一步评估出此企业信用等级较低。以上涉及到的是企业在发展过程中形成的大量行为数据,基于这些行为数据,实现针对中小科技企业的金融监管。

 

此外,企业投资关系网数据也值得探究,基于这些数据我们看出其中的异常关系。比如一个企业可能是A企业,全资控股B,B全资控制C,C全资控股D,D全资控股A。那A投了B之后,A再把其股东的股份转给B,如果有这样的关系他有什么样的好处呢?如果一个亿的现金正常给到B作为注册资本,B给C,然后C给D,但是D又给A,这样来回转,四家公司都有一个亿的注册资本,这样公司就可以申请很多资质,比如做集采,建筑,甚至做P2P的行业。如果有20个亿,在今天成立了一家公司,老百姓认为公司账户有20个亿,然后给公司投钱,受害的还是老百姓。这种公司可以在成都做一遍,然后又移到南京去,最后到上海。凡是有这种循环结构的,80%都有问题。

 

 

立体化的环境治理

 

周教授还用大数据人工智能的方法来做空天一体化的环境治理。

 

 

面对水域治理时有这样几个痛点问题:第一,无法对大水域做治理。比如四川省的水资源非常丰富,同时水资源丰富的地方往往经济落后。因为政府没有足够多的钱去安装足够多的监测站监测大水域。于是周教授想到利用遥感航拍,拍摄水域全景图,对水域管理情况进行打分。第二个问题是无法实时获得水域治理情况。当发现疑似问题,需要再用无人机确认一下。第三,当出现大型的污染事件,比如一个河道中有大量的污染物,此时要立刻判断要不要向上游借水把污染物冲到下游城市,那么污染处就安全了。再考虑借多少水,因为成本高,需要实时知道污染物的情况,甚至进行扩散动力学分析。

 

周教授的项目涉及成都22个区市县,它的难点主要是去云,而不是机器学习。“我们过去发现这些泥沙的污染,黑臭水体等等,这个主要是用遥感”,周教授做了一个设备,“这个设备只有3公斤重,可以放无人船上,造价只有一点点钱,但是卖给政府非常非常贵,这个本来可以更便宜一点。”设备的灵感来自于遥感,现在大概5-10秒钟一个读数。

该设备可以超过国控站的误差水平。做环保治理的时候,可以拿着手持设备,10秒钟就获得读数。如果有一个移动设备,比如三公里河或者一个大湖,只要一艘船来回反复的开,就能知道每个排污口排的东西,过多长时间对下面的影响有多大。这个是以前绝对做不到的。

 

大气也是类似的,相较于水体稍微难一点,周教授用的方法是用出租车在北京、成都跑,通过安装设备,来避免原来站点的监测精度不够,它可以用机器学习的方式进一步的提高精度。或者是去找到城市的绿地、水面、建筑、人口密度、车辆密度,找到这些变量和污染的关系。精度大概是一千米乘一千米,进而知道污染情况。

 

 

下面展示成都某地的示例,城市管理者可以借此管理工业企业,能知道如果关闭了某一家企业,或者把用工时间从平常移到周末,或者白天移到晚上,会带来什么影响,这样就避免环保部的一刀切,实现精确可控。

 

在最后,周教授感慨道,以前讲监管,讲治理,本质上是一个人的行为,人的行为会带来很多误差,有的误差是中国的政治体制本身带来的,所以有一些话大家不敢说,不好说,老百姓的问题不好向上面反应,或者花了很多钱没有起到效果。但是现在随着一些技术突破,我们完全可以在50公分,甚至30公分的精度用遥感看城市,所以城市的发展企业行为,人的行为记录了大量的数据,使得观察和判断越来越准确化。所以周教授认为治理和监管将会有四方面特别大的变化,会变得自动化,规模化,定量化和客观化。

 

这篇关于电子科大周涛:半路出家的物理人怎么玩转大数据和AI | 上海市北·GMIS的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/177558

相关文章

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性

C#实现千万数据秒级导入的代码

《C#实现千万数据秒级导入的代码》在实际开发中excel导入很常见,现代社会中很容易遇到大数据处理业务,所以本文我就给大家分享一下千万数据秒级导入怎么实现,文中有详细的代码示例供大家参考,需要的朋友可... 目录前言一、数据存储二、处理逻辑优化前代码处理逻辑优化后的代码总结前言在实际开发中excel导入很

MyBatis-plus处理存储json数据过程

《MyBatis-plus处理存储json数据过程》文章介绍MyBatis-Plus3.4.21处理对象与集合的差异:对象可用内置Handler配合autoResultMap,集合需自定义处理器继承F... 目录1、如果是对象2、如果需要转换的是List集合总结对象和集合分两种情况处理,目前我用的MP的版本

GSON框架下将百度天气JSON数据转JavaBean

《GSON框架下将百度天气JSON数据转JavaBean》这篇文章主要为大家详细介绍了如何在GSON框架下实现将百度天气JSON数据转JavaBean,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录前言一、百度天气jsON1、请求参数2、返回参数3、属性映射二、GSON属性映射实战1、类对象映

C# LiteDB处理时间序列数据的高性能解决方案

《C#LiteDB处理时间序列数据的高性能解决方案》LiteDB作为.NET生态下的轻量级嵌入式NoSQL数据库,一直是时间序列处理的优选方案,本文将为大家大家简单介绍一下LiteDB处理时间序列数... 目录为什么选择LiteDB处理时间序列数据第一章:LiteDB时间序列数据模型设计1.1 核心设计原则

Java+AI驱动实现PDF文件数据提取与解析

《Java+AI驱动实现PDF文件数据提取与解析》本文将和大家分享一套基于AI的体检报告智能评估方案,详细介绍从PDF上传、内容提取到AI分析、数据存储的全流程自动化实现方法,感兴趣的可以了解下... 目录一、核心流程:从上传到评估的完整链路二、第一步:解析 PDF,提取体检报告内容1. 引入依赖2. 封装

MySQL中查询和展示LONGBLOB类型数据的技巧总结

《MySQL中查询和展示LONGBLOB类型数据的技巧总结》在MySQL中LONGBLOB是一种二进制大对象(BLOB)数据类型,用于存储大量的二进制数据,:本文主要介绍MySQL中查询和展示LO... 目录前言1. 查询 LONGBLOB 数据的大小2. 查询并展示 LONGBLOB 数据2.1 转换为十

使用SpringBoot+InfluxDB实现高效数据存储与查询

《使用SpringBoot+InfluxDB实现高效数据存储与查询》InfluxDB是一个开源的时间序列数据库,特别适合处理带有时间戳的监控数据、指标数据等,下面详细介绍如何在SpringBoot项目... 目录1、项目介绍2、 InfluxDB 介绍3、Spring Boot 配置 InfluxDB4、I

Java整合Protocol Buffers实现高效数据序列化实践

《Java整合ProtocolBuffers实现高效数据序列化实践》ProtocolBuffers是Google开发的一种语言中立、平台中立、可扩展的结构化数据序列化机制,类似于XML但更小、更快... 目录一、Protocol Buffers简介1.1 什么是Protocol Buffers1.2 Pro