2024全国大学生数据统计与分析竞赛B题【电信银行卡诈骗的数据分析】思路详解

本文主要是介绍2024全国大学生数据统计与分析竞赛B题【电信银行卡诈骗的数据分析】思路详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

电信诈骗是指通过电话、网络和短信方式,编造虚假信息,设置骗局,对受害人实施远程、非接触式诈骗,诱使受害人打款或转账的犯罪行为,通常以冒充他人及仿冒、伪造各种合法外衣和形式的方式达到欺骗的目的,如冒充公检法、商家公司厂家、诈骗。国家机关工作人员、银行工作人员等各类机构工作人员,伪造和冒充招工、婚恋、贷款、中奖、手机定位和招嫖等形式进行。近年来,在党和国家的领导下,公安部门聚焦人民群众深恶痛绝的电信网络诈骗,全面加强“四专两合力”建设,组织全国的公安机关深入推进打防管控各项工作,有效遏制了案件快速上升势头,有力维护了人民群众合法权益。
当前,电信网络诈骗犯罪形势依然严峻,刷单返利、虚假网络投资理财、虚假网络贷款、冒充电商物流客服、冒充公检法、虚假征信等 10 种常见诈骗类型发案占比近 80%,其中刷单返利类诈骗发案率最高,占发案的三分之一左右,虚假网络投资理财类诈骗造成损失的金额最大,占造成损失金额的三分之一左右。附件中提供了 100 万条使用电信银行卡交易的相关数据。
请你们团队使用附件中的相关数据,进行数据统计与分析,回答下列问题:
问题一:请绘制附件中“有无发生电信银行卡诈骗”比例的扇形图,并绘制发生电信银行卡诈骗的案例中,“线上”和“线下”发生电信诈骗数量的柱状图。

精力有限,以下只是简略的图文版初步思路,更详细的视频版完整讲解请移步:

2024全国大学生数据统计与分析竞赛选题建议及详细思路!_哔哩哔哩_bilibili

问题一:

1. 绘制“有无发生电信银行卡诈骗”比例的扇形图

步骤

§ 读取数据集,提取“Fraud”列。

§ 计算“Fraud”列中1和0的比例。

§ 使用饼图绘制诈骗比例。

代码编写:

完整思路讲解:

数模陪跑:2024全国数据统计与分析竞赛更新汇总贴1 赞同 · 0 评论文章

2. 绘制“线上”和“线下”发生电信诈骗数量的柱状图

步骤

§ 筛选出Fraud列为1的数据,分别统计Online列中1和0的数量。

§ 使用柱状图绘制线上和线下的诈骗数量。

代码编写:

问题二:请通过数据分析发生电信诈骗的案例中,“是否使用银行卡在设备上进行转账交易”和“是否使用银行卡的 pin 号码进行转账交易”的指标,判断哪种情况更容易发生电信诈骗?使用银行卡的pin 号码是否可以减少被骗概率?
问题三:请分析所有发生电信诈骗的案例中,哪些指标与是否发生电信诈骗有较强的相关性?“银行卡转账交易是否发生在同一银行”和“是否是线上的银行卡转账交易”是否与电信银行卡诈骗有显著的关联性?

问题二:

1. 分析“是否使用银行卡在设备上进行转账交易”和“是否使用银行卡的pin号码进行转账交易”与电信诈骗的关联性

步骤

§ 提取数据中Card和Pin列,结合Fraud列,统计不同情况下的诈骗比例。

§ 比较两种情况下的诈骗比例,判断哪种情况更容易发生电信诈骗。

问题三:

1. 分析哪些指标与是否发生电信诈骗有较强的相关性

步骤

§ 计算所有指标与Fraud列之间的相关系数。

§ 选择相关系数较大的指标进行分析。

2. 分析“银行卡转账交易是否发生在同一银行”和“是否是线上的银行卡转账交易”与电信诈骗的关联性

步骤

§ 分别计算Repeat和Online与Fraud的相关性。

代码编写:

问题四:请分析附件中所有的指标数据,选取合适的指标,建立“电信银行卡诈骗的预测模型”,并选取合适的训练集和测试集,计算预测模型的准确率。为了降低电信诈骗的概率,保护人们的财产安全,请基于你们团队数据分析的结果,分别给公安部门、银行和市民们提出你们的建议。

问题四:

1. 建立“电信银行卡诈骗的预测模型”

步骤

§ 数据预处理:处理缺失值、标准化数据等。

§ 特征选择:选择相关性较高的特征。

§ 划分训练集和测试集。

§ 选择模型:如逻辑回归、决策树等。

§ 训练模型并评估准确率。

OK,上述思路的文档领取、视频讲解以及后续的完整成品论文预定请点击我的下方个人卡片查看↓:

这篇关于2024全国大学生数据统计与分析竞赛B题【电信银行卡诈骗的数据分析】思路详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1044047

相关文章

SQL BETWEEN 语句的基本用法详解

《SQLBETWEEN语句的基本用法详解》SQLBETWEEN语句是一个用于在SQL查询中指定查询条件的重要工具,它允许用户指定一个范围,用于筛选符合特定条件的记录,本文将详细介绍BETWEEN语... 目录概述BETWEEN 语句的基本用法BETWEEN 语句的示例示例 1:查询年龄在 20 到 30 岁

CSS place-items: center解析与用法详解

《CSSplace-items:center解析与用法详解》place-items:center;是一个强大的CSS简写属性,用于同时控制网格(Grid)和弹性盒(Flexbox)... place-items: center; 是一个强大的 css 简写属性,用于同时控制 网格(Grid) 和 弹性盒(F

spring中的ImportSelector接口示例详解

《spring中的ImportSelector接口示例详解》Spring的ImportSelector接口用于动态选择配置类,实现条件化和模块化配置,关键方法selectImports根据注解信息返回... 目录一、核心作用二、关键方法三、扩展功能四、使用示例五、工作原理六、应用场景七、自定义实现Impor

一文深入详解Python的secrets模块

《一文深入详解Python的secrets模块》在构建涉及用户身份认证、权限管理、加密通信等系统时,开发者最不能忽视的一个问题就是“安全性”,Python在3.6版本中引入了专门面向安全用途的secr... 目录引言一、背景与动机:为什么需要 secrets 模块?二、secrets 模块的核心功能1. 基

一文详解MySQL如何设置自动备份任务

《一文详解MySQL如何设置自动备份任务》设置自动备份任务可以确保你的数据库定期备份,防止数据丢失,下面我们就来详细介绍一下如何使用Bash脚本和Cron任务在Linux系统上设置MySQL数据库的自... 目录1. 编写备份脚本1.1 创建并编辑备份脚本1.2 给予脚本执行权限2. 设置 Cron 任务2

一文详解如何在idea中快速搭建一个Spring Boot项目

《一文详解如何在idea中快速搭建一个SpringBoot项目》IntelliJIDEA作为Java开发者的‌首选IDE‌,深度集成SpringBoot支持,可一键生成项目骨架、智能配置依赖,这篇文... 目录前言1、创建项目名称2、勾选需要的依赖3、在setting中检查maven4、编写数据源5、开启热

SQL Server修改数据库名及物理数据文件名操作步骤

《SQLServer修改数据库名及物理数据文件名操作步骤》在SQLServer中重命名数据库是一个常见的操作,但需要确保用户具有足够的权限来执行此操作,:本文主要介绍SQLServer修改数据... 目录一、背景介绍二、操作步骤2.1 设置为单用户模式(断开连接)2.2 修改数据库名称2.3 查找逻辑文件名

Python常用命令提示符使用方法详解

《Python常用命令提示符使用方法详解》在学习python的过程中,我们需要用到命令提示符(CMD)进行环境的配置,:本文主要介绍Python常用命令提示符使用方法的相关资料,文中通过代码介绍的... 目录一、python环境基础命令【Windows】1、检查Python是否安装2、 查看Python的安

HTML5 搜索框Search Box详解

《HTML5搜索框SearchBox详解》HTML5的搜索框是一个强大的工具,能够有效提升用户体验,通过结合自动补全功能和适当的样式,可以创建出既美观又实用的搜索界面,这篇文章给大家介绍HTML5... html5 搜索框(Search Box)详解搜索框是一个用于输入查询内容的控件,通常用于网站或应用程

Python中使用uv创建环境及原理举例详解

《Python中使用uv创建环境及原理举例详解》uv是Astral团队开发的高性能Python工具,整合包管理、虚拟环境、Python版本控制等功能,:本文主要介绍Python中使用uv创建环境及... 目录一、uv工具简介核心特点:二、安装uv1. 通过pip安装2. 通过脚本安装验证安装:配置镜像源(可