2024年美赛F题超详细思路

2024-02-03 01:28
文章标签 详细 2024 思路 美赛 题超

本文主要是介绍2024年美赛F题超详细思路,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Problem F: Reducing Illegal Wildlife Trade

美赛F题以非法野生动物贸易为背景进行命题,需要我们选择客户进行一系列的问题。本文正式解题前需要收集客户的数据以及数据预处理。对于客户的选择,这里考虑的点在于该客户需要能够对非法贸易交易产生影响。因此,本次基于这一点选择了国家为客户,收集了现在世界上253个国家的1000多项指标数据作为自变量。这也是跟大家免费分享的数据集中所提及的数据。

(注释:大家如果需要其他,数据集中没有的数据,欢迎大家留言,我们会尽力帮大家收集)

美赛分享数据

https://pan.baidu.com/s/17IX4yZKr_CadiOJIp7yLYQ
提取码:sxjm

对于选择因变量,即使用何种数据表示非法野生动物贸易,这里再第二波给大家收集的数据中为大家分享了各种美国野生动物、非法获取动物数据中有所展示。(该数据集还不完善,后续会继续补充)使用该数据中的部分指标作为因变量即可。 

刚才所有的工作可以理解为是指标的构建,我们需要构建去解决这个问题的大致框架,类似于之前助攻的华数杯、亚太,形成下面的框架体系。 

问题一、您的客户是谁?那个客户到底能做些什么呢?(换句话你的客户应该拥有实施你 提出的项目所需的权力、资源和兴趣。)

问题一,题设是客户是谁,其实问题一的本质就是让我们选择本次的客户主体并构建指标评价体系,根据指标评价体系收集数据。对于收集的数据集我们还需要进行数据清洗工作,即进行异常值、缺失值、数据降维等工作。

确定收集到的数据指标后,就是整理数据。建议大家可以绘制几张折线图(图一这种的)等,完成对收集到数据的描述,对于数据预处理,包括缺失值处理、异常值处理、数据降维等。异常值处理,首先判定数据分布方式,对于正态分布的数据利用3西格玛原则判定异常值;非正态分布的数据利用箱型图判定异常值。对于判定的异常值进行剔除处理,变为缺失值。

对缺失值,两部分既有数据收集本身所有的,还有就是异常值处理带来的异常值。这里比较建议大家选择线性插值(平均值插值、克里斯插值等都是可以的)。对于较高维度的数据,还可以选择就降维处理。

如果大家选择了7-10个指标,数量合适不需要进行降维。但是如果选择了超过十个指标,使用过多的指标分析问题会使得问题复杂化。对于过多的指标,我们需要进行降维处理。即使用KMO检验判定指标之间关系,通过检验使用线性降维:主成分分析等方法,未通过检验则应该使用T-SNE等非线性降维方法。

 

问题二、解释为什么您开发的项目适合这个客户。从已发表的文献和你自己的分析中,有哪些 研究支持你所提议的项目的选择?使用数据驱动的分析,你将如何说服你的客户,这是一个他们应该承担的项目?

问题二,有两部分其一,需要我们对选择的指标评价体系进行分析。其二,需要进行驱动分析说服客户。对于第一小问,我们可以使用一些文献支撑或文章报道进行验证即可。对于第二问,需要我们使用数据分析驱动,即我们可以使用原有数据直接进行预测,与我们5年项目进行比对分析,根据结果来说服客户即可。

对于预测模型的选择,我们可以在下图根据介绍进行选择。回归预测、灰色预测、时间序列、机器学习都是可以的。模型的选择大家只需要知道,只要大方向对即可。数模是没有绝对的对与错之分。对于问题二,使用数据驱动,个人认为可以使用有无五年项目的干预的预测结果进行会对即可。

对于该问题,应该就是小样本短期预测,大家可以根据使用范围选择合适的方法即可。

 

问题三、您的客户执行该项目还需要哪些额外的权力和资源?(记住要使用假设,但也要尽可 能地把你的工作建立在现实中。)

问题三,初步看来可以理解为是一个定性分析的问题,也可以理解为指标体系的扩建。即问我们还可以能加那些指标来表示额外的权力和资源。既可以用一定的文字进行描述分析;也可以根据一些文献支撑寻找一些其他的指标描述权利和资源。

问题四、如果这个项目得以实施,将会发生什么?换句话说,对非法野生动物贸易的可衡量的影响将是什么?你做了什么分析来确定这个问题?

问题四、问题实质在于需要我们确定影响非法野生动物贸易影响。即在问题三的基础上,进一步改进指标评价体系。利用新的指标评价体系预测实行五年项目后会出现什么样的结果。即需要我们利用五年项目进行预测。

这里两种方法,一、进行十年乃至二十年的中长期预测,对之后长久地事件进进行分析。二、仅仅预测五年项目实现后,五年内每一年的具体数据,分析五年内的数据。无论那种方式,究其本质还是预测。这一问的预测可以与问题二相同,这样可以凸显问题的整体性。也可以比问题二的预测模型高级一些,这样增增递进,整体复杂度不错。

比如,问题二是三元线性预测模型,问题四经过问题三的新指标引入变成了五元非线性模型,从而实现模型的改进,这是可行的。

还可以使用更加高级、复杂度更好的预测模型:建立加权平均预测(arima、lstm、多元回归模型),个人最喜欢的模型,模型复杂度很高,但是主要问题就是篇幅很长,可能25页的篇幅限制会超出限制。有点自卖自夸的嫌疑,但是这个就是我们保奖模版的预测模版。该模型也是本次我论文写作的模型,下面是其原理图,会在更新的视频里面进行说明,看不懂的,只能使用方案其他方案即可。

 

问题五、该项目达到预期目标的可能性有多大?此外,基于上下文化的敏感性分析,是否存在一些条件或事件可能会不成比例地帮助或损害项目达到其目标的能力?

问题五本质在问能够实现该目标能够实现,还是验证预测的结果能否达成具体的要求。即分析问题四的预测结果与五年项目目标即可。主要在于后半问,敏感性分析,通俗一下即我们需要判定一些指标是否对我们的结果存在非常关键的影响。例如,对于一个五元线性模型,我们剔除一个自变量好,四元线性预测的结果与五元结果的差异。也可以是使得五元线性回归模型的输入值发生变化,查看具体的Y是怎么变化的。

问题六、非技术型文章,须为你的客户提交一份1页的备忘录,其中包括你的重点,强调你的5 年项目提案,以及为什么这个项目适合他们作为客户(例如,获取资源,他们的部分任 务,与他们的使命声明一致,等等)。

非技术型文章,八仙过海各显神通即可。

 

这篇关于2024年美赛F题超详细思路的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/672601

相关文章

Python中isinstance()函数原理解释及详细用法示例

《Python中isinstance()函数原理解释及详细用法示例》isinstance()是Python内置的一个非常有用的函数,用于检查一个对象是否属于指定的类型或类型元组中的某一个类型,它是Py... 目录python中isinstance()函数原理解释及详细用法指南一、isinstance()函数

Python的pandas库基础知识超详细教程

《Python的pandas库基础知识超详细教程》Pandas是Python数据处理核心库,提供Series和DataFrame结构,支持CSV/Excel/SQL等数据源导入及清洗、合并、统计等功能... 目录一、配置环境二、序列和数据表2.1 初始化2.2  获取数值2.3 获取索引2.4 索引取内容2

uni-app小程序项目中实现前端图片压缩实现方式(附详细代码)

《uni-app小程序项目中实现前端图片压缩实现方式(附详细代码)》在uni-app开发中,文件上传和图片处理是很常见的需求,但也经常会遇到各种问题,下面:本文主要介绍uni-app小程序项目中实... 目录方式一:使用<canvas>实现图片压缩(推荐,兼容性好)示例代码(小程序平台):方式二:使用uni

Python屏幕抓取和录制的详细代码示例

《Python屏幕抓取和录制的详细代码示例》随着现代计算机性能的提高和网络速度的加快,越来越多的用户需要对他们的屏幕进行录制,:本文主要介绍Python屏幕抓取和录制的相关资料,需要的朋友可以参考... 目录一、常用 python 屏幕抓取库二、pyautogui 截屏示例三、mss 高性能截图四、Pill

java时区时间转为UTC的代码示例和详细解释

《java时区时间转为UTC的代码示例和详细解释》作为一名经验丰富的开发者,我经常被问到如何将Java中的时间转换为UTC时间,:本文主要介绍java时区时间转为UTC的代码示例和详细解释,文中通... 目录前言步骤一:导入必要的Java包步骤二:获取指定时区的时间步骤三:将指定时区的时间转换为UTC时间步

MySQL批量替换数据库字符集的实用方法(附详细代码)

《MySQL批量替换数据库字符集的实用方法(附详细代码)》当需要修改数据库编码和字符集时,通常需要对其下属的所有表及表中所有字段进行修改,下面:本文主要介绍MySQL批量替换数据库字符集的实用方法... 目录前言为什么要批量修改字符集?整体脚本脚本逻辑解析1. 设置目标参数2. 生成修改表默认字符集的语句3

MySQL使用EXISTS检查记录是否存在的详细过程

《MySQL使用EXISTS检查记录是否存在的详细过程》EXISTS是SQL中用于检查子查询是否返回至少一条记录的运算符,它通常用于测试是否存在满足特定条件的记录,从而在主查询中进行相应操作,本文给大... 目录基本语法示例数据库和表结构1. 使用 EXISTS 在 SELECT 语句中2. 使用 EXIS

Git打标签从本地创建到远端推送的详细流程

《Git打标签从本地创建到远端推送的详细流程》在软件开发中,Git标签(Tag)是为发布版本、标记里程碑量身定制的“快照锚点”,它能永久记录项目历史中的关键节点,然而,仅创建本地标签往往不够,如何将其... 目录一、标签的两种“形态”二、本地创建与查看1. 打附注标http://www.chinasem.cn

线上Java OOM问题定位与解决方案超详细解析

《线上JavaOOM问题定位与解决方案超详细解析》OOM是JVM抛出的错误,表示内存分配失败,:本文主要介绍线上JavaOOM问题定位与解决方案的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录一、OOM问题核心认知1.1 OOM定义与技术定位1.2 OOM常见类型及技术特征二、OOM问题定位工具

基于 Cursor 开发 Spring Boot 项目详细攻略

《基于Cursor开发SpringBoot项目详细攻略》Cursor是集成GPT4、Claude3.5等LLM的VSCode类AI编程工具,支持SpringBoot项目开发全流程,涵盖环境配... 目录cursor是什么?基于 Cursor 开发 Spring Boot 项目完整指南1. 环境准备2. 创建