【MATLAB第32期】【更新中】基于MATLAB的降维/全局敏感性分析/特征排序/数据处理分类问题MATLAB代码实现

本文主要是介绍【MATLAB第32期】【更新中】基于MATLAB的降维/全局敏感性分析/特征排序/数据处理分类问题MATLAB代码实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

【MATLAB第32期】【更新中】基于MATLAB的降维/全局敏感性分析/特征排序/数据处理分类问题MATLAB代码实现(持续更新)

本文敏感性分析主要分析分类问题(fisher、rf、arf、nca等)。

版本更新:

2023/8/2 增加基于拥挤距离和Pearson相关系数的IPCC方法(用SVM进行交叉验证分类预测评估)

clear all
warning('off','all');
tic;
load classdata  %导入数据
ContributeRate=0.9;
item=randperm(size(classdata,1));%数据打乱
classdata=classdata(item,:);% 数据打乱重组
xtrain=classdata(:,1:end-1);% 输入变量
ytrain=classdata(:,end);%输出标签
Nf=10;   %  选择特征数量 
[m,n]=size(xtrain); % m代表行  n代表列 %拥挤前保存原始xdata
Xdatasave=xtrain;%%0和1之间的归一化
xtrain= (xtrain-min(xtrain)) ./ (max(xtrain)-min(xtrain));%%--------拥挤阶段
%计算特征的拥挤/相关距离
crowdingDistance = IPCC(Xdatasave, ytrain);
%%--------对特征值进行排名
[res,ind]=sort(crowdingDistance,'descend');
%%--------选择最重要的特征
indfeat=ind(1:Nf);
%%-----------评估准确性
kfold=5;           %  交叉验证K值
Acc = Eval(xtrain(:,indfeat),ytrain,kfold);   %分类器评估

在这里插入图片描述

在这里插入图片描述

正确率=100%
总特征变量数量 = 21
筛选的特征变量数量= 1
筛选的特征变量编号为: 16  19  18   2  17   4   7  20  10   5  14   6   1

一、降维方法(分类)

常见的降维方法:
常见的敏感性分析法:

*(一).全局敏感性分析(sobol、蒙特卡洛方法)


(二).非全局敏感性分析
1.变量筛选(Fisher算法、临近成分分析NCA、RF随机森林、ARF自适应随机森林)

二、案例数据

案例数据classdata 3998×22 ,前21列为变量,第22列为标签,案例采用2分类,即[1,2],多分类也满足。
在这里插入图片描述

三、实际应用

(1)Fisher算法

%% 1.Fisher
addpath('D:特征排序\Fisher')
load classdata
ContributeRate=0.9;
id=randperm(size(classdata,1));%数据打乱
classdata=classdata(id,:);% 数据打乱重组
xtrain=classdata(:,1:end-1);% 输入变量
ytrain=classdata(:,end);%输出标签
[W] = Fisher_Score(xtrain,ytrain) ;
plot2

在这里插入图片描述
在这里插入图片描述

(2)近邻成分分析NCA(用于分类)

%% (2)近邻成分分析NCA(用于分类)
addpath('D:\特征排序\NCA')
load classdata
ContributeRate=0.9;
[xx,mdl]=myfscnca(xtrain,ytrain,0.9);
xnca=classdata(:,xx);

在这里插入图片描述
在这里插入图片描述

(3)临近成分分析NCA

%% (3)近邻成分分析NCA
addpath('D:\特征排序\NCA')
ContributeRate=0.9;
xtrain =data(:,1:end-1);
ytrain =data(:,end);
[xx,mdl]=myfsrnca(xtrain,ytrain,0.9);
xnca=data(:,xx);

(4)随机森林RF

%% (3)随机森林RF
addpath('D:\特征排序\RF')
load classdata
ContributeRate=0.9;
[XT,RFModel,w]= mycrf(classdata,ContributeRate);
xrf=classdata(:,XT);

在这里插入图片描述在这里插入图片描述

(5)自适应随机森林ARF

%% (4)自适应随机森林ARF
addpath('D:\小论文文件包最终版\基坑与算法文献\副业\特征排序\ARF')
load classdata
ContributeRate=0.9;
params.RFLeaf=[5,10,20,50,100,200,500]; %RFLeaf定义初始的叶子节点个数,这里设置了从5到500。
params.Maxepoch=500; % 选择叶子节点个数对应的最大训练步数
[XT,RFModel,w,params]= mycarf(classdata,ContributeRate,params);
xarf=classdata(:,XT);

在这里插入图片描述

nTree = 20;nLeaf = 5;
在这里插入图片描述
在这里插入图片描述

四、代码获取

私信回复‘32’即可获取下载链接。

这篇关于【MATLAB第32期】【更新中】基于MATLAB的降维/全局敏感性分析/特征排序/数据处理分类问题MATLAB代码实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/203872

相关文章

Redis客户端连接机制的实现方案

《Redis客户端连接机制的实现方案》本文主要介绍了Redis客户端连接机制的实现方案,包括事件驱动模型、非阻塞I/O处理、连接池应用及配置优化,具有一定的参考价值,感兴趣的可以了解一下... 目录1. Redis连接模型概述2. 连接建立过程详解2.1 连php接初始化流程2.2 关键配置参数3. 最大连

Python实现网格交易策略的过程

《Python实现网格交易策略的过程》本文讲解Python网格交易策略,利用ccxt获取加密货币数据及backtrader回测,通过设定网格节点,低买高卖获利,适合震荡行情,下面跟我一起看看我们的第一... 网格交易是一种经典的量化交易策略,其核心思想是在价格上下预设多个“网格”,当价格触发特定网格时执行买

SQL Server跟踪自动统计信息更新实战指南

《SQLServer跟踪自动统计信息更新实战指南》本文详解SQLServer自动统计信息更新的跟踪方法,推荐使用扩展事件实时捕获更新操作及详细信息,同时结合系统视图快速检查统计信息状态,重点强调修... 目录SQL Server 如何跟踪自动统计信息更新:深入解析与实战指南 核心跟踪方法1️⃣ 利用系统目录

MySQL 内存使用率常用分析语句

《MySQL内存使用率常用分析语句》用户整理了MySQL内存占用过高的分析方法,涵盖操作系统层确认及数据库层bufferpool、内存模块差值、线程状态、performance_schema性能数据... 目录一、 OS层二、 DB层1. 全局情况2. 内存占js用详情最近连续遇到mysql内存占用过高导致

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

解决RocketMQ的幂等性问题

《解决RocketMQ的幂等性问题》重复消费因调用链路长、消息发送超时或消费者故障导致,通过生产者消息查询、Redis缓存及消费者唯一主键可以确保幂等性,避免重复处理,本文主要介绍了解决RocketM... 目录造成重复消费的原因解决方法生产者端消费者端代码实现造成重复消费的原因当系统的调用链路比较长的时

python设置环境变量路径实现过程

《python设置环境变量路径实现过程》本文介绍设置Python路径的多种方法:临时设置(Windows用`set`,Linux/macOS用`export`)、永久设置(系统属性或shell配置文件... 目录设置python路径的方法临时设置环境变量(适用于当前会话)永久设置环境变量(Windows系统

深度解析Nginx日志分析与499状态码问题解决

《深度解析Nginx日志分析与499状态码问题解决》在Web服务器运维和性能优化过程中,Nginx日志是排查问题的重要依据,本文将围绕Nginx日志分析、499状态码的成因、排查方法及解决方案展开讨论... 目录前言1. Nginx日志基础1.1 Nginx日志存放位置1.2 Nginx日志格式2. 499

kkFileView启动报错:报错2003端口占用的问题及解决

《kkFileView启动报错:报错2003端口占用的问题及解决》kkFileView启动报错因office组件2003端口未关闭,解决:查杀占用端口的进程,终止Java进程,使用shutdown.s... 目录原因解决总结kkFileViewjavascript启动报错启动office组件失败,请检查of

Python对接支付宝支付之使用AliPay实现的详细操作指南

《Python对接支付宝支付之使用AliPay实现的详细操作指南》支付宝没有提供PythonSDK,但是强大的github就有提供python-alipay-sdk,封装里很多复杂操作,使用这个我们就... 目录一、引言二、准备工作2.1 支付宝开放平台入驻与应用创建2.2 密钥生成与配置2.3 安装ali