详细解答T-SNE程序中from sklearn.manifold import TSNE的数据设置,包括输入数据,绘制颜色的参数设置,代码复制可用!!

本文主要是介绍详细解答T-SNE程序中from sklearn.manifold import TSNE的数据设置,包括输入数据,绘制颜色的参数设置,代码复制可用!!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

文章目录

  • 前言——TSNE是t-Distributed Stochastic Neighbor Embedding的缩写
  • 1、可运行的T-SNE程序
  • 2. 实验结果
  • 3、针对上述程序我们详细分析T-SNE的使用方法
    • 3.1 加载数据
    • 3.2 TSNE降维
    • 3.3 绘制点
    • 3.4 关于颜色设置,颜色使用的标签数据的说明c=y
  • 总结


前言——TSNE是t-Distributed Stochastic Neighbor Embedding的缩写

TSNE是t-Distributed Stochastic Neighbor Embedding的缩写,它是一个非线性降维算法。

TSNE的主要作用和优点如下:

  • 高维数据投影到低维空间,如二维或三维,实现高维数据的可视化。

  • 相比其他降维方法如PCA,TSNE在保留局部结构信息上的效果更好,尤其适用于高维稠密数据。

  • 它可以很好地区分数据中的簇结构,有利于观察不同类别或类型的数据分布情况

1、可运行的T-SNE程序

from sklearn.datasets import load_iris
from sklearn.manifold import TSNE
import matplotlib.pyplot as plt
import matplotlib
matplotlib.use('TkAgg')# 加载数据
iris = load_iris()
X = iris.data
y = iris.target# TSNE降维
tsne = TSNE(n_components=2, random_state=0)
X_tsne = tsne.fit_transform(X)# 绘制点
plt.scatter(X_tsne[:,0], X_tsne[:,1], c=y, marker='o', s=5)# 添加图例
plt.legend(iris.target_names)# 添加标题
plt.title("TSNE projection of the Iris dataset")plt.show()

2. 实验结果

在这里插入图片描述

3、针对上述程序我们详细分析T-SNE的使用方法

3.1 加载数据

  • load_iris()函数从sklearn.datasets模块加载鸢尾花数据集,
  • iris包含数据集的特征数据X标签数据y

3.2 TSNE降维

  • TSNE是一种非线性降维算法,用于高维数据的可视化。它可以将高维数据投影到二维或三维空间。

  • TSNE(n_components=2)实例化一个TSNE模型,降维后的维度数设为2

  • random_state=0固定随机数种子,使得结果可重复

  • fit_transform(X)对特征数据X进行降维,返回降维后的新特征X_tsne。

3.3 绘制点

  • X_tsne包含每个样本的二维坐标

  • plt.scatter以(x,y)坐标方式绘制每个点,c=y指定点的颜色

  • marker='o’设置点的形状为圆形

  • s=5控制点的大小

通过TSNE降维,高维数据X被投影到二维空间,得到低维表示X_tsne。然后根据X_tsne和y进行散点图绘制,就可以实现TSNE降维结果的可视化。这是TSNE的标准流程。

3.4 关于颜色设置,颜色使用的标签数据的说明c=y

c=y这行代码的含义和作用是:

  • c参数用于设置散点图中每个点的颜色。

  • y变量包含了样本的类别标签信息。对于鸢尾花数据集来说,y取值为0、1或2,分别表示三种花的类别

  • 当我们设置c=y时,就是根据每个样本在y中的类别标签值,来动态设置这个样本点在散点图中的颜色

  • 具体来说:

    • 如果一个样本的y值为0,那么这个点的颜色就会取颜色映射中的第一个颜色。

    • 如果y值为1,点颜色取第二个颜色。

    • 如果y值为2,点颜色取第三个颜色。

  • 这样每个类别的样本点就会使用不同的颜色来绘制,从而在可视化结果中清晰区分开各个类别。


总结

  • 在科研中,TSNE广泛应用于图像分类、自然语言处理等领域的数据降维和可视化。

  • 比如对神经网络分类结果进行TSNE降维,可以观察不同类别样本在特征空间中的分布,有助于分析模型表现。

  • 对文本语料进行TSNE降维,可以观察词汇在语义空间中的分布,帮助理解语义结构。

  • 对单细胞RNA-seq数据进行TSNE降维,可以观察不同类型细胞在表达空间中的分布,有助于发现新型细胞亚群。

所以总体来说,TSNE通过高效的降维和保留局部结构,有助于科研人员直观观察高维数据的内在结构,分析模型效果,发现数据中的新知识,从而推动科研工作的进展。它为数据可视化和理解提供了重要的工具支持。

这篇关于详细解答T-SNE程序中from sklearn.manifold import TSNE的数据设置,包括输入数据,绘制颜色的参数设置,代码复制可用!!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/422485

相关文章

Django开发时如何避免频繁发送短信验证码(python图文代码)

《Django开发时如何避免频繁发送短信验证码(python图文代码)》Django开发时,为防止频繁发送验证码,后端需用Redis限制请求频率,结合管道技术提升效率,通过生产者消费者模式解耦业务逻辑... 目录避免频繁发送 验证码1. www.chinasem.cn避免频繁发送 验证码逻辑分析2. 避免频繁

批量导入txt数据到的redis过程

《批量导入txt数据到的redis过程》用户通过将Redis命令逐行写入txt文件,利用管道模式运行客户端,成功执行批量删除以Product*匹配的Key操作,提高了数据清理效率... 目录批量导入txt数据到Redisjs把redis命令按一条 一行写到txt中管道命令运行redis客户端成功了批量删除k

精选20个好玩又实用的的Python实战项目(有图文代码)

《精选20个好玩又实用的的Python实战项目(有图文代码)》文章介绍了20个实用Python项目,涵盖游戏开发、工具应用、图像处理、机器学习等,使用Tkinter、PIL、OpenCV、Kivy等库... 目录① 猜字游戏② 闹钟③ 骰子模拟器④ 二维码⑤ 语言检测⑥ 加密和解密⑦ URL缩短⑧ 音乐播放

Python pandas库自学超详细教程

《Pythonpandas库自学超详细教程》文章介绍了Pandas库的基本功能、安装方法及核心操作,涵盖数据导入(CSV/Excel等)、数据结构(Series、DataFrame)、数据清洗、转换... 目录一、什么是Pandas库(1)、Pandas 应用(2)、Pandas 功能(3)、数据结构二、安

Python使用Tenacity一行代码实现自动重试详解

《Python使用Tenacity一行代码实现自动重试详解》tenacity是一个专为Python设计的通用重试库,它的核心理念就是用简单、清晰的方式,为任何可能失败的操作添加重试能力,下面我们就来看... 目录一切始于一个简单的 API 调用Tenacity 入门:一行代码实现优雅重试精细控制:让重试按我

SpringBoot多环境配置数据读取方式

《SpringBoot多环境配置数据读取方式》SpringBoot通过环境隔离机制,支持properties/yaml/yml多格式配置,结合@Value、Environment和@Configura... 目录一、多环境配置的核心思路二、3种配置文件格式详解2.1 properties格式(传统格式)1.

Apache Ignite 与 Spring Boot 集成详细指南

《ApacheIgnite与SpringBoot集成详细指南》ApacheIgnite官方指南详解如何通过SpringBootStarter扩展实现自动配置,支持厚/轻客户端模式,简化Ign... 目录 一、背景:为什么需要这个集成? 二、两种集成方式(对应两种客户端模型) 三、方式一:自动配置 Thick

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

python设置环境变量路径实现过程

《python设置环境变量路径实现过程》本文介绍设置Python路径的多种方法:临时设置(Windows用`set`,Linux/macOS用`export`)、永久设置(系统属性或shell配置文件... 目录设置python路径的方法临时设置环境变量(适用于当前会话)永久设置环境变量(Windows系统

Python对接支付宝支付之使用AliPay实现的详细操作指南

《Python对接支付宝支付之使用AliPay实现的详细操作指南》支付宝没有提供PythonSDK,但是强大的github就有提供python-alipay-sdk,封装里很多复杂操作,使用这个我们就... 目录一、引言二、准备工作2.1 支付宝开放平台入驻与应用创建2.2 密钥生成与配置2.3 安装ali