用seaborn画tsne,并指定形状、形状颜色与标记内容

2023-10-30 03:59

本文主要是介绍用seaborn画tsne,并指定形状、形状颜色与标记内容,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

         最近在做深度模型的可视化操作,心血来潮,特此纪念!

        原创不易,转载请标明出处,谢谢!

1.如何用seaborn画tsne?

        这里拿sklearn中的digits数据集为例,类别数为2;

代码解释:

        1.主函数

        (1)加载digits数据集,类别数为2;

        (2) 得到数据集的特征与标签;

        (3)传入plot_tsne()函数;

        2.plot_tsne()函数:画tsne分布图,并将图像保存,"test/Set2.jpg"

        (1)初始化TSNE(),然后用PCA将特征降至2维;

        (2)将特征与标签存入表格df中;

        (3)调用seaborn的scatterplot()函数画图,色板条为“Set2”;

        (4)图像保存;

import numpy as np
import matplotlib
matplotlib.use('Agg')
import matplotlib.pyplot as plt_sne
from sklearn import datasets
from sklearn.manifold import TSNE
import osdef plot_tsne(features, labels, epoch,fileNameDir = None):'''features:(N*m) N*m大小特征,其中N代表有N个数据,每个数据m维label:(N) 有N个标签'''print(features.shape,labels.shape)print(type(features),type(labels))print(np.any(np.isnan(features)),np.any(np.isinf(features)))features = np.nan_to_num(features)if not os.path.exists(fileNameDir):os.makedirs(fileNameDir)import pandas as pdtsne = TSNE(n_components=2, init='pca', random_state=0)import seaborn as sns#查看标签的种类有几个class_num = len(np.unique(labels))  # 要分类的种类个数  eg:[0, 1, 2, 3]这个就是为4try:tsne_features = tsne.fit_transform(features)  # 将特征使用PCA降维至2维except:tsne_features = tsne.fit_transform(features)#一个类似于表格的数据结构df = pd.DataFrame()df["y"] = labelsdf["comp1"] = tsne_features[:, 0]df["comp2"] = tsne_features[:, 1]# hue:根据y列上的数据种类,来生成不同的颜色;# style:根据y列上的数据种类,来生成不同的形状点;sns.scatterplot(x= df.comp1.tolist(), y= df.comp2.tolist(),hue=df.y.tolist(),style = df.y.tolist(),palette=sns.color_palette("Set2",class_num),data=df).set(title="T-SNE projection")plt_sne.savefig(os.path.join(fileNameDir,"%s.jpg") % str(epoch),format = "jpg")plt_sne.show()if __name__ == '__main__':digits = datasets.load_digits(n_class=2)features, labels = digits.data, digits.targetprint(features.shape)print(labels.shape)plot_tsne(features, labels, "Set2", fileNameDir="test")

         运行上述代码,可得结果:

  2.如何指定图像上的形状?

        如果我们想用其他形状表示标签0,1,该怎么做呢!

做法很简单,对上述代码中的sns.scatterplot函数,添加markers参数

sns.scatterplot(x= df.comp1.tolist(), y= df.comp2.tolist(),hue=df.y.tolist(),style = df.y.tolist(),palette=sns.color_palette("Set2",class_num),markers= {1:"v",0:"^"},data=df).set(title="T-SNE projection")

        添加markers参数后,我们就可以用倒三角表示标签1,正三角表示标签0:

3.如何指定形状颜色? 

         我们如果想对标签1,0的颜色进行随意指定,不想用色板条上提供的,做法如下!

(1)定义一个hex列表,用于存储表示颜色的十六进制;比如:

        hex = ["#ff8b8b", "#6e85b7"]

(2)将hex替换sns.plotscatter函数中的“Set2”参数即可;

sns.scatterplot(x= df.comp1.tolist(), y= df.comp2.tolist(),hue=df.y.tolist(),style = df.y.tolist(),palette=sns.color_palette(hex,class_num),markers= {1:"v",0:"^"},data=df).set(title="T-SNE projection")

        这样,就能得到一个自定义颜色的分布图:

 4.如何指定自定义的标记内容?

        我们不想让右上角的0,1标签作为图注,想将0,1标签替换为其他信息,比如:

                将标签0替换为“zero”,标签1替换为"one";

        关于这一块,本人在网上并没有找到通过直接修改函数参数从而达到目的的方案,如果有小伙伴搜到的,可以在评论区分享一下!

本人是这样做的:

        (1)先读取存取在df表格中的标签列,然后再定义一个数组,根据标签0,1进行值的转换:

        data_label = []for v in df.y.tolist():if v == 1:data_label.append("one")else:data_label.append("zero")

        (2)将自定义的data_label加入存储数据的df表格中的value列:

        df["value"] = data_label

        (3)更改sns.scatterplot()函数中的hue、style、markers参数:

        sns.scatterplot(x= df.comp1.tolist(), y= df.comp2.tolist(),hue=df.value.tolist(),style = df.value.tolist(),palette=sns.color_palette(hex,class_num),markers= {"one":"v","zero":"^"},data=df).set(title="T-SNE projection")

         通过上述操作,就能达到指定自定义的标签内容的效果:

         至此,标题中提到的问题已解答完毕,祝好!

———————————————————————————————————————————

        同时具备解决上述问题的代码,如下:

import numpy as np
import matplotlib
matplotlib.use('Agg')
import matplotlib.pyplot as plt_sne
from sklearn import datasets
from sklearn.manifold import TSNE
import osdef plot_tsne(features, labels, epoch,fileNameDir = None):'''features:(N*m) N*m大小特征,其中N代表有N个数据,每个数据m维label:(N) 有N个标签'''print(features.shape,labels.shape)print(type(features),type(labels))print(np.any(np.isnan(features)),np.any(np.isinf(features)))features = np.nan_to_num(features)if not os.path.exists(fileNameDir):os.makedirs(fileNameDir)import pandas as pdtsne = TSNE(n_components=2, init='pca', random_state=0)import seaborn as sns#查看标签的种类有几个class_num = len(np.unique(labels))  # 要分类的种类个数  eg:[0, 1, 2, 3]这个就是为4try:tsne_features = tsne.fit_transform(features)  # 将特征使用PCA降维至2维except:tsne_features = tsne.fit_transform(features)#一个类似于表格的数据结构df = pd.DataFrame()df["y"] = labelsdf["comp1"] = tsne_features[:, 0]df["comp2"] = tsne_features[:, 1]hex = ["#ff8b8b", "#6e85b7"]data_label = []for v in df.y.tolist():if v == 1:data_label.append("one")else:data_label.append("zero")df["value"] = data_label# hue:根据y列上的数据种类,来生成不同的颜色;# style:根据y列上的数据种类,来生成不同的形状点;sns.scatterplot(x= df.comp1.tolist(), y= df.comp2.tolist(),hue=df.value.tolist(),style = df.value.tolist(),palette=sns.color_palette(hex,class_num),markers= {"one":"v","zero":"^"},data=df).set(title="T-SNE projection")plt_sne.savefig(os.path.join(fileNameDir,"%s.jpg") % str(epoch),format = "jpg")plt_sne.show()if __name__ == '__main__':digits = datasets.load_digits(n_class=2)features, labels = digits.data, digits.targetprint(features.shape)print(labels.shape)plot_tsne(features, labels, "Set2", fileNameDir="test")

这篇关于用seaborn画tsne,并指定形状、形状颜色与标记内容的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/305446

相关文章

Python实现自动化Word文档样式复制与内容生成

《Python实现自动化Word文档样式复制与内容生成》在办公自动化领域,高效处理Word文档的样式和内容复制是一个常见需求,本文将展示如何利用Python的python-docx库实现... 目录一、为什么需要自动化 Word 文档处理二、核心功能实现:样式与表格的深度复制1. 表格复制(含样式与内容)2

python如何生成指定文件大小

《python如何生成指定文件大小》:本文主要介绍python如何生成指定文件大小的实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录python生成指定文件大小方法一(速度最快)方法二(中等速度)方法三(生成可读文本文件–较慢)方法四(使用内存映射高效生成

Java如何将文件内容转换为MD5哈希值

《Java如何将文件内容转换为MD5哈希值》:本文主要介绍Java如何将文件内容转换为MD5哈希值的实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Java文件内容转换为MD5哈希值一个完整的Java示例代码代码解释注意事项总结Java文件内容转换为MD5

python如何下载网络文件到本地指定文件夹

《python如何下载网络文件到本地指定文件夹》这篇文章主要为大家详细介绍了python如何实现下载网络文件到本地指定文件夹,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下...  在python中下载文件到本地指定文件夹可以通过以下步骤实现,使用requests库处理HTTP请求,并结合o

使用Python自动化生成PPT并结合LLM生成内容的代码解析

《使用Python自动化生成PPT并结合LLM生成内容的代码解析》PowerPoint是常用的文档工具,但手动设计和排版耗时耗力,本文将展示如何通过Python自动化提取PPT样式并生成新PPT,同时... 目录核心代码解析1. 提取 PPT 样式到 jsON关键步骤:代码片段:2. 应用 JSON 样式到

全解析CSS Grid 的 auto-fill 和 auto-fit 内容自适应

《全解析CSSGrid的auto-fill和auto-fit内容自适应》:本文主要介绍了全解析CSSGrid的auto-fill和auto-fit内容自适应的相关资料,详细内容请阅读本文,希望能对你有所帮助... css  Grid 的 auto-fill 和 auto-fit/* 父元素 */.gri

Python如何调用指定路径的模块

《Python如何调用指定路径的模块》要在Python中调用指定路径的模块,可以使用sys.path.append,importlib.util.spec_from_file_location和exe... 目录一、sys.path.append() 方法1. 方法简介2. 使用示例3. 注意事项二、imp

Pandas利用主表更新子表指定列小技巧

《Pandas利用主表更新子表指定列小技巧》本文主要介绍了Pandas利用主表更新子表指定列小技巧,通过创建主表和子表的DataFrame对象,并使用映射字典进行数据关联和更新,实现了从主表到子表的同... 目录一、前言二、基本案例1. 创建主表数据2. 创建映射字典3. 创建子表数据4. 更新子表的 zb

Python实现word文档内容智能提取以及合成

《Python实现word文档内容智能提取以及合成》这篇文章主要为大家详细介绍了如何使用Python实现从10个左右的docx文档中抽取内容,再调整语言风格后生成新的文档,感兴趣的小伙伴可以了解一下... 目录核心思路技术路径实现步骤阶段一:准备工作阶段二:内容提取 (python 脚本)阶段三:语言风格调

一文详解如何在Python中从字符串中提取部分内容

《一文详解如何在Python中从字符串中提取部分内容》:本文主要介绍如何在Python中从字符串中提取部分内容的相关资料,包括使用正则表达式、Pyparsing库、AST(抽象语法树)、字符串操作... 目录前言解决方案方法一:使用正则表达式方法二:使用 Pyparsing方法三:使用 AST方法四:使用字