t-SNE方法：

本文主要是介绍t-SNE方法：，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

使用t-SNE时，除了指定你想要降维的维度（参数n_components），另一个重要的参数是困惑度（Perplexity，参数perplexity）

困惑度：

困惑度大致表示如何在局部或者全局位面上平衡关注点，再说的具体一点就是关于对每个点周围邻居数量猜测。困惑度对最终成图有着复杂的影响。

低困惑度对应的是局部视角，要把自己想象成一只蚂蚁，在数据所在的流形上一个点一个点地探索。
高困惑度对应的是全局视角，要把自己想象成上帝。

参考：t-SNE：最好的降维方法之一 - 知乎 (zhihu.com)

具体介绍：

t-SNE（t-分布随机邻域嵌入，T-distributed Stochastic Neighbor Embedding）是一种流行的机器学习算法，主要用于降维。该算法特别适用于将高维数据映射到低维空间，如2维或3维，以便于可视化和分析。可以从具有数百甚至数千个维度的数据中创建引人注目的两维“地图”

t-SNE（t-DistributedStochastic Neighbor Embedding，T 分布随机近邻嵌入）是一种可以把高维数据降到二维或三维的降维技术。

t-SNE通过在低维空间中模拟高维数据分布，尽可能保留原始数据集中的局部结构。它是一种非线性降维技术，其核心思想是保持相似的数据点在嵌入后的空间中仍然彼此靠近，同时在高维空间中相隔较远的点在嵌入后也保持距离。

目标：

在高维空间中获取一组点，并在低维空间（通常是 2D 平面）中找到这些点的忠实表示。该算法是非线性的，可适应底层数据，在不同区域执行不同的变换。这些差异可能是造成混淆的主要根源。

t-SNE的第二个特点是一个可调的参数，即“困惑性”，它（松散地）表示如何平衡数据的局部和全局方面之间的注意力。从某种意义上说，该参数是对每个点具有的近邻数量的猜测。困惑度值对生成的图片具有复杂的影响。原始论文说，“SNE的性能对困惑度的变化相当鲁棒，典型值在5到50之间。但故事比这更微妙。从t-SNE中获得最大收益可能意味着分析具有不同困惑度的多个图。