特征工程:使用TSNE进行降维
TSNE介绍
TSNE是一种降维方法,通过将多维度数据,在保持原有数据分布和相似性情况下,转换为二维或者三维数据。
原理
- 简单说明下就是先选中某点,然后计算该点到所有点的距离,然后将所有点映射到对应分布上。
- 详细理论可以查阅:http://bindog.github.io/blog/2016/06/04/from-sne-to-tsne-to-largevis/#top
TSNE目的
- 主要是为了对各种高维度数据进行可视化(常用在聚类分析)
- 简化机器模型训练和预测
TSNE使用
下面使用sklearn.manifold 简单演示
1 | import pandas as pd |

1 | from sklearn.manifold import TSNE |

1 | import matplotlib.pyplot as plt |
