使用 heatmap 的下技巧,筛选一下,结果更直观。

下面是小案例演示。

1
2
3
4
5
6
7
8
9
10
11
# 导入包
import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

# 拿到titanic数据集
titanic = sns.load_dataset('titanic')

# 查看前5行数据
titanic.head()

image.png

1
2
corr = titanic.corr()
corr

image.png

1
sns.heatmap(corr)

output_2_1.png

筛选出对标签“alone”相关系数大于 5 的特征。

1
2
3
4
5
6
7
8
9
threshold = 0.5

# 将相关系数绝对值大于 0.5 的特征筛选出来
corrmat = titanic.corr()
top_corr_features = corrmat.index[abs(corrmat["alone"])>threshold]

# 展示
plt.figure(figsize=(10,10))
g = sns.heatmap(titanic[top_corr_features].corr(),annot=True,cmap="RdYlGn")

output_4_0.png