特征工程:字典特征提取器 DictVectorizer
Contents
DictVectorizer使用场景
- 字典特征提取器:
- 将字典数据结构抽取和向量化
- 类别类型特征借助原型特征名称采用0 1 二值方式进行向量化
- 数值类型特征保持不变
- 在一些模型数据整理前使用
1 | from sklearn.feature_extraction import DictVectorizer |
1 | # 初始化字典特征抽取器 |
1 | [[ 1. 0. 0. 33.] |
1 | # 查看提取后特征的含义 |
1 | ['city=Dubai', 'city=London', 'city=San Fransisco', 'temperature'] |