Press "Enter" to skip to content

王茂霖:特征工程方法总结!

本站内容均来自兴趣收集,如不慎侵害的您的相关权益,请留言告知,我们将尽快删除.谢谢.

:王茂霖,华中科技大学,Datawhale成员

 

内容概括

 

1.经典特征工程构造

 

2.特征工程案例实践

 

PPT完整下载: 后台回复“ 210501 ”可获取

 

视频地址:https://www.bilibili.com/video/BV1sf4y1s7Fw

 

特征工程构造

 

 

特征工程是数据科学最有创造力的部分

 

 

一、 特征的类型汇总

 

 

二、 特征工程方法总 结

 

 

三、 类别特征的常用编码方法

 

 

1.Label Encoder

 

 

2. One-Hot Encoder

 

 

3.Frequency 编码

 

 

4.Target 编码

 

 

5.其他编码

 

 

四、 数值特征的常用编码 方法

 

 

五、 时间特征的常用编码 方法

 

 

特征工程实践

 

 

 

1.特征构造

 

特征工程构建大概可以从三个方面入手: 领域特征,交叉特征和多项式特征。

 

 

2.特征选择

 

特征选择可能会降低模型的预测能力。因为被剔除的特征中可能包含了有效的信息,抛弃了这部分信息会一定程度上降低预测准确率。

 

 

本文作者

 

王茂霖,Datawhale重要贡献成员,Datawhale&天池数据挖掘学习赛开源内容发起人,全网阅读超10w。

 

参赛30余次,获得DCIC-数字中国创新创业大赛亚军,全球城市计算AI挑战赛,Alibaba Cloud German AI Challenge等多项Top10。

 

分享地址

 

复制链接打开(或阅读原文)

 

https://www.bilibili.com/video/BV1sf4y1s7Fw

 

Be First to Comment

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注