Skip to content

AdamMayor2018/ML_Notes

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

26 Commits
 
 
 
 
 
 
 
 

Repository files navigation

ML_Notes

一.关于本项目

这个项目是我在打机器学习比赛和学习中,总结的机器学习竞赛分析流程。机器学习竞赛在很多方面上比如EDA、特征工程、特征筛选、模型选择、模型融合等等具备通用的方法,后续也打算做一个自动化的baseline工程,目前先积累思路、流程、并将其中部分函数进行封装,方便使用。

二.章节导航

1.EDA

  1. 数据检验&相关性分析
  2. 离散数据编码
  3. 标准化&归一化
  4. 连续变量分箱

2.特征衍生

  1. 基于业务背景进行特征创建思路
  2. 基于数据分布规律进行特征衍生(IV-WOE检验)
  3. 单变量自动特征衍生
  4. 双变量自动特征衍生
  5. 多变量自动特征衍生
  6. 时序特征衍生

About

机器学习系统思路与工程方法

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published