1、金融风控问题案例 寒小阳 七月在线 2017年1月22日 Kaggle 2 3/54 ! “ # $ ! ! ! ! 七月在线Kaggle实战班 4/54 ! “ # $ % & ( ) 七月在线Kaggle实战班 5/54 ! “ # $ % ! “ # $ % & 七月在线Kaggle实战班 6/54 “ ! ! ! # ! ! ! ! $ ! % ! & 七月在线Kaggle实战班 7/54 “ ! 七月在线Kaggle实战班 8/54 “ ! 七月在线Kaggle实战班 9/54 # 七月在线Kaggle实战班 10/54 $ 七月在线Kaggle实战班 11/54 %
2、 七月在线Kaggle实战班 12/54 “ 七月在线Kaggle实战班 13/54 “ 七月在线Kaggle实战班 14/54 “ 。 可以 七月在线Kaggle实战班 15/54 “ 城市特征向量化 将城市特征里的城市计数,并取 ,然后等值离散化到 个区间内。 如下图,将 这个特征里面的 个城市离散为一个 维向量。 向量“ 表 示该城市位于第一个区间。 七月在线Kaggle实战班 16/54 “ 七月在线Kaggle实战班 17/54 # 每日借贷量统计 七月在线Kaggle实战班 18/54 $ % 七月在线Kaggle实战班 19/54 & ( 七月在线Kaggle实战班 20/54 ! ! ! ! 七月在线Kaggle实战班 21/54 赛题数据的类别比例接近 ,采用两种解决类别不平衡问题的方法 1)在训练模型时设置类别权重,即代价敏感学习 2)过采样 x2 E x3 F A x4 y1 x1 B C D x5 x6 七月在线Kaggle实战班 22/54 “ # 七月在线Kaggle实战班 23/54 $ 七月在线Kaggle实战班 24/54 % 七月在线Kaggle实战班 25/54 & 七月在线Kaggle实战班 26/54 感谢大家! 恳请大家批评指正! 七月在线Kaggle实战班