机器学习中难免遇到正负样本不平衡问题,处理办法通常有梁总,一:过采样,增加正样本数据;二:欠采样,减少负样本数据,缺点是会丢失一些重要信息。smote属于过采样。
代码
# from imbl…
Borderline-SMOTE:
Borderline-SMOTE: A New Over-Sampling Method in Imbalanced Data Sets Learning
motivation:
有些样本远离边界,所以对分类没有多大帮助,可以强化边界点。
思路:
将少数类样本根据距离多数…