数据类别不平衡怎么处理?

1.数据增强。
2.对少数类别数据做过采样,多数类别数据做欠采样。
3.损失函数的权重均衡。(不同类别的loss权重不一样,最佳参数需要手动调节)
4.采集更多少数类别的数据。
5.转化问题定义,将问题转化为异常点检测或变化趋势检测问题。 异常点检测即是对那些罕见事件进行识别,变化趋势检测区别于异常点检测,其通过检测不寻常的变化趋势来进行识别。
6.使用新的评价指标。
7.阈值调整,将原本默认为0.5的阈值调整到:较少类别/(较少类别+较多类别)。


蓝海大脑 京ICP备18017748号-1