数据类别不平衡怎么处理?
1.数据增强。 2.对少数类别数据做过采样,多数类别数据做欠采样。 3.损失函数的权重均衡。(不同类别的loss权重不一样,最佳参数需要手动调节) 4.采集更多少数类别的数据。 5.转化问题定义,将问题转化为异常点检测或变化趋势检测问题。 异常点检测即是对那些罕见事件进行识别,变化趋势检测区别于异常点检测,其通过检测不寻常的变化趋势来进行识别。 6.使用新的评价指标。 7.阈值调整,将原本默认为0.5的阈值调整到:较少类别/(较少类别+较多类别)。 |
蓝海大脑 京ICP备18017748号-1