
深度学习调参有哪些技巧?
做新模型的时候,最开始不要加激活函数,不要加batchnorm,不要加dropout,先就纯模型。然后再一步一步的实验,不要过于信赖经典的模型结构(除非它是预训练的),比如加了dropout一定会有效果,或者加了batchnorm一定会有提升所以先加上,首先你要确定你的模型处于什么阶段,到底是欠拟合还是过拟合,然后再确定解决手段。
如果是欠拟合,直接模型宽度深度增加,一般2倍递增或者数据集增强,特别在nlp领域可以用大量数据增强方式-比如,同义词替换,
阅读全文 → 2022-10-27