大海

SIMPLE THE COMPLEX

神经网络/卷积神经网络中存在很多的超参数,并且随着优化技术的发展,越来越多的超参数被加入进来,最常见的超参数包括:

  1. 初始学习率
  2. 学习率衰减机制(比如衰减常数)
  3. 正则化策略(L2惩罚,随机失活强度)

大多数超参数在训练过程中相对固定,比如动量大小,衰减常数等,cs231n提出一些学习技巧来帮助搜索最佳的超参数值

阅读全文 »

创建模型,进行数据集训练之前可以进行合理性检查(sanity check),参考Before learning: sanity checks Tips/Tricks,有助于更好的判断模型有效性

cs231n中给出了3个技巧:

  1. 寻找正确损失值
  2. 判断正则化强度有效性
  3. 过拟合小数据集
阅读全文 »