联系电话:020-88888888
神经网络的学习的目的是找到使损失函数的值尽可能小的参数。这是寻找最优参数的问题,解决这个问题的过程称为最优化(optimization)。遗憾的是,神经网络的最优化问题非常难。这是因为参数空间非常复杂,无法轻易找到最优解(无法使用那种通过解数学式一下子就求得最小值的方法)。而且,在深度神经网络中,参数的数量非常庞大,导致最优化问题更加复杂。优化器的角色就是用来更新模型参数的方法,例如SGD、Adam等都能充当优化器的角色。首先我们先看这么一个函数:假设我们需要求解这个函数的最小值。