NMT Tutorial 2扩展b. 优化方法
基本优化方法:梯度下降
如正文所提,梯度下降是一般机器学习中应用最多的优化算法,核心思想是让参数朝着梯度的反方向,也就是函数下降最快的方向移动。设定如下记号:
\(\boldsymbol{\theta}\):模型参数
\(\boldsymbol{x}^{(i)}\):第\(i\)条数据
\(f\)
...
念念不忘,必有回响