首页 > AI资讯 > 最新资讯 > 一文读懂循环神经网络(RecN)

一文读懂循环神经网络(RecN)

新火种    2023-11-22

循环神经网络(Recurrent Neural Network,简称RNN)是一种深度学习模型,它可以用来处理和预测序列数据,如文本、语音、时间序列等。RNN的原理是利用循环结构来保存和更新历史信息,从而实现对数据中的时序特征的提取。

RNN的基本结构如下图左半部分所示:

其中,X_t 是 t 时刻的输入,S_t 是 t 时刻的隐藏状态,O_t 是 t 时刻的输出,U、W、V 是可学习的参数矩阵。RNN的关键在于 S_t 的计算,它不仅取决于当前时刻的输入 X_t ,还取决于上一时刻的隐藏状态 S_ {t-1} ,这样就实现了对历史信息的记忆和传递。

RNN可以按照时间步展开成如上图有半部分所示的链式结构,这样就可以看出,RNN其实是一个单元结构重复使用的网络,每个单元都执行相同的任务,只是使用不同的输入和隐藏状态。

RNN的前向计算过程可以用以下公式表示:

其中,f 和 g 是激活函数,通常是非线性的,如 tanh 或 ReLU 等。

RNN的训练过程可以用以下公式表示:

其中,L 是总损失函数,L_t 是 t 时刻的损失函数,Y_t 是 t 时刻的真实标签。3

RNN的训练算法通常是随时间反向传播(Backpropagation Through Time,简称BPTT),它是在每个时间步展开后的网络上使用反向传播算法(Backpropagation,简称BP),通过计算梯度并更新参数来最小化损失函数。

RNN有很多变种和优化方法,如长短时记忆网络(Long Short-Term Memory,简称LSTM),门控循环单元(Gated Recurrent Unit,简称GRU),双向循环神经网络(Bidirectional Recurrent Neural Network,简称Bi-RNN)等。

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。