长短记忆网络(long short term memory ;LSTM),理学-统计学-大数据统计分析-深度神经网络-循环神经网络-长短期记忆,一种适用于处理和预测时间序列中的间隔和延迟事件改进的循环神经网络。长短记忆网络于1997年由S.霍赫赖特[注]和J.施米德胡贝[注]在论文《长短期记忆网络》(Long Short-Term Memory)中提出,于2000年被Felix Gers团队改进。LSTM区别于循环神经网络的地方主要在于该算法中加入了一个判断信息是否有用的细胞状态。一个标准的LSTM通常由细胞状态、输入门、输出门和遗忘门构成。细胞状态用来判断信息有用与否,输入门、输出门和遗忘门共同控制进出细胞状态的信息流,只有符合规则的信息才会留下,不符合的信息则通过遗忘门被遗忘。LSTM就是靠这种特殊的结构有选择性地实现信息的保护和控制,有效地解决长期依赖问题。这种一进二出的工作原理可以在反复运算下解决神经网络中长期存在的梯度消失问题,从而使得LSTM具备较长的记忆功能。作为非线性模型,LSTM可用于构造更大型的深度神经网络。