操作原理
LSTM和RNN的主要區別在於,它在算法中增加了壹個“處理器”,用來判斷信息是否有用。這個處理器的結構叫做細胞。
壹個牢房有三扇門,分別叫輸入門、遺忘門、輸出門。當壹個消息進入LSTM網絡時,可以根據規則判斷它是否有用。只會留下符合算法認證的信息,不符合的信息會通過遺忘門被遺忘。
無非是壹進兩出的工作原理,卻能解決神經網絡長期以來在重復運算下的大問題。目前已經證明LSTM是解決長階依賴問題的有效技術,而且這種技術非常通用,導致了很多可能的變化。研究人員根據LSTM提出了他們自己版本的變量,這使得LSTM能夠處理不斷變化的垂直問題。