LSTM是壹種循環神經網絡模型,其全稱為“長短時記憶網絡”(Long Short-Term Memory Network)。它是RNN的壹種改進形式,在解決傳統RNN在處理序列數據時會出現梯度消失或梯度爆炸等問題方面表現更加優異。
LSTM模型的核心是由門控單元(Gate Units)和記憶單元(Memory Units)構成的。其中門控單元主要負責控制信息是否流經,以此控制信息的輸入、輸出和遺忘;而記憶單元主要記錄和保存歷史狀態的信息,並通過門控單元的調節實現信息的篩選、保留與更新。
相比於傳統RNN,LSTM可以更好地處理長時序列數據,使得我們能夠更有效地對文本、音頻、視頻等序列數據進行建模,從而在自然語言處理、語音識別、圖像描述等領域獲得了廣泛的應用。