A Survey on Lifelong Memory of Large Language Models

2025-07-09 7 min

人类的记忆系统

理论基础主要来自 Atkinson–Shiffrin memory model 和 Baddeley’s model of working memory。书写有所抉择。

短期记忆 (Short-Term Memory, STM)

感官记忆 (Sensory Memory)

保存来自感官的原始信息的缓冲区。容量巨大，遗忘时间极其短暂（视觉几毫秒，听觉几秒钟）。不同感觉通道的信息由不同的感觉寄存器存储，例如图像记忆 (Iconic Memory) 和回声记忆 (Echoic Memory)。

这个阶段的信息处理不需要注意力。绝大部分信息会迅速衰退，只有被注意力选中的信息才会进入工作记忆的相应子系统，例如语音回路 (Phonological Loop) 和视空间模板 (Visuospatial Sketchpad)。

有时也被认为是一个独立的阶段，相应的，工作记忆被认为和 STM 等同。

工作记忆 (Working Memory)

有意识地思考、处理和加工信息的区域。容量非常有限（经典研究 7±2，现代研究 4±1 chunks），遗忘时间短暂（15-30 秒）。

复述 (Rehearsal，例如反复默念电话号码) 和组块 (Chunking，例如将 1-9-8-4-1-0-0-1 8 个零散数字组织成 1984-10-01 3 个块表示的有意义的日期) 是维护工作记忆的主要策略。

除了前面提到的子系统外，工作记忆的核心组成部分还包括一个中央执行系统 (Central Executive)，用于分配注意力、切换任务、抑制干扰和从 LTM 提取信息等高级认知功能。

编码 (Encoding) 机制将工作记忆中的信息转化为可以在 LTM 存储的形式，直接影响信息在 LTM 中的存储强度和提取效率。精细复述 (Elaborative Rehearsal) 将信息与已有的知识经验联系起来，进行有意义的组织和解释，能够显著提高信息进入 LTM 的概率和强度。巩固 (Consolidation) 机制使得新编码的记忆痕迹随着时间的推移逐渐稳定和增强，其中突触巩固 (Synaptic Consolidation) 发生在学习后的几个小时或几天内，主要涉及神经元之间突触连接强度的改变，而系统巩固 (Systems Consolidation) 可能持续数周或数年，涉及记忆表征在大脑不同区域间的重组和再分配。

长期记忆 (Long-Term Memory, LTM)

容量理论上是无限的，遗忘时间理论上是永久的。但是可能提取失败 (Retrieval Failure)。

提取失败有没有可能是灾难性遗忘？有可能。人类记忆也存在逆向干扰 (Retroactive Interference，新学习的信息干扰了对旧信息的提取，例如更换手机号一段时间后遗忘了旧手机号) 和前向干扰 (Proactive Interference，旧信息干扰了对新信息的学习和提取，例如习惯了旧的键盘布局，更换键盘后总是不自觉按错位置)。
然而，人类记忆系统演化出许多缓解此问题的机制：
动态的网络结构：可以建立新的突触，而不是改变旧的权重；
结构化和模块化存储：按时间和功能在不同区域存储信息；
重放 (Replay)：和 2 相关，在一个缓慢的过程中令新信息在不破坏旧信息网络的情况下被学习，系统巩固的一种方式；
稀疏性：不同记忆使用的神经元集群重叠度较低。
这使得灾难性遗忘在人类记忆系统上变得不显著。通常的测量方法是：观察是否有提示依赖性遗忘（给出提示可以回想起来）、舌尖现象 (Tip-of-the-tongue，能回忆起词语的特征，但是说不出来) 和再学习的节省（重新学习比第一次学习快得多）等，如果有这些现象就认为是提取失败而不是灾难性遗忘。我认为这不太靠谱，但也许 good enough。

LTM 是分层存储的。首先进入海马体 (Hippocampus)，然后随系统巩固转移到新皮层 (Neocortex)。前者是非永久性的存储区域，后者是独立的、永久性、分布式的存储区域。

外显记忆 (Explicit Memory)

也叫陈述性记忆 (Declarative Memory)，涉及对事实和事件的有意识回忆，可以用语言表达。可以进一步分为：

情景记忆 (Episodic Memory)：关于个人经历的记忆，有时间、地点和情节。例如“我上周日去公园散步了”。
语义记忆 (Semantic Memory)：关于世界的事实、概念和知识。例如“巴黎是法国的首都”。

内隐记忆 (Implicit Memory)

也叫非陈述性记忆 (Non-Declarative Memory)，涉及无意识的技能和习惯，难以用语言表达。

一种典型的形式是程序性记忆 (Procedural Memory，或者肌肉记忆 Muscle Memory)。例如如何骑自行车。这种记忆由小脑 (Cerebellum) 存储。

Letters Unspoken

A Survey on Lifelong Memory of Large Language Models

人类的记忆系统

短期记忆 (Short-Term Memory, STM)

感官记忆 (Sensory Memory)

工作记忆 (Working Memory)

长期记忆 (Long-Term Memory, LTM)

外显记忆 (Explicit Memory)

内隐记忆 (Implicit Memory)

LLM 的记忆系统

工作记忆

情景记忆

语义记忆

参数记忆

挑战

灾难性遗忘

长上下文

动态记忆

一致性/个性化

多模态

成果

系统

算法

基准

研究方向

参考资料