问题所在
我们的大脑不会平等地记住所有事情。
今天早上喝的咖啡?正在快速消退。婚礼那天?几十年后依然清晰。上个月头脑风暴中的突破性想法?因为你一直在基于它构建,所以仍然新鲜。
我们的大脑会自然地进行优先级排序。这不是缺陷——正因为会遗忘,记忆才能长期保持有用。
然而,大多数数字记忆系统平等对待所有信息。三年前做的决定和今天的突破性洞察并排放置,以相同的权重争夺你的注意力。
搜索某样东西,你会被大量权重相同的结果所淹没。
如果…
如果我们的个人记忆系统能像我们的大脑一样工作呢?
如果最近和经常使用的知识能自然地首先浮现,而旧的未使用记忆礼貌地让位呢?
如果我们能问"上个季度我们做了什么决定?"并且真正得到上个季度的记忆呢?
我们是如何做到的
我们研究了认知科学家如何建模人类记忆,特别是卡内基梅隆大学的 ACT-R 和 叶峻峣 的 FSRS,后者驱动着像 Anki 这样的现代间隔重复系统。
基于这项研究,我们建立了一个实用的记忆衰减模型:
-
时效性——最近访问的记忆得分更高。我们用大约 30 天半衰期的指数衰减,昨天的记忆比三个月前的排名高得多。
-
频率强化——反复访问的记忆变得更持久。你的行为教会系统什么是重要的。
-
重要性兜底——高重要性的基础知识永远不会完全消退,即使未被使用。
-
反馈塑造相关性——受 FSRS 追踪检索成功方法的启发,我们追踪展示次数、点击和停留时间。高点击率?记忆确实有用。长停留时间?值得阅读的内容。
Nowledge Mem 评分管道
结果是,搜索更像记忆本身,而不再像考古。真正相关的内容,会在你需要的时候自然浮现。
理解时间
除了相关性,我们还解决了另一个挑战:时间查询。
考虑这些搜索:
- “我们迁移数据库之前发生了什么?”
- “去年第三季度的记忆”
- “关于认证的最近洞察”
这些不仅仅是关键词搜索。它们是关于事情何时发生的问题。
这里有个棘手的部分:有两种时间。
-
事件时间: 这实际上是什么时候发生的?关于2020年决定的记忆有一个2020年的事件时间。
-
记录时间: 你什么时候保存的?你今天可能记录那个2020年的决定,给它一个2025年的记录时间。
"关于2020年事件的最近记忆"有特定含义:你最近保存的关于2020年事件的东西。
Nowledge Mem 现在理解这种区别。它处理模糊引用如"大约2020年"或"去年初",并将它们转化为有意义的结果。
这意味着什么
-
更少噪音。 旧的、未使用的记忆不会挤占结果。需要时它们仍在,但会为更新鲜的知识让位。
-
更好的相关性。 多条记忆匹配查询时,你一直在用的那些会排到前面。
-
时间感知搜索。 “上个季度我们做了什么决定?”——这类问题真的能用了。
-
自组织。 不必手动归档或删除,记忆根据你实际使用的方式自行排列。
下一步
这只是整个系统中的一层,但它会影响所有地方。更好的衰减模型和更准确的时间理解,会让搜索结果、agent 回忆,以及每天早上的简报都更贴近知识在真实使用中的变化方式。
如果你对技术细节感兴趣,请查看我们的搜索与相关性文档,里面有评分系统的完整说明。