财讯：使用什么做法可以让AI产生回忆?-财新资讯网

本篇文章2862字，读完约7分钟

人工智能要形成长时间的记忆，需要脑科学、神经科学、心理学、行为经济学等多个学科的交叉研究。

记住并回忆一些东西对人类来说是天生的能力。我可以回忆过去，据此决定未来。可以让ai代理也这么做吗？最近，谷歌人工智能公司的深层思考( deepmind )提出了一种方法，可以让智能主体使用特定的记忆信任过去的行为，并对未来做出正确的决定。相关成果发表在最新一期的《自然通信》上。

财讯：使用什么做法可以让AI产生回忆?

那么，现在我们让ai创造的记忆和人类的记忆是一样的吗？人工智能可以用什么方法产生记忆？与以往相比，这次深入思考提出的新方法有什么不同？在赋予人工智能记忆方面，我们还需要做那些努力吗？

四种做法使ai产生记忆

记忆是我们对过去的经验进行编码、记忆、回忆等的能力。一般来说，可以认为是利用过去的经验影响现在行动的能力。使人类能够学习以前的经验，与现在的实践建立联系。

生活中感动我们的人和事，往往会引起回忆，也就是我们常说的触景生情。人类的长时间记忆实际上表现出了多模态场景化的特征。也就是说，一个记忆事物在记忆时包含多个维度，通过触发某个维度可以更迅速地找到线索进行记忆。远望智库人工智能事业部部长、图灵机器人首席战术官谭茗洲在接受科技日报记者采访时，经常高估记忆量，但实际上由于我们的记忆容量有限，人类的记忆本身高度抽象，记忆时我们一般以事物为特征。当我们想起电影时，我们无法准确地想起一帧一帧的完美图像，但如果场景再现，我们就会想起以前的场景。

财讯：使用什么做法可以让AI产生回忆?

在以往的研究中，用什么样的方法让ai产生了回忆？

谭茗洲介绍说，有四种比较常用的方法。第一个是长短期记忆互联网。由嵌入互联网的显性记忆单元构成，具有记忆长周期新闻的功能。该技术已被谷歌、亚马逊、微软等企业用于语言识别、智能助手等。第二种方法是弹性权重增强算法。该算法主要用于依次学习多个游戏。深层思考使用了这种强化记忆的相关算法，目的是让机器能够学习、记忆和提取新闻。第三种方法是可微分的神经计算机，该计算机的优点是将神经互联网与存储系统联系起来，像以前流传的计算机一样存储新闻，从例子中学习。第四种方法是连续神经互联网，主要用于迷宫学习，可以处理许多复杂的连续任务，转移知识。

财讯：使用什么做法可以让AI产生回忆?

处理长时间的信用分配问题很重要

现在，ai产生的记忆和人类的记忆一样吗？谭洲回答说，现在的ai记忆只停留在对学习中获得的新闻进行编码、记忆、转化为认识的过程中。过去的方法只是记忆ai中发生的一切，但是记忆和记忆有所区别，记忆变得能够比较有效地记忆了。人类回忆的方法经常跨越各种阈值，就像人们通过某个企业品牌突然想起某个东西一样。因此，对于过去发生的微小事件，为了让ai主体评价为不应该记忆，用一点点的方法进行评定，达到人类记忆的效果是很重要的。

财讯：使用什么做法可以让AI产生回忆?

为了让ai能够回忆过去的事情，关系到如何判断长时间的信用分配问题，即行为在长时间行为序列中的效用。但是，人工智能现有的可靠度分配方法无法处理行动与结果之间存在长期延迟的任务。

人工智能的研究介绍了在一个长序列内判断个体行为的效用问题被称为信用分配问题这个判断可以评分过去的行动和计划未来的行动。

谭茗洲具体解释说，在强化学习方面，代理人接受指导的唯一途径是薪酬，薪酬一般比较稀疏和滞后。代理人获得报酬时，不太知道那些行为应该被信任，应该受到责备，这就是信用分配问题。

另外，谭茜洲介绍说，为了让ai创造人类一样的回忆，有必要首先让ai学习剧情记忆和自传记忆。 ai总是做不到，是因为情景记忆和自传记忆具有非常强的个人体验特征。情景记忆和自传记忆一旦与当事人分离，就会失去生命力，对机器来说很难想象。毕竟，对机器来说，精神可以独立于物质而存在，体验可以独立于主体而存在。另外，防止机器可能发生的毁灭性遗忘。心理学的研究表明，人类对自然识别系统的遗忘并不需要完全抹去以前的新闻。但是，对机器来说，遗忘是毁灭性的，有必要抹去以前的新闻。

财讯：使用什么做法可以让AI产生回忆?

与人多而杂乱的记忆相比，还是初期阶段

谭茗洲表示，此次深层思考建立在深入强化案例学习的基础上，提出引进长期信用分配的大致内容。首先，主体必须编码和记忆感知和事件记忆，主体必须通过识别和访问过去事件的记忆来预测未来的报酬，主体还需要通过对未来报酬的贡献来重新审视这些过去的事情。这样，主体就可以利用特定的记忆信任过去的行为，并对未来做出正确的决定。

财讯：使用什么做法可以让AI产生回忆?

为了实现这一点，深层思考论文指出，其主要工作是形式化任务结构，主要包括两类任务。具体来说，在第一类新闻获取任务中，在某个阶段，代理需要在没有实时报酬的情况下搜索环境获取新闻。在两个阶段，代理人从事长时间不相关的干扰任务，在获得多个奖金的三个阶段，代理人需要利用一个阶段获得的新闻来获得远程报酬。

财讯：使用什么做法可以让AI产生回忆?

在第二个因果任务中，在某个阶段，代理需要采取行动触发，只有长期的因果关系。两个阶段，同样是干扰任务。在三个阶段，为了取得成功，主体需要利用一个阶段的活动引起的环境变化来取得成功。

在研究这种结构的完善任务之前，研究人员考虑了使代理实现更简单的被动过程的任务被动视觉匹配。也就是说，特工不采取任何积极措施收集新闻。就像一个特工在街上走一样，不知不觉中注意到了一些新闻。

深层思考的论文展示了游戏过程中的简单场景，让ai代理记忆探索的路径和攻略，当然与人多复杂的记忆机制相比是相当早期的阶段。

谭茗洲强调，正如论文所述，新方法范式扩大了ai研究的范畴。这是一个有趣的话题，涉及到人类脑科学的研究，以及神经科学、心理学、行为经济学等多学科交叉研究的尝试，今后还有很长的路要走，需要越来越多的开放探索。

财讯：使用什么做法可以让AI产生回忆?

延伸阅览

现在的人工智能系统还没有很长的记忆

人脑从功能的角度出发，分为寄存器、短期记忆、长时间记忆、中央控制模块几个模块。人脑通过五种传感器、视觉、触觉等，从外部接收新闻，有寄存器。如果我们的观察力关注这些新闻，大脑就会把这些新闻变成短期记忆的复制品。短期记忆可以持续30秒左右。如果意识到记住这些拷贝，大脑就能把短期记忆的拷贝变成长时间记忆。

财讯：使用什么做法可以让AI产生回忆?

长记忆的复制品既有新闻也有知识。简言之，新闻代表世界事实，知识代表人们对世界的理解，两者之间未必有确定的界线。人在长期记忆中保存新闻和知识时，新的拷贝与现有拷贝联系在一起，规模不断扩大，这是长期记忆的优点。这意味着长时间记忆实际上存在于大脑皮质，在大脑皮质中改变脑细胞之间的链接，构建新的链接，形成新的互联网模式。

财讯：使用什么做法可以让AI产生回忆?