中国人工智能学会通讯——仿脑GPS基于神经科学的器人定位与导航-阿里云开发者社区

很高兴在这里有机会和大家分享我的工作。刚才几位老师主要讨论了神经科学方面很多较为深入的研究，我主要是想谈谈如何从神经科学或脑科学的角度出发，结合人工智能，进而实现机器人的智能，主要包括智能的感知环境、建图、自定位和认知导航。

首先解释一下仿脑GPS。在动物大脑内部存在一个类似于GPS的智能系统，能够实现与GPS类似，但更具智能的定位和导航功能。我们遵从生物神经科学原理，将此智能系统在机器人平台上实现，并将其称为仿脑GPS。我在四川大学计算机学院类脑计算研究中心的研究工作，大致包括以下几方面：①首先，从类脑计算的基础出发，主要属于计算神经科学范畴；②在此基础上进行感知信息处理、神经形态的智能硬件研究——人工视网膜、人工听觉信息处理等；③进而构造大规模的认知计算网络，模拟基于脉冲的计算模式，实现大规模的复杂计算和更加高效、智能的神经形态计算模型；④将神经形态模型和算法用芯片来实现，即类脑计算网络的硬件化，这也是类脑计算的主要目标之一。

跟类脑计算结合非常紧密的一个研究领域就是智能机器人，因为无论是智能的网络模型、算法和硬件化实现，最终都需要一个现实的载体来体现其智能。机器人就是一个真正能够让它们与现实交互的智能实现载体。

这次大会的主题是人工智能，所以就结合人工智能来谈一谈我对神经形态计算的观点。神经形态计算在开始发展的若干年间，对大多数人来说一直都是一个非常冷门的术语，甚至只是作为一个课题存在。《2030年的人工智能》报告，其中专门把神经形态计算列为下一代的人工智能技术之一，且相关领域对其关注度越来越高。大家如果对这个领域比较陌生，可去查阅这份报告的具体内容，会更加了解。

从我的理解来说，神经形态计算从微观到宏观，主要涵盖以下几方面工作：微观来讲，是指单个神经元、神经电路和神经环路的设计，还有神经编码机制、突触学习机制及记忆编码机制等；宏观来讲，是指如何从底层电路、神经元之间的连接来实现高级智能。高级智能的实现方式有很多，我们的着力点在于机器人认知。今年5月我们刚刚出版一本新书，名为Neuromorphic Cognitive Systems，系统介绍了这方面的研究成果，大家有兴趣可去参阅。

回到本次报告的主题：机器人定位与导航。在机器人的发展历程中，从注重规划控制的工业机器人，到关注移动和多地适应性的特种机器人，再到现在非常热门的聚焦环境感知的服务机器人，我们的终极目标是全方位的智能机器人，即具有类人的大脑、自我感知、理解和学习能力。

有人也许会有疑问，为什么我们主张机器人要用神经科学或类脑的方法来构建？事实上，在当前发展水平来看，现有机器人对空间环境的感知能力依赖于对世界的精确建模，需要对空间有较为精准的理解和认识。这种精确的理解和认识是通过激光雷达、视觉等高精度的感知传感器，如果考虑智能驾驶，其要求更高。众所周知，人类在任何环境中都有非常好的空间感知和导航能力，但人的视觉、听觉却都是非精确传感器。其关键在于人类脑部神经信息处理和协同、导航、记忆等具有无穷魅力的完美机制，才使得人类可在任何空间中可靠、精确、自适应地定位和导航。我们所说的神经认知机器人，很大程度上是指其信息获取、处理和执行基于神经科学的研究，基于对海马体脑皮层神经回路的理解。

目前生物和神经科学领域对动物导航理论的研究是基于啮齿类动物大鼠的，在此之前还有基于蜜蜂、鸽子和海豚等生物的研究，比如：基于蝙蝠的Beaconing；基于昆虫和蜜蜂的路径导航；鸟类依赖于地磁场的长距离迁徙和定位。虽然对灵长类动物和人类的相关实验很少，但对啮齿类动物的实验结果表明，灵长类和人类内部对环境感知和导航机制与啮齿类动物导航原理类似。因此我们基于哺乳动物开展研究，比如蝙蝠和大鼠，他们都属于哺乳动物，具有类似的神经科学机制，具有准确的空间定位能力。科学家发现，当蝙蝠从洞里跑到树上寻找食物时，它的位置细胞精度是不断变化的，即它的位置感受也会从细微到粗糙，或从粗糙到细微，这取决于当前环境特征的丰富程度和精细程度。场景粗糙或周围地标不丰富的情况下，它的位置感知精度也会降低，感知变得模糊，这是对环境的自适应能力和多尺度的空间表达特点。

目前对生物大脑导航原理研究大多数聚焦于动物海马体内部和周围的特定区域，同时除去嗅觉等其他依赖因素，在可控环境中观察动物对环境的认知能力和行为。在观察动物行为的同时记录大鼠在特定区域中移动时，不同脑区中单个细胞或细胞集群的神经元活动。这些研究促成了参与脑部建图和定位任务的若干细胞的发现，主要包括位置细胞、头朝向细胞、网格细胞和边界细胞等。这些细胞对环境有特定反应，对哺乳动物认知环境和定位有很重要的作用。我们试图通过模拟哺乳动物的脑机制来得到一个更加稳定、可靠和通用的认知导航系统。

对于人类来说，无法像大鼠那样进行插入电极或者解剖式的神经科学实验，但已有研究表明，人类大脑确有类似功能的细胞存在。比如人通常会对特定环境有所感知和反应，能够根据周围场景，准确判断自己的位置；而且在闭上眼睛，即没有视觉信息的情况下，依然可走到某个地点。这其中的关键技术被称为路径积分。

对于动物认知导航的研究并没有考虑以机器人在载体来实现，只是纯粹地从解析大脑的认知计算机理出发。20世纪40年代，美国资深行为心理学家E. C. Tolman曾指出，动物大脑能够创建一种表示外部环境的内部地图，以确定自身在环境中的行走路线，这种机制远比激励和响应之间的简单关联要复杂得多，并首次称其为认知地图；1972诺贝尔生理或医学奖获得者Gerald Edelman提出Brain-Based Device的概念，智能需要通过与物理世界的交互来实现；HMAX深度学习网络感知模型，提出了具有感知的深度网络。右侧的年轻澳洲科学家Michael Milford依据大鼠的空间感知机理构造了机器人的同步定位与建图算法。

海马区的早期研究让人类对大脑运行机制有了更深入的了解。但很多神经科学家致力于神经元和突触层面上的相关研究，突触生理学与动物行为关系的探讨在早期一直是占压倒性地位的研究问题。2014年的诺贝尔生理或医学奖授予给三位在认知导航研究理论领域做出杰出贡献的科学家，分别是发现位置细胞的John O’Keefe教授，以及发现网格细胞的May-Britt Moser教授和Edvard I. Moser教授。这代表了神经科学的巨大进步，部分程度上揭开了认知地图的神秘面纱。在细胞层面对海马结构所做的一系列研究和取得的空前成就，改变了之前的研究局势，研究者们开始将神经元集群放电模式与个体的特定行为联系起来，即表达和检索空间环境、在环境中使用神经元活动定位目标的行为。

从位置细胞、网格细胞等与空间定位和感知相关的细胞发现，到空间认知模型的构建经历了很长的历程，逐渐形成大脑GPS系统模型。其中位置细胞的特性是在环境中的特定位置活跃和放电，表示对该位置的感知，随着大鼠在环境中的移动会有不同的细胞活跃和放电，进而形成了对整个环境的感知和定位。下面为大家演示的是一个生物神经学研究的基础实验，通过在大鼠脑部插入电极，检测特定神经元的发放情况来展示位置细胞的空间感知特性。

动物大脑内部存在的认知地图是一种非常复杂的机制，需要更多的空间信息，只有一系列的位置是不足以形成这种复杂机制的。网格细胞的发现促进了认知地图理论的发展。网格细胞的放电特性为：放电模式呈现周期性，每个细胞的多个放电野(firing field) 构成了清晰的六边形网格形状，进而形成覆盖整个动物活动环境的网状结构，因此被称为网格细胞。如此规则的放电模式为大脑认知地图提供了度量。

但目前没有研究表明在实际的脑部结构中，网格细胞和位置细胞是如何连接的。因此，构建一个认知地图模型，需要我们通过分析海马区和内嗅皮层等脑部结构之间的信息环路，依据位置细胞的定位功能、网格细胞的路径积分功能，以及头朝向细胞的指南针特性等的共同协作，来生成空间感知信息和空间记忆编码。其中，吸引子网络模型能够很好地模拟网格细胞的特性和路径积分的过程，感兴趣的可以参阅相关论文深入了解。

模拟生物导航原理来让机器人对环境进行智能感知，同步进行定位和建图的技术，被称为生物启发式SLAM，目前相对较为成熟的研究中主要包括的细胞类型有位置细胞、网格细胞、头朝向细胞。头朝向细胞通过一维吸引子模型提供方向信息，网格细胞接收网格细胞的输入，同时反馈一些诸如视觉等信息用于网格细胞进行校准。由于目前很多计算机制还没有完全建立起来，所以相对于真实的生物导航机制，我们在实际的机器人平台上实现中会做一些适当的简化。

昆士兰科技大学Michael Milford教授在这方面做出了杰出贡献，基于局部视觉细胞（Local View Cell）、位姿细胞（Pose Cell）和经历地图（Experience Map）构建了RatSLAM模型。我们结合了位置细胞、网格细胞以及Hebbian学习规则建立了gSLAM模型，在机器人平台上实现了仿脑GPS导航系统，能够更加准确地、更具生物保真性地在实际环境中做导航。下面是gSLAM模型，即我们构造的机器人同步定位、建图和导航系统；视频展示了它所接收的视觉输入完全模拟大脑对空间的定位和反应。

在关于认知地图的研究中，还有很多问题待解决，比如网格细胞和位置细胞的连接关系研究；如何提取、记忆和识别环境中的关键信息，建立what与where两类神经信息通路的交互；如何建立语义、知识空间并与感知模型很好的结合等。我们需要继续努力，使仿脑GPS导航系统功能更加强大。

当然，构造机器人的“大脑”需要多学科的共同协作和努力，需要从大量生物和神经科学中获取信息和知识。另外，人工智能、机器学习模型、信息处理、神经形态器件和芯片的结合也是不可或缺，需要多个领域的科学家通力合作。

其实我们可以从研究大脑认知机制中学到很多东西，当前人工智能领域在脑科学里做的工作还远远不够。举个例子，跳蜘蛛非常不起眼，但这样一个大脑只有几毫米的动物，却拥有出色的空间感知和处理能力及高视觉精度。人类对它们的了解和内部生物学原理却知之甚少。所以，神经科学或说是脑科学里包含了很多极为出色的仿生机制和算法，有待我们去探索。

最后，感谢团队成员的努力和协作。在这里我将艾伦人工智能研究所CEO Dr. Oren Etzioni的一段话分享给大家：“大脑的复杂性使得神经科学的应用和发展过程艰难，正因为此，在此领域取得这样的成果（仿脑GPS）令人振奋”。欢迎大家投入到脑科学和人工智能的工作中来，为我们论坛做一个号召。

（本报告根据速记整理）