工具是人类肢体和感官的延伸,机器为人类带来更强大的生产力,科学家已经在研究这样一种人和机器的控制反馈关系:只要我们动动脑,光凭意念就能控制现实中的机器。这种称为脑机接口的技术让我们省略了操控机器中的所有环节,从而在大脑和机器之间建立了一个直接通信的连接体系。
时值脑科学和人工智能两大领域在过去几十年各自都取得长足进展后,逐渐走向融合的关键节点,脑机接口(brain-machine interface,BMI)技术已成为主流媒体和公众热议的高科技话题之一。它不仅可以绕过感官和肌肉,为大脑与外界互动提供全新的高通量信道,甚至无需借助语言而实现人与人之间高效的交流协作,这不仅使得意识读写、记忆移植成为可能,甚至通过意识上传实现在数字世界中的永生等人类长久以来的梦想,也一步步走向现实,可能对人类文明的整体进程产生颠覆性影响。
进入21世纪以来,特别是在过去10年间,历经两次寒冬的人工智能再度强势崛起。其中,以深度学习为代表的人工智能应用,在特征识别和知识存取等静态封闭的复杂场景下,取得了傲人的成就,机器取代人类工作似乎不再遥不可及。但与此同时,我们必须清醒地看到,目前人工智能在机器人控制和自动驾驶等动态开放场景下的表现,还远不尽人意。包括硅谷钢铁侠马斯克(E. R. Musk)在内的很多有识之士,都认为人和机器各有所长,而通过脑机接口实现人机融合,才是未来人机关系的终极解决方案。
脑机接口技术实现完整闭环控制的四大环节
近年来,脑机接口相关技术如雨后春笋般涌现,并不断更新迭代,其商业化进程也在Neuralink和脸书(Facebook)等科技巨头的助推下不断提速,使得意念控制物体等以前还是科幻的场景,正在实验室中一步步变成现实[1]。但是,脑机接口这一复杂的系统工程要真正落地得到广泛应用,还需要神经科学、数理科学、医学、心理学、材料科学、计算机科学、机器人学、自动控制等多学科的通力协作,以及多个相关领域对关键问题的突破[2]。
神经界面
毫不夸张地说,我们的大脑是宇宙中已知最复杂神秘的系统,是一切人类文明的源泉,也是人类征服自然、改造世界不可替代的物质基础。在探索脑的奥秘这一自然科学最后堡垒的征途初期,卡哈尔(S. Cajal)提出神经元(又称神经细胞)是神经系统的基本结构单元,而高尔基(C. Golgi)则认为神经元之间需要通过连接形成网络来行使其功能,不承认卡哈尔发现的神经元。尽管他们分享了1906年诺贝尔生理学或医学奖,但最终谁也没能说服谁,历史却证明他们都是正确的!人和灵长类的大脑由数以十亿计的神经元组成,而每个神经元又通过数以千计的突触与其他神经元形成错综复杂的连接。每个神经元整合上游神经元的输入,产生并输出脉冲形式的动作电位发送给其他神经元,进而形成庞大的网络来工作。脑图谱研究又把大脑分为成百上千个皮层和皮层下脑区,认为它们分别行使不同的功能。今天虽然我们比较详尽地了解了脑的组织结构,但对它工作机制的认识还非常肤浅,根本原因在于脑是一个由数以亿计的神经元通过复杂精巧连接而成的多层次非线性动力系统。我们的感知与认知、决策与运动、学习与记忆、语言与意识、情感与推理、智能与创新等诸多高级功能,都是由大量神经元相互作用后涌现出来的整体动力学行为。换言之,脑的智能绝非许多神经元个体行为的简单叠加,而是由多个包含大量神经元的子系统高度协作的结果。因此,能够安全、长期、稳定地记录高通量神经元群体活动信号,是实现脑机接口的第一步,这就是神经界面(neural interface)技术。
按照神经信号的获取途径,脑机接口主要分为非侵入式和侵入式两大类。起步较早的是非侵入式脑机接口,它通常是通过放置于头皮上的电极来记录脑电(electroencephalogram,EEG)信号,并对其进行解码来实现的。早在1924年,德国医生贝格尔(H. Berger)发明了脑电图。1973年,美国科学家维达尔(J. Vidal) 首次提出脑机接口(brain-computer interface,BCI)概念[8]。但直到20世纪末,在计算机广泛普及和算力提升后,实时解码复杂脑电信号才成为可能。目前,尽管以P300、运动想象(motor imagery, MI)和稳态视觉诱发电位(steady-state evoked potentials,SSVEP)等范式为代表的非侵入式脑机接口的通信速率比较低,但得益于其稳定性和低性价比,已开始走出实验室应用于环境控制和目标识别等多个场景。除脑电信号外,非侵入式脑机接口也可基于脑磁图、超声成像、功能近红外光谱和功能性核磁共振等其他信号。2014年,在巴西世界杯开幕式上,身披外骨骼“战甲”的高位截瘫青年开球动作,就是利用非侵入式脑机接口完成的。虽然这些信号的采集相对方便且无创,但面对大脑复杂的信息处理系统,隔着颅骨和头皮进行信号读取和神经调控,未免有点隔靴搔痒,导致它们能够解码和传输的信息非常有限。因此,近年来非侵入式脑机接口的发展趋势已逐渐达到平台期,而侵入式脑机接口异军突起,竖立了一个又一个里程碑。
侵入式脑机接口往往通过神经外科手术,将电极等传感设备植入颅内甚至大脑皮层里,采集高时空分辨率和信噪比的神经活动信号,并将其传出进行解码。记录的神经电活动信号主要有动作电位脉冲(spike)、局域场电位(local field potential,LFP)和皮层脑电图(electrocorticography, ECoG)等。由于开颅手术和植入器件的过程中,不可避免会造成组织损伤和排异反应,因此,侵入式脑机接口的器件植入、手术过程和解码算法等,往往需要在猕猴等动物身上试验成功后,才能转到人体上。
神经元是大脑处理信息的基本单元,它发放的动作电位脉冲直接携带了每个神经元输出信号,是脑机接口最为理想和可靠的信息源。而感觉、认知和运动等相关信息在大脑中往往是通过大量神经元以群体活动方式编码的,同时记录大量神经元的群体电脉冲活动信息就至关重要。有趣的是,从1969年美国科学家菲兹首次利用单个神经元发放的电信号控制一个仪表盘,实现了最原始版本的侵入式脑机接口以来,实验室环境中可同时记录和解码的神经元数目的增速也大致服从广义的“摩尔定律”,即每六七年翻一番。到2021年,马斯克的Neuralink公司已能在一只名为“帕格”(Pager)猕猴身上通过在其脑内植入的Neuralink设备,实现1024道神经信号的长期稳定记录,可以让它在没有游戏操纵杆的情况下,仅用大脑意念方式就可以控制一台电脑,玩转“MindPong”游戏(一款模拟两人玩兵乓球的电子游戏)。除了能记录大量神经元的群体活动,还要尽量保证记录界面在机械和化学特性上与脑组织间的生物兼容,以减少炎症、胶质细胞激活和细胞凋亡等排异反应。开发在生物安全材料基础上的柔性高密度电极阵列,并通过微创手术植入以实现能长期稳定地记录信号等一系列工作,需要神经外科、电生理、纳米科学、微电子、生物材料等多学科的交叉和合作才能完成。
神经解码
从大脑记录到的神经信号必须经过合适的解码才能驱动外部装置。以脑控神经假肢为例,过去几十年来,几代神经科学家都以猕猴为模式动物研究神经解码和假肢控制算法,假设皮层神经活动与运动参数存在固定的映射关系,建立表征模型,再通过解码神经信号来调整机械手状态,实现运动控制。但是这种解码框架不仅理论上过于简化,实践中经常使整个运动过程非常缓慢且不流畅,远不能满足对人工假肢实现快速灵活控制的需求。