深度学习下的脑机接口BCI究竟有多远?
BCI | ECoG | 脑机接口
LFP | CMRR | 生物计算
随着生命科学、医药研发、数据分析、数据挖掘、LFP、生物计算、靶点发现、基因测序等技术的快速发展,脑科学逐渐出现在人们的视野中,随之而来的脑机接口技术同时得到快速发展。
脑科学是人类社会面临的基础科学问题之一,脑机接口是人类进一步探索自然和人类有效探索手段之一。我们站在通往未知世界的伟大征程的起点,探索大脑必然是艰难而富有挑战的。在国家战略和顶层设计的指引下,随着科技创新的不断推进和人民群众的期待,脑机接口技术将在面向世界科技前沿、国家重大需求和人民生命健康的科技创新主战场上发挥重要作用。
为此,中国信通院近日发出《脑机接口总体愿景与关键技术研究报告》,勾画脑机接口产业发展的蓝图和愿景期望。
注:由于篇幅有限需要更多脑机接口详细资料,请在公众号末尾留下您的邮箱,小编会将PDF文件发您邮箱,共同进步。
蓝海大脑脑机接口深度学习一体机
一、脑机接口发展概述
大脑是思想、情感、感知、行动和记忆的来源。大脑的复杂性赋予人类智慧,同时也让每个人都独一无二。近年来,研究大脑认知的神经科学在分子细胞、关键部件、软硬件开发、应用系统、仪器仪表等诸多方面取得了重大进展和突破,使脑机接口产业的商业化应用逐渐成为可能。
脑机接口(Brain-computerinterface,BCI)是指在有机生命的大脑和具有处理或计算能力的设备之间建立一个信息交换的连接通道,从而实现信息交换和控制。脑机接口根据信号采集方式的不同可以分为植入式和非植入式两种技术路线。
植入式脑机接口是一种有创方法,是指对颅骨深处组织进行信号采集和记录。常用的技术包括皮层脑电图(ECoG)、单个神经元的动作电位( Spike)和局部场电位(LFP)。也有一些技术使用干预作为一种手段,以一种侵入性较小的方式将电极送入颅内血管,以收集EEG信号。植入式脑机接口记录的信号时空分辨率高,信息量大,可以实时、准确地控制复杂任务。
植入式脑机接口技术主要应用于医疗领域,最有可能率先落地并带来市场收益的是神经替代、神经调控相关技术和产品。神经替代脑机接口技术是为了弥补特殊人群因器官损伤导致的信息收发能力缺损,采用脑机接口技术把感觉信息直接写入脑,或是将脑意图信息脑内读出,解码后实现对外交互, 完成意愿动作。
神经替代脑机接口技术在国内外已进入临床科研阶段,主要针对感觉或运动神经损伤(如瘫痪、失语、失明)做基本功能替代或功能重建。神经调控脑机接口技术是实时分析精神状态,精准刺激调控大脑中神经活动的异常状态。对于记忆力减退、中重度抑郁症、精神分裂症、毒瘾等疾病,神经控制脑机接口技术比药物治疗更准确、更高效。目前,由于精神疾病发病的理论模型尚未建立,治疗靶点不明。因此神经调节脑机接口技术主要是探索神经机制并尝试治疗,可以帮助提高此类疾病的诊疗水平,并不能广泛应用于临床治疗。
非植入式脑机接口技术可以应用到更广泛的生活和生产领域,正在康复训练、教育娱乐、智能生活、制造业等诸多方面逐渐为人类带来益处。在非植入式脑机接口领域,业界普遍关注工业和消费领域的研究。借助虚拟现实、增强现实、眼动仪、外骨骼等外设,利用非植入式脑机接口系统进行多场景应用探索如运动康复训练;利用用户脑波创作音乐和控制电器;利用用户情感识别数据个性化推荐用户潜在喜欢的产品;识别和感知用户情绪,进行预警提示,实现疲劳驾驶预警和安全生产等。
二、总体愿景
我们站在通往未知世界的伟大征程的起点,探索大脑必然是艰难而富有挑战的。在国家战略和顶层设计的指引下,随着科技创新的不断推进和人民群众的期待,脑机接口技术将在面向世界科技前沿、国家重大需求和人民生命健康的科技创新主战场上发挥重要作用。
因此提出“脑智芯连,思行无碍”总体愿景,并以这一愿景的实现为目标,试图勾勒出不久的将来。为促进“脑智芯连,思行无碍”这一愿景目标的实现,脑机接口系统应满足 “准确、高效、稳定、易用和安全”五大需求。脑机接口系统应具有准确的大脑意图解码算法;高效的信息解码效率,快速地反馈响应和执行任务;稳定的设备性能与抗干扰能力;易用、 轻便、舒适的使用体验;安全的植入、采集和信息传送保障。
脑机接口系统的五大需求支撑愿景实现
脑机接口应从性能指标和可用性指标两个方面有效衡量BCI是否满足五项要求。性能指标主要体现在四个容易量化的指标上:响应时间、识别准确率、输出指令数和菲茨吞吐量。可用性指标主要体现在易用性、长效性、鲁棒性、安全性和互操作性五个指标上。这些指标在不同的技术路线和不同的应用场景下有不同的要求,但基本涵盖了脑机接口技术和系统需求的各个方面。经过分析和产业研究,报告还给出了促进愿景目标实现的各项指标的建议值,从而为行业的技术创新和系统开发提供了一定的参考。
脑机接口系统的关键指标
脑机接口总体愿景的实现也离不开关键核心技术的支撑。关键技术包括采集技术、模拟技术、范式编码技术和解码算法技术。关键技术为不同的场景衍生出不同的应用。
Phillip Kennedy及其同事用锥形营养性(neurotrophic-cone)电极植入术在猴上建造了第一个皮层内脑机接口。
1999年,哈佛大学的Garrett Stanley试图解码猫的丘脑外侧膝状体内的神经元放电信息来重建视觉图像。他们记录了177个神经元的脉冲列,使用滤波的方法重建了向猫播放的八段视频,从重建的结果中可以看到可辨认的物体和场景。
杜克大学的Miguel Nicolelis是支持用覆盖广大皮层区域的电极来提取神经信号、驱动脑机接口的代表。他认为,这种方法的优点是能够降低单个电极或少量电极采集到的神经信号的不稳定性和随机性。Nicolelis在1990年代完成在大鼠的初步研究后,在夜猴内实现了能够提取皮层运动神经元的信号来控制机器人手臂的实验。到2000年为止,Nicolelis的研究组成功实现了一个能够在夜猴操纵一个游戏杆来获取食物时重现其手臂运动的脑机接口。这个脑机接口可以实时工作。它也可以通过因特网远程操控机械手臂。不过由于猴子本身不接受来自机械手臂的感觉反馈,这类脑机接口是开环的。Nicolelis小组后来的工作使用了恒河猴。
其它设计脑机接口算法和系统来解码神经元信号的实验室包括布朗大学的John Donoghue、匹兹堡大学的Andrew Schwartz、加州理工的Richard Anderson。这些研究者的脑机接在某一时刻使用的神经元数为15-30,比Nicolelis的50-200个显著要少。Donoghue小组的主要工作是实现恒河猴对计算机屏幕上的光标的运动控制来追踪视觉目标。其中猴子不需要运动肢体。Schwartz小组的主要工作是虚拟现实的三维空间中的视觉目标追踪,以及脑机接口对机械臂的控制。这个小组宣称,他们的猴子可以通过脑机接口控制的机械臂来喂自己吃西葫芦。Anderson的小组正在研究从后顶叶的神经元提取前运动信号的脑机接口。此类信号包括实验动物在期待奖励时所产生信号。
除了以上所提及的这些用于计算肢体的运动参数的脑机接口以外,还有用于计算肌肉的电信号的脑机接口。此类脑机接口的一个应用前景是通过刺激瘫痪病人的肌肉来重建其自主运动的功能。
2006年,布朗大学研究团队完成首个大脑运动皮层脑机接口设备植入手术,能够用来控制鼠标。
2008年,匹兹堡大学神经生物学家宣称利用脑机接口,猴子能用操纵机械臂给自己喂食——这标志着该技术发展已经容许人们将动物脑与外部设备直接相连。
2012年,脑机接口设备已能够胜任更复杂和广泛的操作,得以让瘫痪病人对机械臂进行操控,自己喝水、吃饭、打字与人交流。
2014年巴西世界杯开幕式,高位截瘫青年Juliano Pinto在脑机接口与人工外骨骼技术的帮助下开出一球。
2016年,Nathan Copeland用意念控制机械手臂和美国总统奥巴马握手。
2019 年 1 月,Chmielewski 作为约翰斯·霍普金斯大学一项脑机接口研究的参与者,通过一次长达 10 小时的手术,将六个微电极阵列(MEA)植入大脑两侧。随后,研究者一直试图通过不断的改善和训练,让他获得同时控制两个假肢的能力。
2020年8月29日,埃隆·马斯克自己旗下的脑机接口公司Neuralink举行发布会,找来“三只小猪”向全世界展示了可实际运作的脑机接口芯片和自动植入手术设备。
2022年3月,中国神经外科领域的一项新突破,脑机接口柔性电极技术在世界顶级学术期刊《科学》杂志上发表。这项突破是一种脑机接口柔性电极技术,由首都医科大学附属北京天坛医院研发,是提高手术精准度、保护神经功能的关键技术。该技术将仅有2微米大小的电极点组成的新型柔性电极,通过手术放到大脑上,帮助医生更精确“看”到大脑内部神经等,从而最大限度保护大脑功能。
2022年6月25日,我国自主研发的国内首款介入式脑机接口完成动物试验。
2022年12月,马斯克“脑机接口”研究,涉嫌违反美国动物福利法规定,被曝接受调查。
目前,全球各主要经济体均髙度重视脑科学的发展,推出了各自的脑计划。总体来看,在脑科学研究领域,美国独领风骚,欧洲、加拿大、澳大利亚、俄罗 斯、日韩等为第二梯队,以色列、中国等新兴力量已崭露头角。
一、美国
2014年,美国国立卫生研究院(NIH)启动了 “通过推动创新型神经技术开 展大脑研究(BRAIN)计划”,开启了 “BRAIN 1.0时代"。2018年4月,NIH 成立脑科学技术2.0工作组,并于2019年6月将《美国脑科学计划2.0》报告提 交给美国国立卫生院咨询委员会。这标志着美国正式进入“BRAIN 2.0时代"。
二、欧盟
2013年,欧盟启动了为期10年的人脑计划(Human Brain Project, HBP), 旨在通过计算机技术模拟大脑,建立一套全新的、革命性的生成、分析、整合、 模拟数据的信息通信技术平台,并促进相应研究成果的应用性转化。但在2015年,欧盟人脑计划放弃了在十年内实现人脑计算机仿真的研究目标,转而主攻认知神经科学和仿脑计算。
该计划也进而转变成一个拥有6大信息及技术平台、12 个子项目的国际组织。这6大信息及技术平台包括:神经信息平台,用于登记、搜索、分析神经科学数据;大脑模拟平台,用于重建并模拟大脑;高性能计算平台,用计算和储存设备去运行复杂的仿真计算并分析大量数据集;医学信息平台,用于搜索真实的病人数据,从而理解不同大脑疾病的异同;神经形态计算平台,借助计算机系统,模仿大脑微回路并应用类似于大脑学习方式的原则;神经机器 人平台,通过将大脑模型与仿真机器人体和周围环境连接起来,并对其进行测试。在此基础上,该计划成功举办了第10〜12届欧洲神经科学学会联盟(FENS)的神经科学大会(FENS论坛2016、2018、2020)。
三、日本
2014年,日本科学家发起神经科学研究计划,即日本脑计划(Brain/MINDS),旨在通过研究灵长类动物(穢猴)建立脑发育及疾病发生的动物模型。该计划受到日本文部科学省、日本医学研究与发展委员会为期10年共400亿日元(约合 3.65亿美元)的资助。2018年,日本成功绘制出了穢猴大脑的3D图谱。
同年9月,日本正式启动人脑计划(Brain/MINDS Beyond),研究对象从穢 猴大脑拓展到人类大脑,主攻以下5个方向:发现和干预初期的神经疾病,分析从健康状态到患病状态的大脑图像,开发基于人工智能的脑科学技术,比较研究人类和灵长类动物的神经环路,划分脑结构功能区域并开展同源性研究。
2019年,日本通过对2973个个体进行分析发现,精神分裂症、躁郁症、自闭症谱系障碍、重度抑郁症患者的月并月氐体白质结构存在相似变异,并且与正常个体差别显著。这为疾病分类提供了新的理论支持,在脑科学研究进程中具有重大意义。
四、中国
2016年,旨在探索大脑秘密、攻克大脑疾病、开展类脑研究的中国脑计划 正式启动。该计划以阐释人类认知的神经基础(认识脑)为“主体”,以研发重 大脑疾病诊治新手段和脑机智能新技术为“两翼”,主要解决大脑三个层面的认 知问题:一是大脑对外界环境的感官认知,如注意力、学习、记忆以及决策制定 等;二是对人类及灵长类动物自我意识的认知,即通过动物模型研究人类及灵长 类动物的自我意识、同情心及意识的形成;三是对语言的认知,探究语法及广泛的句式结构,用以研究人工智能技术。
一、脑机接口系统应满足的需求
1、准确
在脑部疾病诊断、行为辅助决策、外围交互控制等应用场景下,共性需求是系统能够稳定地做出识别准确率高的判断,即系统虚警概率低,识别准确,使外部计算设备能够对大脑的需求做出正确的反馈。识别正确率是系统的核心要求之一。
2、高效
脑机接口技术产业发展和应用的一个重要前提是高效。最好能达到和肢体响应一样甚至更快的效率,实现人机快速响应。指令交互、打字、控制机械外骨骼等应用场景下出现秒级延迟会给用户体验带来比较负面的影响。这就需要系统快速解码识别大脑的意图并给出反馈,而反应时间是衡量快速反应的核心关键指标。系统的快速响应性能需要范式编码、算法解码和系统通信技术的配合。在实际应用过程中,还要兼顾“快”、“准”、“稳”三个方面的协调发展。
3、稳定
脑机接口本质上是一套通信系统,在不同的应用场景下,都需考虑系统各项指标的稳定和抗干扰能力,即系统的长效性和鲁棒性。长效性是指系统需要保持长期性能稳定。系统能在较长时间内各项能指标不出现较大波动。鲁棒性是指系统在一定的外部干扰情况下,依然能够保持稳定的工作性能指标。在植入式脑机接口应用场景中,由于电极易于失效,系统更侧重长效性指标;而在非植入式场景,于信号易受干扰,更加侧重系统鲁棒性。
4、易用
易用包括两层意思:“轻便”和“便捷”。“轻便”是指非植入情况下脑机接口系统轻便易携带,植入情况下植入体体积小重量轻。笨重的脑机接口系统一方面可能会造成用户触摸时的身体压迫和不适,不利于长期使用。另一方面也不利于开展,难以采集大范围的脑信号,从而难以实现更大范围的场景应用。
“便捷”是指脑机接口系统操作方便。一方面需要要降低用户操作的复杂性,避免复杂的调试和维护。尤其在消费场景下,需要尽可能缩短设备部署时间和人机适应时间,实现快速交互。这就需要尽量减少和压缩模型的训练时间和调试时间,提高用户对产品的接受度。另一方面普及了无线信号传输,摆脱了有线束缚,使用起来更加方便。另外,可以考虑用智能外设进行系统化设计,比如智能耳机等终端设备,提高使用的舒适性和便携性。
5、安全
作为一个人机交互系统,在安全性方面需要考虑的因素包括:系统需要在软件和硬件方面有效防御外部恶意攻击,避免数据窃取或恶意篡改,系统需要内置安全自检机制;在机制和制度保障方面,需要有合法合规的信息技术伦理制度、法规、倡议、指南和标准,以保证神经隐私和神经权利不受侵犯,保障系统使用者的健康和安全。对于植入式脑机接口系统,在电极材料的选择上要考虑散热性能,并保证植入后人体的安全性。应限制植入物的质量、形状、功耗和应用场合,以避免损伤生物组织。对于非植入式脑机接口技术,使用不当可能存在潜在的人身安全隐患,因此有必要对脑机接口系统的使用安全提出严格要求。
二、脑机接口系统的关键指标
目前,脑机接口技术正从“学术科学探索”走向“应用转化落地”。为促进产业落地发展,下面从性能和可用性两个方面提出了满足五项要求的脑机接口系统关键指标。性能指标包括响应时间、识别准确率、输出指令数量和菲茨吞吐量,可用性指标包括易用性、长效性、鲁棒性、安全性和互操作性。易用性指标进一步体现在准备时长、轻便性和舒适性上。
脑机接口系统的关键指标
1、性能指标
在脑机接口的研究中,信息传输速率(ITR)常被用作评价系统性能的指标。ITR的大小与系统的响应时间、识别正确率和输出指令数量相关,是综合反映BCI系统多方面性能的指标。然而,仅将ITR作为性能指标往往不能反映反应时间、识别准确率和输出指令量各自的重要性,甚至可能导致某些关键指标被忽略。因此,响应时间、识别准确率、输出指令数和菲茨吞吐量四个方面对BCI系统的性能同样起着至关重要的作用。
1)响应时间
响应时间指脑机接口系统响应用户单次脑意图所需的时间,包括单次响应所需的信号采集时间、脑信息解码时间(也称计算时间)和系统通信时间三部分。其中,所需信号采集时间是指脑机接口系统采集生理信号进行解码所需的时间。脑信息解码时长是指系统对采集到的信号进行解码以理解用户意图所需的时间。系统通信时长是系统中模块之间数据包传输的时间延迟。响应时间能有效反映脑机接口系统的通信效率,也是反映人机交互流畅度的关键指标。在不同的范式和应用场景下,系统的响应时间差异很大。
对于头皮脑电图和皮层脑电图等实时较高的电信号采集系统来说,比较理想的响应时间是:在脑状态检测场景下建议不大于 10 秒,在神经调控场景和对外交互场景下建议不大于 1 秒。对于以功能近红外光谱(Functional near-infrared spectroscopy,fNIRS)为代表的信号采集系统来说,由于血流动力学数变化较触发事件具有滞后性,因此此类系统的交互响应时间较长。
2)识别准确率
识别准确率是指脑机接口系统为识别人脑意图进行解码的正确率,是衡量系统性能的核心指标。在脑机打字、脑控机器人等特定场景下,识别准确率往往用任务成功率来表示。任务成功率是指成功控制任务的次数与控制任务执行的总次数之比。理想的识别准确率在脑状态检测的情况下不应低于85%,在神经调节的情况下不应小于95%,在外部交互的情况下不应小于95%。对脑机接口离线数据进行调参时,往往因为样本量较小而容易造成模型的过拟合。
3)可输出指令数量
可输出指令数量就是脑机接口系统能够解码脑意图种类,该指标能够反映系统的交互能力。能输出的指令越多,系统可解码的大脑意识就越丰富,能执行任务的行为就越丰富。因此,在睡眠检测、情感识别、脑机打字等场景中。可输出指令数量对评价系统的性能有很高的参考价值。从理想值来看,建议睡眠检测场景不少于5种睡眠,情绪识别场景不少于4种情绪,脑机打字场景不少于40种输出字符。在机器人、机械臂、无人机等复杂外部设备的控制中,自由度不应少于6种。可输出的指令数量与实际需求有关,应根据具体场景需求确定最佳范围。
4)菲茨吞吐量
控制能力是指脑机接口系统将大脑神经活动转化为外设在实际场景中完成复杂控制操作的能力。脑机接口系统的控制能力和工作效率可以用菲茨吞吐量指标来衡量。脑机接口系统的菲茨吞吐量定义为:难度系数与移动到目标位置所需时间的比值,其中难度系数是交互移动距离与目标大小比值的对数。菲茨吞吐量来源于菲茨定律(Fitts Law),是一种人体运动预测模型,主要用于人机交互和人机工程学。难度系数和吞吐量分别用于衡量任务和控制效果。在脑机接口的研究中,菲茨吞吐量经常被用来作为系统控制效果的衡量指标。
以脑控虚拟鼠标移动为例,虚拟鼠标从初始物体A移动到目标物体B的难度系数由AB之间的距离和目标物体B的尺寸决定,AB之间的距离越大,目标物体B的尺寸越小,难度系数越大。在不同的难度系数下,虚拟鼠标到达目标所需的时间不同。菲茨吞吐量是一个综合考虑移动速度和控制精度的指标。数值越高,脑机接口系统的控制效果越好。通常0.7 bits/s的Fitz吞吐量可以达到更平滑的控制效果,1 bits/s是更理想的指标。
2、可用性指标
可用性也是脑机接口系统产业化的关键,是性能指标之外的另一个系统评价维度。系统可用性的度量指标包括:易用性、长效性、鲁棒性、安全性和互操作性。
1)易用性
易用性又可通过脑机接口系统的使用准备时长、轻便性和舒适性三个指标反映。
准备时长指人员使用脑机接口系统前所需的准备时长和人机协同训练时长的总和。准备时间包括调试准备时间、阻抗调整时间等。人机协同训练时长与系统用户使用熟练程度以及解码算法是否需要现场采集训练数据有关。此外,部分脑机接口系统需要为不同的用户定制不同的解码算法参数,这也会导致人机合作的训练时间较长,从而降低系统的可用性。非植入式脑机接口系统的理想准备时间建议不超过3分钟。植入式脑机接口系统需要复杂的植入过程,因此需要很长的准备时间。有必要尽可能地优化植入方法,以提高系统易用性。
轻便性指脑机接口系统的轻质与便携。轻质是指对用户来说符合人体工学,不会造成明显的伤害和负担。通常以重量指标衡量轻便性,为保证人体颈椎以上部分不受伤。理想的头戴式脑机接口系统重量不应超过500克,不超过200克将是更理想的目标。便携是指易用和携带,信号传输方式是衡量便携的重要指标之一。比较理想的便携方式是摆脱有线连接,以蓝牙、Wi-Fi、超宽带或其他先进的无线通信方式传输数据。
舒适性体现在范式设计、外形设计、选材等方面。目前,业界广泛使用的范式大多源于20世纪90年代。经过30多年的发展,范式虽然为实验研究奠定了基础,但交互方式普遍不符合人类的自然行为。因此,用户对消费产品的接受度和配合度较低,甚至其在医疗领域的应用也受到限制。因此,舒适性由定量定性的体验、满意度等来衡量,尤其是对于脑机接口的消费级产品的落地。
2)长效性
长效性是指系统能够稳定持续使用的时间,是衡量系统稳定性的重要考虑因素。在非植入场景中,长效性体现在系统续航时间长。比如在娱乐游戏时,系统的性能不会因为用户出汗等干扰而下降。在植入场景下,长效性是系统不会受到生物组织分泌和免疫系统的干扰,导致性能力下降,续航时间需要能够保证持续8小时以上的脑电信号传输和分析。因此建议在理想的非植入场景下,单次稳定可用时间应不低于3小时。在植入场景下,一些国家规定稳定可用时间不得少于一年。一般情况下,医疗器械的理想植入时间在10年以上。
3)鲁棒性
鲁棒性指用于衡量脑机接口系统抵抗外界干扰的能力。脑机接口系统需要在各种外界干扰环境下使用。正常环境本身就有大量的干扰信号,此外还有强磁环境、超声诊疗环境、放射治疗环境等。这就要求脑机接口系统能够有效屏蔽其环境中的大部分外界干扰,保证交互响应时间、识别准确率等性能指标保持在较高水平。此外,大脑在使用过程中的状态并不是一成不变的,因此鲁棒性还体现在自适应能力上,可以随着用户状态的变化进行自适应调整,保证系统的性能指标在小范围内波动。
4)安全性
安全性是脑机接口系统可用性的重要指标。一是要保证脑机接口系统的整体安全和数据安全。硬件和软件具备基础的安全防范能力和手段,保护措施到位,确保能够有效抵御外部攻击,避免系统被篡改做出错误指令。同时要保证用户的信息不被泄露,尤其是需要联网使用的设备,比如解码算法、云系统等,需要保证信息安全;二是保证人身健康安全。在满足常规安全要求的基础上,应制定更适合BCI系统的特殊安全要求。三是应符合科技伦理安全。要制定完整的科技伦理体系,确保隐私信息不泄露、风险可控、生命权得到尊重、人类福祉得到增进、公平正义得到保障。
5)互操作性
互操作性是脑机接口系统应用和广泛发展的重要指标,反映了脑机接口系统实现跨系统接入、双向连接和交互控制的能力。一方面,互操作性体现在同类型系统之间一致的框架和接口上;另一方面,脑机接口系统可以在计算机、手机、增强现实(AR)设备和虚拟现实(VR)设备等其他智能终端上实现互操作和即插即用。系统应根据这方面的技术标准要求,开发相关接口和可互操作的系统平台。互用性能力指数可以通过系统符合互用性标准的程度来衡量。
脑机接口作为新兴技术,为大脑与外界的直接交互提供了新的解决方案,在新一轮技术升级中被寄予厚望。脑机接口产业落地有赖于关键技术的突破和创新。目前全球在脑机接口关键技术研究方面发展 蓬勃, 但依然存在亟需解决的若干问题。对此,业界也正在尝试多种手段予以突破。
脑机接口关键技术包括采集技术、刺激技术、范式编码技术、解码算法技术、外设技术和系统化技术。其中,采集技术的研发集中在采集端和信号处理端。常规采集技术包括电采集、磁采集和近红外采集,其中电采集是主流研发方向,而磁和近红外采集技术由于成本和技术成熟度的限制,离应用还比较远。
信号处理端涉及模拟芯片和数字芯片。目前脑机接口系统使用的数字芯片多为业界通用芯片,因此主要介绍模拟芯片的发展。刺激技术重点介绍脑深部刺激闭环控制的进展和脑机接口技术在盲人辅助领域的最新进展。范式编码和解码算法技术介绍了当前主流研究进展。由于外控技术和系统化技术的创新多在于 工程集成,因此不在此介绍。
脑机接口技术的应用场景按照信息流动可以分为三类:脑状态检测、神经调控、外交互。从信息流的角度来看,脑状态检测是指信息从大脑流向外部和外设,神经调控是指信息从外部和外设流向大脑,对外交互是指信息的双向流动。
脑机接口关键技术
一、采集技术
1、植入式电极
植入式微电极是脑机交互的关键基础,广泛应用于基础神经科学、脑疾病的诊断和治疗、脑机交互通信等领域。植入式微电极通过把以离子为载体的神经电信号转换成以电子为载体的电流或电压信号,从而获得大脑神经电活动的信息。植入大脑的微电极可以准确记录电极附近单个神经元的动作电位,具有较高的空间和时间分辨率,从而实时监测大脑活动。传统的植入式微电极由金属、硅等硬质材料制成,硬质电极主要有密歇根电极和犹他电极。随着微纳加工技术和电极材料的不断发展,微电极趋向于柔性、小型化、高通量和集成化,形成了以微丝电极、硅基电极和柔性电极为主的多元化发展局面。
高性能柔性微电极对于长期稳定的慢性记录具有重要意义。微电极与脑组织存在机械不匹配,会对生物体的正常活动造成继发性脑损伤,因此不适合长期慢性实验。具有高生物相容性的柔性微电极器件有利于缓解免疫反应,提高信号质量,对实现脑活动长期稳定的慢性记录具有重要意义。
高通量微电极将为拓展全脑神经科学的研究奠定重要基础。为了获得更丰富的神经元动态,需要神经微电极同时记录尽可能多的单个神经元的电活动。现有植入微电极的通量远小于大脑神经元的数量,因此开发新型高通量微电极,实现高时空分辨率的脑电信号批量采集,对于神经环路活动跟踪、全脑尺度神经网络功能分析等基础神经科学研究非常重要。
多功能微电极能有效促进多种兴奋模式综合调节。植入式微电极集电刺激、药物注射和光刺激功能于一体,不仅可以读取生物体的脑活动信息,还可以调节生物体的生命活动,实现生物体与外部设备的双向通讯。研究多功能神经微电极装置,构建闭环系统,可以实现癫痫等脑部疾病的诊治和神经功能的恢复。
2、非植入式电极
非植入式电极具有广泛的应用。非植入式电极可以直接在头皮上采集脑电信号,无需手术植入。因此也被称为无创电极,其安全性和无创性更容易被用户接受,因此被广泛应用于非临床脑部疾病诊疗、消费脑科学应用等场景。
传统的湿电极尽管信号质量好, 但其专业的操作需求,耗时长,用后清洗等固有缺点无法规避。因此无膏的干电极技术逐渐发展起来以适应新的应用场景和需求。基于金属材料或导电聚合物材料的多脚柱式/爪式干电极、基于导电纤维刷毛式干电极、基于微机械加工工艺的微针电极及电容式电极等,提高使用便捷性的同时,也通过材料改进和结构设计优化不断地降低电极与皮肤的接触阻抗,提高使用舒适度和应用性。
改进的干电极是电极行业的主流选择。随着基于头皮脑电的脑机接口系统在便携性、快速应用性和舒适性等方面的应用需求日益增加,电极的改进成为亟待解决的关键问题。传统的湿电极虽然信号质量好,但其固有的操作要求专业、耗时长、使用后需清洗等缺点无法避免。因此,无浆料干法电极技术逐渐发展起来,以满足新的应用场景和要求。基于金属材料或导电聚合物材料的多足柱/爪型干电极、基于导电纤维的刷型干电极、基于微加工技术的微针电极和电容电极等。不仅提高了使用的便利性,还通过材料改进和结构设计优化,不断降低电极与皮肤的接触阻抗,从而提高使用舒适度和适用性。
凝胶半干电极具有潜在的广阔应用前景。干电极实现了脑机接系统的便捷应用,但其与头皮的电连接仅靠微量的汗液,接触阻抗高,且强烈依赖于压力,因此舒适度和信号质量及稳定性成为该项术需要突破的技术难题。半干电极利用材料或结构特性,释放少量电液到头皮,以降低电极与头皮的界面阻抗。基于材料体系的凝胶干电极物理化学特性可调,通过材料组分配比的优化可兼顾电化学性和机械特性,从而得到使用舒适度较好且信号质量可与湿电极匹敌 的性能,是一种极具应用前景的电极技术。
3、芯片
随着集成电路技术的飞速发展和电路与神经科学融合的不断探索,脑信号采集技术正朝着小型化、轻量化、高通量和分布式采集的方向发展。BCI的应用、算法、硬件和范式的研究内容逐渐丰富。植入式和非植入式脑机接口系统通过电极和采集硬件对脑信号进行采集、处理和解码,从而实现对脑科学基础理论、脑疾病和脑控制外设的探索和研究。脑信号采集芯片是将脑信号直接转换为数字信号的核心硬件,也是读取和解码脑信号、诊断和调节脑疾病的工具。
根据脑信号的生理特点和应用场景,定制化脑信号采集芯片的设计存在诸多技术挑战。精密放大器是脑信号采集芯片的核心模块,需要满足脑机接口应用场景中多项技术参数的要求。对于脑信号来说,其幅度较弱(几十μV到几个mV),频率低(0.5 Hz到数kHz),因此容易受到外界噪声的干扰,导致信号质量较差。为了保持最佳的信号质量,需要对脑信号采集模块的一些关键参数进行优化,如信号噪声、共模抑制比(CMRR)、电源抑制比(PSRR)、增益匹配、运动伪影等。脑信号采集的诸多参数相互制约,多个参数的整体优化是脑信号采集芯片设计的核心问题之一。
信号噪声是脑信号采集过程中最大的干扰源之一。由于前端放大器的闪烁噪声与脑信号在频谱上有部分重叠,所以简单的滤波很难提取纯净脑信号。因此,采用斩波放大技术将采集的信号调制到更高的频率,以避免放大器的闪烁噪声。斩波技术在交流耦合仪表放大器中实现了噪声和功耗之间的良好平衡,但在斩波调制过程中,放大器的输入阻抗会降低到兆欧范围以下,导致信号在进入放大器之前发生衰减。为解决输入阻抗降低的问题,有团队提高了正反馈环路的输入阻抗。还有团队使用电容组来校准输入阻抗升压电路的电容,也有团队使用调整电路耦合的方式来切换斩波器和输入电容器的设置,以避免斩波器调制导致的输入阻抗降低。
共模抑制比是衡量系统对环境干扰响应的关键参数。对于微弱的脑信号,高共模抑制比可以保证信号不被共模干扰掩盖,从而提高信号质量。此外,在多通道神经信号采集过程中,由于电极植入脑内后的一系列生物相容性问题,电极的阻抗可能会随着植入时间的增加而明显增大(数月后可达100 kω至数 MΩ),进而影响脑信号的信噪比以及特定系统的共模抑制比。为了保证采集信号的质量,前端放大器电路采用共模反馈技术和共模前馈技术,提高系统级共模抑制比。
采集芯片的微型化设计是植入式脑机接口系统的核心技术挑战之一。为了将采集芯片缩小到可植入的尺寸范围,片上有源/无源器件的小型化是相关研究中的一个技术难题。采用电容耦合的全差分放大器结构,利用晶体管搭建的伪电阻结构,可以大大减小芯片上无源器件的面积。同时,伪电阻提供了更大的阻抗和更低的高通截止频率,适用于设计微型化的脑信号采集芯片。采用时分复用/正交频分复用等技术,通过一个固定的采集单元同步采集多个通道的脑信号,也可以显著减小片上面积。
针对不同的脑机接口应用和采集芯片面临的一些技术问题,国内外很多团队都提出了解决方案。例如,为了解决采集过程中电极间直流偏置引起斩波放大器输出饱和的问题,一种直流伺服反馈环技术通过积分器从输出中提取DC分量并反馈到输入,有效抑制了电极间直流偏置。
针对采集芯片的超低功耗要求,有团队设计了基于反相器结构的超低压斩波放大器,非常适合植入场景。针对芯片微型化的问题,放大器和DAC相结合的数模混合反馈技术可以大大减小采集芯片的片上面积。
针对脑信号采集过程中的共模干扰,基于电荷泵的共模反馈技术通过动态反馈输入端的共模干扰信号,可以有效抵抗高达15V的共模干扰。对于采集芯片的无线供电,将线圈的无线传感传输技术应用于植入式脑机接口芯片。通过外部传输线圈、中继线圈和片上耦合线圈,实现对体内采集芯片的无线供电和采集脑电信号的无线传输。
体表网络无线传输技术解决了无线供电时线圈难以对准的问题。采集的信号和能量利用受试者的体表进行无线传输,适用于可穿戴式脑机接口场景。在提高系统集成度方面,目前已有基于AI的集信号采集、存储、信号分类识别于一体的脑机接口片上系统,实现了较高的系统集成度。对于高通量植入式脑机接口芯片,有公司设计了具有动作电位识别的高集成度采集芯片,与数千个柔性电极结合,实现高通量脑信号的采集。
二、刺激技术
1、闭环脑深部电刺激技术
脑深部电极刺激(Deep Brain Stimulation,DBS)一种非常具代表性的植入式电极刺激技术。DBS通过植入体内的脑起搏器发放电脉冲,刺激癫痫、帕金森的病灶脑区,抑制病灶区神经元的异常无规则放电,进而抑制相关症状,使患者恢复自如活动和自理能力。传统的 DBS 调参需要基于微电极信号分析、刺激效果分析、影像定位、 核磁分析等多技术手段选择治疗触点。借助脑机接口技术, 脑内电极不仅具有单向刺激功能,还可进行周围神经元信号采集,以做到精准触点选择。就技术发展进度看,目前可以做到信号采集之后由医生根据生物标志物和与患者的交互反馈进行触点选择,未来还将向自适应角度发展,自适应技术研发方向包括:
通过优化的信号处理方法实现自适应调控。如在机器学习、深度学习基础上对患者脑电数据进行预测分类,为医生提供分类结果以助于诊断,提升触点选择的精准度。另外,在患者体态姿势发生变化导致电极与靶组织之间距离改变时,例如咳嗽、打喷嚏、深呼吸时,可根据诱发复合动作电位调控刺激以避免发生瞬时过度刺激。
通过刺激参数空间拓展改善自适应调控。刺激参数空间包括触点、幅度、频率、脉宽的选择。目前在常用单极恒频刺激的基础上已开发交叉电脉冲模式、变频刺激及多触电不同频刺激技术,极大地拓宽了刺激参数空间, 实现更好的症状调控。
依托多样生物标志物实现自适应刺激调控。当前国内外知名 DBS厂商正在尝试基于生物标志物实现自适应刺激调控,例如检测神经递质浓度,通过血清素、去甲肾上腺素、多巴胺脱氧血红蛋白度、氧合血红蛋白的浓度识别治疗效果并作为依据来动态调整刺激幅度。也有基于血流水平、范围或预定血流值矩阵等血流信息调节刺激幅度、脉冲宽度、脉冲率和占空比等指标。
通过磁共振相融 DBS 技术实现自适应调控下的脑网络探索。现有磁共振兼容 DBS 技术解决了在强磁场下电极发热、移位及感应电流等安全隐患,使植入 DBS 的患者能在 3.0T 磁共振下进行长时间的同步刺激及扫描。在解决临床需求的同时,也使DBS成为探索刺激相关脑网络变化的直接媒介,通过功能磁共振解析刺激相关局部及整体脑网络改变,为新靶点的发现及适应症的拓展提供依据。
2、视觉调控技术
植入式视觉调控技术对盲人群体提高生活质量具有重大意义,相关研究已经开展。全球绝大多数研究团队在开环视觉重建的研究中,研究方向逐渐从视网膜刺激向皮层刺激转移。目前主要集中在电刺激初级视觉皮层( V1 )以获得人工视觉感知。这就需要进行刺激电极的植入。最新的实验已经植入了超过 10 块犹他阵列,通道数达到 1024 。 该系统还包括采集视频的摄像头,采集到的图像信息通过信号处理获得简单的二维灰度图像(目前还没有具有色彩的植入式人工视知觉输入),并据此刺激初级视觉皮层神经元。受试者通过植入电极可以在有限的视野范围内看到一些灰度调制的低分辨率点阵图像。目前的研 究结果表明,用小电流电刺激初级视觉皮层神经元( V1 neurons)会 激活直径数百微米的皮层区域,从而获得简单的视觉知觉,称为光幻视(phosphenes)。电刺激可以改变大脑皮层的信息流, 影响到正常视觉观测内容。由于电刺激是相对粗糙的刺激方式, 因此获得的视觉感知也相对粗糙。目前研究致力于通过多个电极同时刺激,让受试者感知到具体图像或连贯动作。2020 年发表在 Science 上的研究结果表明, 通过植入大规模 1024 通道电极并进行训练,可以使非人灵长类正确识别字母,辨识运动方向等。如何通过不同模式刺激增强受试者感知连贯形状的能力,并最大限度向其传递视觉信息依然是未来研究重点。
目前的植入式视觉调控研究多为开环脑机接口系统,开环脑机接口系统难以实现精确刺激模型,且电刺激也难以与真实的视觉刺激保持一致, 因此存在不可控风险且难以实现精细视觉输入。因此闭环视觉调控是未来重要的技术探索方向。
三、范式编码技术
大脑的各种思维与响应活动千变万化,且同时发生,因此很难直接从中准确解码特定类型的活动。在脑机接口系统中,用范式来表征对预定义的大脑意图的编码方案。范式定义为:在编码任务中, 对希望识别的大脑意图用可检测、可区分、可采集的脑信号予以对应,从而实现对大脑意图的可识别输出。在过去的几十年中,出现了许多脑机接口范式,常见典型的有运动想象范式、稳态视觉诱发电位范式、P300 范式。这些范式往往根据是否有外部刺激和辅助而分为被动式和主动式范式。
1、被动式范式
视觉诱发电位刺激范式 P300 朝向界面布局优化、人脸图像拼写和融合物理刺激方向发展。传统的视觉 P300 电位刺激范式下,拼写器允许受试者通过闪烁不同的行和列来选择目标,但没有考虑两个相邻符号连续闪烁对结果的影响。近年有大量研究针对 P300 电位刺激范式的拼写界面布局开展优化工作,有效消除了相邻符号闪烁带来的影响。一些研究发现面部符号可以比传统 P300 字符拼写范式诱导更高的 P300 电位。因此许多研究尝试用人脸图像代替数字或字母符号,使每个符号在以一定频率闪烁时都会变成人脸图像,而不是简单的颜色或大小变化,实现了 P300 电位刺激范式的解码性能提升。最近也有研究发现,在视觉 P300 电位刺激范式中添加其他形式的物理刺激可以提高使用者的表现,例如使用偏光镜增强刺激、基于积极情绪的视听组合刺激、引入声音和视频刺激等方式。因此将 P300 电位与其他物理刺激融合的范式研究也是近年的热点。
稳态视觉诱发电位(Steady-state visual evoked potentials,SSVEP) 刺激范式朝向更高效、更舒适和更自然发展。SSVEP 范式脑机接口主要应用方向包括:高速率脑机接口打字交互系统、特殊群体脑机报警系统、自然场景的脑机目标选择系统等。为支撑上述三大应用场景,SSVEP范式的主要发展趋势包括:
更高效:SSVEP 范式编码从最初 4 目标编码已发展至 160 目标编码,且编码的识别响应性能也在持续提升,因而实现的高速率 SSVEP-BCI 系统的性能也在不断提升。后续 SSVEP 会持续研究更高效、可分性更好的范式编码。
更舒适:SSVEP 范式刺激的最佳频带为 8~15Hz,该频带的多目标闪烁刺激虽然实现的系统性能优异,但也容易诱发视觉疲劳, 因而在实际落地应用中受到了一定的阻力。目前 SSVEP 舒适刺激的方式主要包括降低亮度变化率、提高刺激频率、减小刺激目标面积以及采用空间编码(外周视野) 刺激等。上述研究已取得了较大的进展,并不断继续推进中。
更自然:SSVEP 刺激范式的每个刺激块需要按固定频率进行闪烁且具有一定的面积,因而在实际应用过程中仅与脑机打字场景最贴合, 即将字符绘于对应的闪烁目标块上即可。目前已有部分 SSVEP 范式采用空间编码的方式将中央视野区域空出,在视野外周进行刺激编码,进而实现更贴近自然应用场景的应用。也有适当降低 SSVEP 闪烁块面积并与生活场景结合的编码思路,受限于刺激面积变小对响应强度的影响,为保障系统的识别正确率与响应速度,此类应用的 SSVEP 编码目标数较少。此外,SSVEP 的主要响应脑区位于后脑枕 叶,因而往往需要佩戴脑电帽,不利于生活自然场景使用。为解决该问题, 部分研究采用时频混合或时空频融合的编码方式,尝试提升无毛发区的 SSVEP 响应强度,取得了一定的进展。为了 SSVEP 脑机接口在生活场景落地,上述研究仍在持续推进中。
2、主动式范式
运动想象(Motor Imagery, MI)范式朝向更精细发展。运动想象是一种非常重要的主动式脑机接口范式,用于识别大脑对四肢和舌头的运动意图。其无需外界条件刺激和明显的动作输出就能诱发大脑感觉运动皮层的特定响应。现已广泛应用于基于脑机接口的假肢、机械臂和轮椅等设备控制、字符拼写及临床中风康复治疗等场景。
基于运动想象范式的脑机接口已经发展多年,经过数十年的研究,大肢体部位的 MI 控制已经基本发展成熟, 而对更细微运动做出想象并有效识别(例如不同手指的伸缩、握拳、不同手势的运动想象等)是运动想象范式编码的发展方向。
运动相关皮层电位范式朝向多肢体运动意图解码和连续运动解码发展。运动相关皮层电位(Movement-related cortical potential, MRCP) 是一种可以从低频头皮脑电中捕捉到的与运动规划、执行相关的神经活动信号。MRCP 主要由三部分组成,即与运动准备相关的准备电位(Readiness potential, RP)、与运动发生、起始相关的运动电位( Motor Potential, MP ) 以及与运动执行、运动性能相关的运动监测电位(Movement-monitoring potential ,MMP)。相较于 SSVEP 和 P300 等被动式脑机接口范式, MRCP 和运动想象是不依赖于外部刺激的、由人体真实运动意图诱发的主动式脑机接口范式。而相较于运动想象,MRCP 不依赖于重复的运动想象。因此, MRCP 具有自然、真实、可以反映人的实际运动意图等优点。典型的 MRCP 范式包括点到点的上肢运动(如 center-out)、连续运动追踪式的上肢运动(如 PTT)、指定动作类型的上肢或下肢运动(如手腕内旋/外旋)等。由于 MRCP 具有可反映运动意图的特性, 其对发展与运动康复、运动功能诊断、日常生活辅助等相关的运动脑机接口具有重要价值。目前,MRCP 主要发展趋势包括从单肢体到多肢体的运动意图解码、从离散分类问题到连续回归问题的连续运动参数解析、与神经假肢、外骨骼、机械臂等 外设结合的人体运动增强和康复治疗等。
四、解码算法技术
1、植入式主流解码技术
卡尔曼滤波器成为当前主流解码方法。以运动控制为例, 早期的植入式脑机接口解码大都使用维纳滤波器线性解码系统。此类解码系统不包含运动学过程模型,而是将群体神经元的反应作为输入,将空间坐标内的运动速率作为输出,通过最优线性估计的方法进行解码。早期很多脑机接口实验室都用该方法进行解码。后来,为满足控制过程中的解码连续性需求,需要有运动模型作参考以修正和优化解码器输出,卡尔曼滤波器成为当前的主流解码方法,其在离线、实时以及临床试验中都得到了广泛的应用。卡尔曼滤波的优点是算法简单,而且可以不需考虑神经元具体编码内容即可解码,因此可以实时快速解 码。其缺点在于解码效果一般,且每次实验之前都需较长的校准时间,另外,卡尔曼滤波解码的系统鲁棒性相对较差。为解决这些问题,国际上提出了很多方法,其中最具前景的方法主要包括类脑解码器设计和神经学习。
类脑解码器成为新一代解码方法。最近一些皮层神经元群体编码特性研究结果表明,虽然大量的神经元被记录并用于脑机接口的解码,但因大脑神经元的信息编码相对于运动是冗余的,用于控制的神经元 群体反应维度要低于神经元数量。因此在理论上可以找到一个隐藏或潜在的低维状态空间来描述在该控制条件下的有效神经元群体反应,并将这个状态空间中的潜变量映射到相关行为或运动控制变量用于运动控制。将这些编码特性应用于解码器设计,得到类脑的解码器可用于脑机接口控制。目前学术研究结果表明,此类稳定子空间是存在的。此方法的优势是虽然记录到的神经元群体信号有高噪声且会发生变化, 但其在子空间上的动力学过程一直稳定,因此可以有效去除不稳定记录以及神经元发放变化带来的干扰,从而获得更为鲁棒的脑机接口系统。
神经学习提供新的解码思路。当前还有一种前沿的脑机接口解码方法是通过训练大脑进行学习来使用脑机接口,即神经学习(也称脑机学习)。脑机接口系统中存在两个学习系统,一个是解码器的机器学习,另外一个就是具有强大学习能力的神经系统。脑机接口初期的实验都体现了大脑学习本身的重要意义,但如何让大脑学会使用脑机接口的解决方案尚不完善。脑机接口系统在使用过程中,闭环控制的练习可以导致神经元为适应用户的运动系统而发生变化。因此,闭环过程中的解码器与开环时的解码器可能完全不同,结果表明提供快速的反馈比过滤错误更为重要,因此诞生了改进闭环性能的技术,一般被称为闭环解码器适应(Closed-Loop Decoder Adaptation ,CLDA)。此类方法根据闭环脑机接口使用期间记录的数据实时改进解码器,让解码器根据用户当前神经信号的性质来决定解码器的结构。此外,用户的神经系统也在实时学习如何应用这个解码器。两者的相互结合以及相互促进得到了一个“脑机双学习”的融合式脑机接口系统。此系统可以在神经信号不稳定时依然输出稳定的表现,且仅需少量校准即可即插即用,同时鲁棒性极高,在适应新的应用场景时有同时保留已学控制技巧并探索新控制方式的特性,因此极大的提高了脑机接口系 统在实际应用中的可能性。
2、非植入式主流解码技术
分解算法是非植入式脑机接口系统的主流解码算法。分解算法广泛应用于脑机接口系统的去噪与意图解码。分解算法通常使用矩阵分解或提取空间滤波器来增加不同类别意图的解码可分离性。大多数分解算法都是为特征提取而设计的,矩阵特征分解后通常需要连接到分类器。独立成分分析(ICA)是使用广泛的分解算法之一。ICA 一方面可对不同源信号进行特征分析,另一方面还可用于去噪(例如去除眨眼成分、伪影信号等)。在解码脑意图时,不同脑机接口范式的分解算法存在差异。运动想象范式解码多采用通用空间模式(CSP)及衍生算法。CSP 可最大化不同分布的方差信号, 例如对左右手运动想象进行分类。在 CSP 基础上逐渐衍生出滤波器组 CSP (FBCSP)、提议判别滤波器组 CSP(DFBCSP)、临时约束的稀疏组空间模式(TSGSP) 等。稳态视觉诱发电位(SSVEP)解码多采用典型相关分析(CCA) 及衍生算法。CCA 算法有效解决了以往非空域分解算法难于处理的导联挑选问题。近十年学者提出诸多 CCA 改进算法,例如滤波器组CCA(FBCCA)、任务相关成分分析(TRCA)、集成 TRCA(eTRCA)、任务相关成分分析算法( mTRCA 、TDCA 等)。视觉 P300 电位解码算法依托 xDAWN 算法和 DCPM 算法。目前有增强 P300 诱发电位的xDAWN 算法以及将空间模式提取和模式匹配结合的DCPM 算法。
近十年以黎曼几何为代表的流形算法在脑机接口系统中广泛应用。黎曼几何算法通常可以用于对称正定(SPD) 矩阵的空间上应用运算, 进而提供一个统一的框架来处理不同的脑机接口范式。例如基于最小均值距离(MDM)和带有测地线滤波(FgMDM) 算法对 MI任务进行分类。MDM 类似于使用欧式距离而不是黎曼距离的最近邻算法。FgMDM 将协方差投影到切线空间,将线性判别分析(LDA) 应用于切线向量,然后将它们投影回带有选定分量的 SPD 空间。黎曼框架由于具有扩展性,因此易于多场景应用并与机器学习方法结合。
深度学习算法在近年被引入脑机接口解码研究。基于 CNN 网络结构设计的 Shal-lowConvNet 和 DeepConvNet 模仿了 FBCSP 中的时间和空间滤波器,性能接近 FBCSP。进一步利用深度可分离卷积代替普通卷积提出的 EEGNet 在 SSVEP 范式应用中取得了很好的效果。CNN 网络模型具有的批处理归一化功能也可用于视觉P300 范式的解码。进一步还有诸多深度学习的改进模型,例如CNN-RNN架构、CNN-LSTM 架构。还有一些研究侧重于脑机接口的数据扩增,进而得到更多的训练数据,提升解码效果。典型的数据扩增网络模型包括循环的对抗网络(RGAN)、增强 MI 数据的 C-LSTM 模型等。
迁移学习算法的进步是脑机接口走向应用落地的关键。许多机器学习算法的训练数据与测试数据来自相同的特征分布。此类算法在脑机接口应用中,虽然面向单个被试在短时间内可以取得良好性能,但在不同被试或相同被试不同时间的情况下性能则大幅下降。这些问题被称为跨被试和跨时间的可变性问题。为了减轻这两个问题的影响, 通常需要一个校准阶段来在每个会话开始时收集足够的训练数据,但这会明显增加系统使用的准备时间。迁移学习旨在利用源域中的先验信息改进目标域中预测函数的学习过程,解决跨主体的可性问题。脑机接口的早期迁移学习算法侧重于分解算法的改进。而后黎曼几何法进一步促进了脑机接口的迁移学习算法进步。近年来,深度学习算法也开始应用于迁移学习领域。此外,其他领域的迁移学习方法也在脑机接口研究中有一定的借鉴, 例如信息几何(STIG)的光谱传输算法在快速序列视觉呈现范式(RSVP) 的验证;融合转移分量 分析(TCA) 和联合分布适应(JDA) 提出的用于脑机接口的流形嵌 入知识转移(MEKT)方法。
一、脑状态检测
1、脑功能评估与辅助诊断
1) 场景描述
脑机接口系统已逐步应用于脑功能评估与辅助诊断。由于头皮脑电(Electroencephalograph,EEG)信号具有高度非线性且随机特点,使用信号处理技术可以很容易区分正常和异常的大脑活动, 因此脑部受伤等症状或疾病都可以使用脑电图来诊断许多与神经病学相关的疾病,例如癫痫、睡眠障碍、肿瘤、抑郁症、自闭症等疾病。
2)关键需求
在准确方面,基于脑信号解码的疾病辅助诊断已逐渐在临床上应用落地。经过对产业相关技术现状的调研,此类系统最关键的指标即为识别正确率,通常需要达到 90%以上。当然,也并非一味追求高识别正确率,而由不同疾病以及支撑技术发展现状决定。
在高效方面,脑功能评估与辅助诊断对系统的响应交互速度要求相对不高,大致有 15 分钟出结果即可。当然根据技术发展水平而言,实际操作中还是越快越好。但是对人机协同训练时长要求较高, 因为抑郁症、自闭症等患者的测试配合度通常远低于常人,准备过程的时需要尽量缩短。
在稳定方面,脑疾病辅助诊断设备的需求不高,通常是在固定的使用环境应用,对外界干扰可以做一定的场地限制。
在易用方面,脑疾病辅助诊断设备的需求相对较低,检测过程通常不会持续太久,且在临床环境使用,使用者对轻便的需求相对不明显,只要不对使用者造成明显负担即可。
2、脑纹识别
1)场景描述
在当前的数字信息社会中,个人身份验证技术是个人和企业安全系统中必不可少的工具。脑纹具有高隐蔽性、不可窃取性、不可仿制性以及必须活体等方面的独特优势,因此在机密性、安全性要求较高的应用场合中,可以使用脑电波进行身份识别。
2)关键需求
在准确方面,基于脑电信号的身份验证、识别将在个人消费支付、军事设备控制上应用落地。经过对产业相关技术现状的调研, 我们认为脑电身份验证系统最关键的指标即为验证识别正确率,通常需要大 于等于 99%。
在高效方面,基于脑电的身份验证和识别对系统的响应交互速度有一定要求。在稳定采集脑电信号的前提下,一般需要 1 分钟内输出结果。在公安刑侦、金融支付等场合均需要应用任务能快速部署,因此设备的准备过程耗时需要尽量缩短。
在稳定方面,脑电身份验证识别对系统的稳定性要求较高。具体体现在三个方面:一是具有跨任务状态的稳定性;二是具有跨时段的稳定性;三是具有跨系统的稳定性。前两者的稳定性可以通过算法模型来增强。最后的跨系统的稳定性,需要脑机接口行业尽快建立起数据采集的通用标准。
在易用方面,脑电身份验证识别对系统便携易用需求相对较高,验证识别过程通常不能持续太久,最好是干电极、金属电极或者生物凝胶电极等易用操作传感设备,避免使用操作繁琐的湿电极。
3、安全监控
1)场景描述
传统的安全生产监管模式长期以来都是围绕制度安全和设备安全展开, 对人员状态突变造成的安全事故无法预测预警,当事故发生 后无法对现场人员进行及时发现救助,也无法从人员角度对安全隐患 进行排查分析。脑机接口系统基于对大脑状态的实时读取和解析,将 作业人员和生产作业安全相关的大脑状态进行了综合数字化呈现,结 合大数据技术赋能人员安全生产监管,实现人员安全事故的预测预警、 事故发生的自动报警和现场反馈自救,也让管理者能够从人员安全数 据的角度进行风险隐患排查。因此脑机接口系统可用于危化品生产、 施工作业、应急救援、冶炼生产等众多场景。
2)关键需求
在准确方面, 由于涉及作业人员的安全,系统必须具有极高识别正确率,确保在极端状态下准确及时的进行事故预警和报警。为此,要保留适度的算法冗余度,在降低误报率的条件下尽量提升准确度,确保在安全事故发生时准确率达到 99%以上。
在高效方面,复杂工况环境要求脑机接口系统做到无干扰快速响应。为此,要搭建以高精度微弱脑电信号采集和实时分析系统, 结合高效稳定的无线传输技术,具有互操作性的跨平台应用程序接口,最终实现即戴即用、实时监测和秒级响应。
在稳定方面,工业场景的规模化商用要解决三个主要问题,一是在工况作业等高噪声强干扰场景中获取高信噪比的脑电信号,需要积累各种作业工况环境中脑电参数数据库,不断优化工程算法滤波器,提升整体信号质量;二是少量通道条件下实现复杂脑状态实时分析计算。工业场景的条件限制导致只能采用少量信息通道,这对低信息量条件下的实时脑状态分析对算法提出了更高的要求;三是脑机接口系统在工业场景规模化商用中,不同群体和个体之间的差异对于鲁棒性构成了严峻挑战。为此,需要根据实际场景数据不断优化算法, 迭代数据模型,提升脑机接口系统的鲁棒性。
在易用方面,在真实恶劣环境中应用要确保高精度微弱脑电信号采集设备小型化、便携化、可穿戴。这需要在已有防护装备中进行便携化脑机接口系统的嵌入式改造,并在电极性能、人因工程、材料设 计、防水防尘等诸多方面进行优化定型, 既要满足现场人员无痕式佩戴的舒适度体验,又要适应各种高温、高湿、高粉尘的外界强干扰环境,保证高精度脑电信号的稳定采集和传输效率。
二、神经调控
神经调控技术利用植入性或非植入性技术, 采用电刺激或药物手段改变中枢神经、外周神经或自主神经系统活性从而来改善患病人群 的症状。脑机接口相关的神经调控技术主要包括脑深部电极刺激 (DBS)、迷走神经刺激(VNS)、经颅磁刺激 (TMS)、经颅交流刺激 (tACS)、经颅直流刺激(tDCS)、经颅超声刺激(TUS)、经颅电刺 激和神经反馈(Neurofeedback)技术。
1、有创神经调控
1)场景描述
DBS 是典型的有创型神经调控技术。传统的方法是通过脉冲电刺激实现调控。其电流、频率、脉宽等参数通过医生“试错”的方式对调控效果进行观察并调整。随着脑机接口技术的进步,闭环的神经调控通过增加感知模块可以对不同脑状态进行实时调控,这种刺激效果更灵活,更适应、更自动化, 从而达到更好的治疗效果和更小的副作用。国外已经进入成熟商业化应用的领域包括癫痫、帕金森、强迫症等,正在探索中的疾病包括成瘾、抑郁、阿尔兹海默症等神经疾病。
2)关键需求
在准确方面,应用于医疗领域的神经调控设备产生的脉冲刺激有一定限制,对神经组织损失较小且可逆,同时神经调控具备短期和长期的两种作用机制,因此,对识别正确率未作苛刻要求。
在高效方面,人机交互响应速度随病种而导致要求不同。癫痫等疾病对快速响应的要求较高,在脑电已发生改变且临床症状出现前做出判断, 并以刺激方式抑制癫痫发作。现有的商业设备数据显示,约 4 秒计算时间能完成癫痫发作的监测和刺激的反馈。对于抑郁、帕金 森等疾病,对快速响应交互性要求则相对较低,不大于 4 秒即可。
在稳定方面,采用微创或有创神经调控技术能够在一定程度上避免颅骨对采集和刺激信号造成衰减,因此在复杂环境下通常能够实现人机稳定交互以及快速应用体验。但要防止在极端恶劣环境条件下应用此技术(例如,电磁干扰、极端温度、压力变化),从而对设备产生信号干扰, 从实践来看, 已有证据表明 RFID 设备、高压氧仓、强电磁干扰环境有可能导致信号伪迹, 从而产生误刺激。闭环神经调控的应用由于以有创或微创为主,因此对长期稳定使用要求较高。一方面要求神经界面能够长期稳定进行采集和刺激,减少由于纤维蛋白增生 导致的采集和刺激失效;另一方面要求功耗更低以降低人体损害,以及电池容量更大以实现长期工作,避免频繁更换电池等二次手术造成新的创伤。从当前技术发展来看, 神经刺激器的工作有效期已经从传统的三至五年延长至十年甚至更长时间,并已开发安全的可充电技术,满足在人体内长期稳定的工作需求。
在易用方面,植入医疗器械为满足更加轻便的需求当前多通过微创方案解决。传统的神经刺激器体积较大,约 30cm3 左右, 且需要在胸内和脑内植入并通过引线连接。采用微创技术则可实现轻便性目标,植入体的体积仅需颅骨切除,或者磨骨即可植入,从而减少手术创伤以及术后并发症几率,因此有创植入正在朝向微创植入方向发展。
2、无创神经调控
1)场景描述
孤独症(又称自闭症)谱系障碍是一种严重的神经发育疾病, 据美国疾病控制与预防中心(CDC) 2021 年 12 月调查结果显示, 在过去二十年里美国自闭症患病率持续上升, 2018 年调查的 8 岁儿童中自闭症患病率为 2.27%,高于上一个报告期(2016 年) 的 1.85%。我国的自闭症患病率调查数据为至少 1%。作为脑机接口技术的重要研究和应用方向,基于神经反馈的数字疗法是自闭症领域技术发展的前沿和必然趋势。国际公认的应用行为分析 ( applied behavior analysis,ABA) 疗法有效率一般不超过 50%。现已有实践表明, 疑似 或确诊的孤独症谱系障碍患者在康复过程中,针对社交与交流缺陷, 通过非侵入式可穿戴脑机接口系统,结合智能神经反馈训练技术,进行基于大脑实时信号的评测和闭环干预,并与应用行为分析、言语治疗、作业(职能) 治疗等方法结合,能够促进神经可塑性,提高社交脑功能,提升行为训练效果。
2)关键需求
在准确方面,需要以医疗级别脑电波 90%以上的信号精度记录脑电波,以 85%以上的识别正确率解码社交脑的脑电生物学指标,并以符合患者学习风格的方式提供反馈。
在高效方面,需要能够在 200Hz 以上的采样率、2000ms 以内的解码和反馈速度,以非人工的方式为患者提供有效的强化。
在稳定方面,有实践表明,通过符合患者学习风格的方式构建交互方式, 让超过 95%的患者坚持每周使用系统 3 次以上,总时长超过每周 3 小时则使用效果较好。且脑机接口系统与应用软件的通讯方式在实践中表明,需要有稳定的短距离无线连接能力,通信线路在 3 小 时内应保持不中断。
在易用方面,应用软件需要具有互操作性,能适配多种主流操作系统、多款市面主流终端设备,操作需要降低门槛、降低专业知识门槛,让康复机构初级康复师、患者及家属均可快速入门使用。系统也应不需要涂抹导电膏和佩戴有线设备等,这样能促进患者在医院以外的地方接受治疗。
三、对外交互
1、协助沟通
1)场景描述
脑机接口可为渐冻症、中风康复患者等失去语言交流功能的人员实现脑电打字系统,提高患者的生活质量。未来还可应用于人与人之间的隐秘交互,该交互过程无声响和无肢体动作。
脑机打字从技术应用角度可分为植入式脑机接口打字系统与非植入式脑机接口打字系统。上述两种系统对关键特征的需求存在差异。
植入式脑机接口打字系统对使用者会造成一定的脑部创伤,但由于采集的信号质量更高,因此具有更强的系统性能。因此植入式脑机打字系统在快速响应、高准确率、长期稳定方面需求强烈。同时受限于植入式系统的技术发展现状,存在稳定交互、快速应用、轻便易用 方面的需求,使用者只需要在固定、安全、噪声稳定的环境长期使用即可。
非植入式脑机接口打字系统相比植入式脑机打字系统采集的信号质量较低, 但具有快速应用、安全无创的特点。该系统在快速响应交互、识别正确率方面的要求较高,但系统性能低于植入式系统。非植入式脑机打字系统在快速应用体验、轻便性、抗干扰实现稳定交互方面也有很高的需求。但在长时稳定交互方面要求较植入式系统相对较低。
最近,也有通过介入式植入电极的脑机接口打字系统。该系统通过颅内血管的支架式电极采集信号,避免了对脑组织的创伤。此种植 入方式的脑机接口系统除了在快速响应、高准确率及轻便易用方面有很高的要求,而且对长效性的要求也非常高。
2)关键需求
在准确方面,识别正确率指标是脑机打字系统的核心竞争力,通常脑机打字系统的正确率应高于 95%才具有较好的实用效果。
在高效方面,脑机打字系统优劣的重要指标之一就是响应时间。脑机打字系统的单次响应时间理想值在 0.5 秒~1.5 秒之间, 响应时间低于 0.5 秒时较难保持识别正确率,单次响应时间超过 1.5 秒也将导致用户体验较差。
在稳定方面,目前的脑机打字系统大多应用于固定环境,因此对抗干扰性能的要求并不迫切。但从需求出发, 在未来脑机打字系统用于人与人之间隐秘交互方面则需具备较强的抗干扰稳定交互能力。植入式脑机接口系统都需要保证至少 1 年的稳定使用时长,1 年是长期 随访期的最低要求,也是可以开展临床试验的最低要求。作为医疗器械,稳定使用时长最好在十年以上。
在易用方面,植入式脑机打字系统的轻便性要求相对较低,在脖子以上的非植入式系统配重不应大于 500g,最好小于 200g,同时最好能减少导电膏的使用。在准备时长方面 植入式需要手术花费一定时间。非植入式脑机打字系统目前需要在 10 分钟内完成装配准备调试, 该时间越短越好。在人机协同训练时长方面, 植入式与非植入式系统均希望采用“冷启动”的方式,即使用者可直接开展系统应用,机器在使用过程中快速迭代解码算法,在 10 分钟甚至更短时间内达到针对个体优化的脑信息解码精准度。
2、面向医疗康复的外设控制
1)场景描述
据估计,世界上近 1%的人口患有脑血管疾病后遗症。这些后遗症包括运动功能受损、一般认知缺陷、生成或处理语言困难以及情绪状态的改变, 这些现象是中风后常见现象。这些患者中近 30%患有慢性运动障碍,其中偏瘫是中风后最常见的致残病症。因此,卒中后康复的主要目标是恢复运动功能,更有效的康复干预措施需求迫切。迄今为止,运动康复是脑机接口在中风领域研究最多的应用。
用于神经康复的脑机接口系统仅需通过记录和解码患者进行特定心理任务产生的局部脑信号,就可以向外部康复设备传输指令。其主要目标是促进相关大脑区域的神经活动,并促进神经重塑。采集的脑信号通常通过以下方式由外部设备反馈给患者:一是向患者提供关于想象的视觉运动任务反馈,例如在虚拟环境中加强运动想象训练;二是通过康复机器人等外部器械带动患者的运动损伤部位运动,完成 “闭环”的感觉运动回路。
2)关键需求
在准确方面,面向医疗康复的脑机接口系统解码准确率是患者完成有效康复的基本保证,系统的解码精度高不仅能够准确的完成康复流程,促进神经元的康复能力提升,并且更高的准确性会提高患者的信心和动力水平,更好地提升治疗效果。此外,更高的准确度也可能使患者更具有参与度,而准确性较低的脑机接口康复系统因无效反馈频出,可能导致患者产生挫败感,因此对康复产生负面影响,因此应尽量控制运动意图解码正确率不低于 85%。
在高效方面,快速解码也是康复系统中不可缺少部分,外部设备的运作是根据患者的大脑活动进行改变的,康复系统能够实时的根据患者脑活动做出相应动作,从而有利于增强患者的代入感。因此,从受试者开始进行脑活动到外部设备做出动作响应需尽量保持在 3s 以内,以提升患者的使用感及康复系统的实用价值。
在稳定方面,康复类脑机系统需要具备一定的抗干扰能力及长期使用稳定特性。一方面,康复类脑机接口系统的目标不仅限于在医院中的辅助康复训练,还希望在未来能扩展至患者家中或户外活动场景,这就需要系统具有较强的抗环境噪声能力。此外,康复类脑机接口系统也需要长期稳定,尤其是在医疗应用场景中,如不能在较长的时间保持性能稳定,则会造成临床医生与患者的使用困扰。
在易用方面,康复范式的设计也是关键环节之一, 对于不同的运动损伤患者需要制定不同的康复范式,例如下肢运动损伤与手部运动损伤的患者需要分别制定下肢以及上肢的康复范式,并且和虚拟现实技术结合设计更具有沉浸感的康复范式能够让患者有代入感,增强受损神经元的参与程度。因此,需要对患者进行全面的临床和神经生理学评估, 以全面分析和制定个性化的康复计划。此外,有必要探索在没有感觉反馈的情况下是否可以实现与临床类似的康复效果。如果仅使用视觉或虚拟现实反馈即可获得同等康复效果,则可以带来更便携、 更简单且价格合理的家用康复系统。
一、未来展望
经过数十年的科学探索与技术论证,脑机接口已从科幻成为科学,并处于从科学研究到产业落地的关键时期。就脑机接口目前的发展情况, 在今后一段时间, 脑机接口的基础学科研究和应用落地都将得到长足发展,从而有望促进脑机接口市场规模不断扩大。
1、技术展望
在基础学科研究方面,一方面,脑机接口技术自身受外界成熟条件影响得以长足发展,由于神经科学、工程学、计算机学、材料学等多学科的不断成熟完善,脑机接口技术在采集、刺激、编码和解码等方面取得进一步突破,脑机接口产品的“准确、高效、稳定、易用、安全”能力有效提升;另一方面,脑机接口技术将加速神经技术与类脑计算技术的融合,助力脑科学研究更好的认清大脑工作机理, 实现认识大脑、解码大脑和调控大脑的目的。当前脑科学研究在大脑学习、情感记忆等机理研究方面达到突破阈值,未来可能在高级智能方向形成大力突破,进而对当前以数学为基础的人工智能技术造成颠覆性影响,引发以人工智能为代表的计算技术革新。
2、应用展望
在应用方面,脑机接口的产业应用实践将具有显著的社会效益。体现在:一是促进人民健康生活水平质量提升,特别是对神经疾病群体(渐冻症、癫痫、帕金森等) 生活质量改善起到显著推动作用,推动医疗、康养产业数字化和智能化;二是推动前沿科技创新,人才短缺、老龄化严重威胁、抗灾救援等问题一直困扰人类生活, 人类能力的增强对于弥合差距和满足行业需求至关重要,脑机接口技术将推动人体增强和替代技术发展,对人类生活和社会活动产生颠覆性影响。三是助力经济发展,脑科学与多领域融合将呈现应用行业广、辐射范 围大的特点。
3、市场展望
尽管当前脑机接口核心软硬件产品全球市场估算在十多亿美元,神经调控软硬件产品全球市场规模约百亿美元,但如满足报告所提出的愿景, 则有助于推动神经系统疾病的数字疗法走向应用,届时则撬动达到数千乃至万亿规模的睡眠调控、消费娱乐、神经疾病治疗市场。根据中国残联统计数据,我国肢体残疾 2472 万人,视觉障碍群体将近 1800 万,有听力残疾人数达 2780 万人。据不完全统计,我国老年痴呆患病率有 6%,抑郁症和焦虑症的患病率接近 7%,其它神经系统疾病患者过千万,并随着老龄化程度提高而快速增长。因此预测神经重塑、神经替代、神经调控脑机接口技术将拥有数十万亿规模的市场空间。
二、发展建议
脑机接口应用落地离不开关键技术的突破,工程技术的革新,科 研工具平台的支撑,标准体系的推动、测试验证体系的完善, 科技伦理的共识。因此,脑机接口产业在发展中对“多学科协作、多行业协同”的诉求非常强烈。有必要面向脑机接口领域 形成 “产学研用医 政”协同创新体系,因此建议:
一是以科研资源共享机制推动学术协同。脑机接口的技术发展离不开数据、仪器、人才等科研资源。构建面向脑机接口领域科研资源共享机制,搭建科研资源共享平台,有效地支撑知识创造和科学研究,促进科研团队协作,促进交叉学科间合作,为高水平科学研究和高层次人才培养提供有力保障。
二是以联盟合作方式推动产业协同。成立脑机接口产业联盟,从科学研究、产品研发、测试应用、临床实践、标准制定与政策配套等方面凝聚产业力量,搭建行业内沟通交流合作的良好平台,组织国内外专家形成合力,互通有无。推动协同创新,使政府、企业和科研高校之间形成密切沟通合作模式, 促进科技成果转化,引领应用场景探索开拓等。协调组织核心技术攻关研究和基础关键研发要素设施建设,推进软硬件等共性产业技术研发,推动技术及产业融合发展。
三是以标准和测试研究推动应用落地。落实《国家标准化发展纲要》中“推动标准化与科技创新互动发展”的工作思路。在“脑智芯连,思行无碍”行业发展总体愿景目标下,针对脑机接口系统关键需求和性能指标开展标准研究和测评验证等工作,从而促进采集、编码、解码等核心技术的演进,以定量化的标准和评价体系对脑机接口产品进行效能评估,推动脑机接口标准化工作的高质量发展,促进应用 早落地,造福人民生命健康。
四是以科技伦理保障应用安全。一方面开展多方对话与合作,梳理原则清单,共同制定具有可操作性的伦理准则和行业公约,另一方面,面向脑机接口领域,在技术、实验、数据方面加强科技伦理制度化建设,建立健全科技伦理审查和风险评估制度。
蓝海大脑认为,经过数十年的科学探索与技术论证,脑机接口已从科幻成为科学,并处于从科学研究到产业落地的关键时期。就目前的发展情况,在今后一段时间,脑机接口的基础学科研究和应用落地都将得到长足发展,从而有望促进脑机接口市场规模不断扩大。
蓝海大脑 京ICP备18017748号-1