聚类精度超96%,机器学习新算法可实现更高脑机接口性能

编辑 | 萝卜皮

使用多个电极来记录神经元活动是一种常用的方法,可以帮助我们了解大脑的功能机制。通过增加电极数量,科学家能够更准确地解码不同类型的功能。然而,由于硬件资源有限和不可避免的热组织损伤,处理大量多通道电生理数据仍然是具有挑战性的任务。

韩国大邱庆北科学技术院的研究团队提出了一种利用机器学习技术进行高频神经元尖峰信号重建的方法。该方法基于二次采样的低频信号,通过机器学习算法对信号进行重建。这种方法可以有效地提取高频神经元活动的信息,并且能够准确地还原原始信号。研究团队通过实验验证了该方法的有效性,证明了其在神经科学研究中的潜在应用价值。这一研究成果为神经科学领域的研究提供了新的思路和方法,有

受到图像处理中高频恢复和超分辨率等效性的启发,研究人员运用Transformer ML模型对来自体外培养物和体内雄性小鼠大脑中记录的神经元数据进行了处理。即使在使用了x8下采样的数据集的情况下,该团队的模型也能有效地估计尖峰活动的高频信息,包括尖峰时间、波形以及网络连接。

该研究以「Machine learning-based high-frequency neuronal spike reconstruction from low-frequency and low-sampling-rate recordings」为题,于 2024 年 1 月 20 日发布在《Nature Communications》。

聚类精度超96%,机器学习新算法可实现更高脑机接口性能

脑机接口

神经元活动的多通道记录对于脑机接口(BMI)至关重要,它可以解码运动意图和大脑功能连接。目前,BMI技术已经利用了多个植入电极记录的细胞外信号,如尖峰和局部场电位(LFP)。最新的神经记录硬件进展主要集中在增加同时记录电极的数量,以获取更丰富的信息并进行详细的网络分析。

记录的电极数据越多,科学家可以进行更广泛的功能分类,以便进行精确的相关操作。为了实现高效长期植入的记录系统,实现无线数据传输也进行了大量研究。通过这些努力,已证明无线设备可以在植入的灵长类动物中实时进行操作。

处理大量神经数据有局限性

尽管取得了这些进步,但当前的 BMI 技术在处理大量神经数据方面仍然存在局限性。大多数BMI系统采用单单元尖峰活动来增强解码性能;然而,为了捕获通常在毫秒时间尺度内发生的单个尖峰,记录仪器需要至少 10kHz 或更高的采样率。

此外,更多的电极需要更大的存储内存,并导致记录和无线通信中更高的功耗,导致显著的散热。在植入式脑机接口中应避免这种加热,因为它会对周围的生物组织造成热损伤,特别是对于将多路电子器件集成到探针柄中的基于 CMOS 的有源神经探针或完全植入的无线神经传感器。

为了通过减少记录数据量来缓解这些限制,采用了几种降低数据采样的技术,已经提出了诸如自适应采样、压缩感知、基于尖峰频带功率的解码、降级信号质量、片上压缩和片上尖峰检测等技术。虽然这些方法在显著减少数据方面显示出有希望的结果,但它们在高级 BMI 中的应用仍然有限。神经元信号的更宽带宽,不仅包括高频带尖峰,还包括低频带信号(例如 LFP),与 BMI 所必需的大脑功能密切相关。

迫切需要一种新算法

近期科学家提出了单独使用 LFP 或与尖峰相结合的技术,用于弥补基于尖峰的 BMI 的主要局限性:长期测量一致的困难以及高采样记录的需要。然而,现有的数据缩减算法旨在主要关注尖峰活动,因此难以应用于低频信号并提供有限的信息。

此外,现有方法通常需要定制设计的记录硬件,在数据传输之前进行片上信号预处理,例如用于实现单独算法的编码器或用于通过识别阈值交叉事件或表征尖峰波形来检测尖峰以及用于将尖峰转换为二进制形式的附加电路。这也限制了最先进的 BMI 技术的普遍适用性。因此,迫切需要开发一种普遍适用、不受信号类型限制且与通用记录硬件兼容的神经数据缩减算法。

新的 ML 框架

在最新的研究中,DGIST 的研究人员提出了一个机器学习(ML)框架,用于从二次采样的低频信号中重建高频神经元尖峰。

聚类精度超96%,机器学习新算法可实现更高脑机接口性能

图示:使用机器学习模型从下采样的低频数据集中重建高频神经元尖峰。(来源:论文)

该方法可以通过低通滤波和对获取的神经元信号进行简单的下采样来减少神经记录数据量。将这种下采样低通滤波 (LPF) 数据输入到 ML 模型并结合信号插值可以恢复具有高时间分辨率的高频神经元信号。它能够减少记录数据,同时获得宽带宽的神经元信号。

研究人员假设为图像超分辨率任务引入的 ML 模型(通过恢复高频细节从低分辨率图像中恢复高质量图像)可以适合尖峰恢复问题。为了测试这个假设,团队利用 Transformer 构建了一个名为 Spk-Recon 的尖峰重建机器学习模型,该模型使用二次采样的低频神经记录数据作为输入。

研究人员将 Spk-Recon 模型应用于体外海马神经元和体内小鼠大脑的多通道神经记录数据集。通过传统的定时和波形定量尖峰分析,研究人员证明 Spk-Recon 模型可以从显著下采样的低频神经元信号中重建准确的尖峰,尖峰出现的命中率接近 0.8−0.9,尖峰排序的聚类精度超过 96%。

聚类精度超96%,机器学习新算法可实现更高脑机接口性能

图示:Spk-Recon 模型架构和训练示意图。(来源:论文)

该团队基于 Spk-Recon 的恢复可以同时获取从 LFP 到尖峰的广泛频率范围内的丰富神经元信号:通过以低采样率直接记录的低频段 LFP 和通过基于 ML 的重建来获取高频段尖峰。以前的数据缩减技术工作有限地集中于仅获取尖峰的高频带。尽管已经有一些研究使用线性或非线性模型来估计低频 LFP 的尖峰,但它们仍然处于仅推断放电率或获得尖峰时序的水平,而不是整个尖峰波形特征。

由于能够同时获取 LFP 和尖峰,该方法可以提供更丰富的神经元信息,有助于基于尖峰触发的 LFP 平均分析 LPF-尖峰相关性或大脑功能连接。特别是,甚至能够以尖峰排序所需的高时间分辨率恢复波形特征,对于开发使用 LFP 和单单元尖峰的高级 BMI 非常有用。所有这些都可以通过传统的神经记录硬件以低记录数据量来实现。

从硬件应用的角度来看,该团队减少神经元数据量的方法具有很高的通用性。研究人员通过典型的神经记录硬件以统一较低的采样率获取低频段信号,并通过基于机器学习的软件恢复高采样尖峰。也就是说,应用他们的模型的数据量减少的信号采集可以在各种商业或定制的多通道神经记录系统中实现,而无需额外的硬件修改。

另外,考虑到最近增加记录电极数量的研究,它将允许在相同的硬件资源内从更多电极收集神经元信号或收集更长的持续时间。研究人员期望它为开发下一代脑机接口开辟新的方向,能够更深入地分析和控制大脑功能,同时减少硬件资源和最小化热组织损伤。

聚类精度超96%,机器学习新算法可实现更高脑机接口性能

图示:体外数据集的信号重建。(来源:论文)

最后,Spk-Recon 可以为各种类型的神经记录之间的信号估计提供通用框架。该框架可以从较低频段信号恢复高频信息。这种功能可应用于通过不同记录方式测量的神经元活动,如皮质内记录、皮质电图描记术 (ECoG) 和脑电图描记术 (EEG)。例如,从 ECoG 到尖峰或从 EEG 到 ECoG 的低频到高频信号恢复是可能的。

此外,通过利用能够实现全网络细胞内记录的最新MEA技术,还可以实现从细胞外记录重建细胞内神经元信号,例如动作电位或阈下突触信号。通过开发基于多模式或多尺度信号且物理侵入性较小的新系统,可以实现更高的脑机接口性能。

论文链接:https://www.nature.com/articles/s41467-024-44794-2