DeWave技术,让大型模型也能学会“读心术”
一项新的研究在NeurIPS上发表,这项研究让大型模型也能学会“读心术”。通过学习脑电波数据,这个模型成功地将受试者的脑电图信号翻译成了文本。而且整个过程不需要大型设备,只需要一块特制的“头巾”就能实现。
这项研究成果名为DeWave,能够在不使用侵入式设备和MRI的情况下解读脑电波并将其翻译成文本。由于使用了大型模型来读取大脑,因此报道DeWave的iFLScience也将其称为BrainGPT。
虽然DeWave不是第一个实现脑电波解码的技术,但它是第一个能够非侵入且无需MRI进行脑电波-文本转换的技术。如果能够规模化应用,DeWave将为脑部瘫痪的人群提供交流上的帮助。
那么,DeWave的表现如何呢?根据测评结果,它超过了SOTA(State-of-the-Art)方法。由于DeWave采用了非侵入式方法,信号中的噪声更强,解析难度更高,但相比于此前的SOTA方法,DeWave的测试成绩还是有所提高。
研究团队使用了公开的ZuCo数据集,其中包含了一万多个不重复的句子。受试者在进行自然阅读的同时,研究团队对他们的脑信号和正在阅读的文本进行了记录。脑电波信号采样频率为500Hz,包含128个信道。
如果输入的EEG信息已经按照眼动追踪方式的特征切分好,那么DeWave大概可以准确解读出句子的三分之一;即使没有切分也能够成功捕捉一部分关键词。
研究结果还显示,DeWave对单词的解析准确率高于整句,对动词的准确率高于名词。
在数据方面,研究团队一共让DeWave对29名受试者的脑电图进行了采集和解析。结果显示,有切分时,DeWave在BLUE-N数据集上的成绩比传统方法高出了3-18%,在ROUGE-1数据集上也有最高6.35%的提升。如果没有做切分,DeWave与相同条件的传统方法相比,表现最多提升了120%。
为了评估DeWave的鲁棒性,团队对其进行了跨受试者(Cross-subject)测试。这轮测试一共有18名受试者,其中一人的脑电波被用于训练。然后,研究团队观察了模型在其他17人上进行测试时的表现,与被用于训练的人差距越小,说明模型的鲁棒性越强。结果显示,DeWave的分数下降值低于传统模型,显示出了更强的鲁棒性和泛化能力。
研究团队将离散化的数据送入Transformer编码器,得到上下文语义融合的向量表示
那么,DeWave是如何实现脑电波解码的呢?DeWave的核心是引入了名为“离散码本”的概念。通过向量化编码器,连续的脑电图信号被拆分为离散形式,并与词汇进行对齐。之后,研究团队将离散化的数据送入Transformer编码器,得到上下文语义融合的向量表示。将向量化的文本信息作为监督数据,用得到的向量化信号对BART大模型进行训练,就得到了DeWave。新的信号解析过程也与之相似——先进行离散化和向量化编码,然后用BART对其进行解读,就得到了文本信息。同时,为了增强可解码性,研究团队还通过正负样本对编码进行调节,使DeWave解析出的语义更接近目标文本词向量。
DeWave团队一共有五名成员,全都是华人。第一作者是悉尼科技大学的Yiqun Duan,来自H(Human-centric)AI研究中心,研究方向是机器智能和脑机接口。除了DeWave,Duan此前还有一项基于扩散模型的“反向成果”——把文字转换成脑电波的工具BrainDiffusion。该研究中心主任Chin-Teng Lin教授是本文的通讯作者。同实验室的Jinzhao Zhou和Yu-Kai Wang以及悉尼大学的Zhen Wang也参与了此项目。
本文由小熊AI网发布,不代表小熊AI网立场,转载联系作者并注明出处:https://www.xiaoxiong360.com/html/brain/2355.html