科技日报北京 7 月 30 日电 (记者张梦然)据英国《自然·通讯》杂志 30 日发表的一项神经学研究,美国加州大学旧金山分校科学家报告了神经解码器方面的最新进展,其可以将问答对话的相关脑活动,实时转化为文字记录。
大脑皮层包含不同的区域,其中的神经活动会编码语音感知与生成。此前研究表明,这种脑活动可以被解码,但是一直以来的研究都侧重于将听说任务分开进行解码。
此次,研究人员爱德华·张(音译)及同事,在模拟的问答对话试验中,通过脑活动解码了语音感知与生成。研究的被试者为 3 名正在接受癫痫治疗的患者,他们要听一系列问题,并通过一套规定的答案,口头回答问题。研究团队则将被试在这个过程中的脑皮层活动记录下来,之后这些数据被用于训练语音检测和解码模型。随后,被试再听一系列问题,并大声地用自己所选的答案作答。
结果显示,仅使用在对话中记录下的神经信号,研究团队便能够检测被试何时在听,何时在说,并且能够预测所听或所说的具体内容是什么。通过解码问题,他们能够利用所得信息提高被解码答案的准确性(部分答案只适用于特定问题)。而且,对于生成语音和感知语音的解码,其准确性分别提高到 61% 和 76%。
现阶段还需要开展进一步工作来解码想象的语音回答,这样在实际应用中,才能让因为损伤或神经退行性疾病而无法说话的患者顺利使用这项技术。
今年 4 月,该研究团队首次报告研发出一种能将脑活动转化为语音的解码器,当时科学界评价其为“一项非常有力的概念验证”,但“该系统距离真正成为一种临床可行的设备,尚面临许多挑战”。
总编辑圈点
又一项科幻电影里的技术即将成真。最近十年,科学家做到了解码人类大脑中的运动信号,让失去肢体的障碍人士能通过脑电感应设备来控制电动假肢和轮椅。这已经很神奇了。而语音是复杂得多的编码,它从脑电中被还原,令我们意想不到。未来人脑中的视觉印象能否被侦测到呢?如果这也行,那就太惊人了!
来自:
科技日报