用户头像
forcode
 · 福建  

//瘫痪男子用AI脑机接口说话唱歌

脑机接口如何让瘫痪患者重新发声

发表July 1, 2025

瘫痪男子使用突破性的脑机接口说话和唱歌

多亏了加州大学戴维斯分校的一个团队,出现了一种新的脑机接口 (BCI) 系统,可以为不会说话的人提供实时、自然的对话。“赛博人”库尔特·克努森解释道。

新增功能

您现在可以收听福克斯新闻的文章了!

当有人因肌萎缩侧索硬化症等神经系统疾病而失去说话能力时,其影响远远超出了言语。它触及日常生活的方方面面,从与家人分享笑话到简单地寻求帮助。现在,多亏了加州大学戴维斯分校的一个团队,出现了一种新的脑机接口 (BCI) 系统,它为不会说话的人提供了实时、自然的对话。这项技术不仅仅是将想法转换为文本。相反,它翻译了通常控制用于语音的肌肉的大脑信号,允许用户几乎立即通过计算机“说话”甚至“唱歌”。

有一种新的脑机接口 (BCI) 系统为不会说话的人打开了实时、自然的对话。(加州大学戴维斯分校)

通过大脑信号进行实时语音

该系统的核心是四个微电极阵列,通过手术植入大脑中负责产生语音的部分。这些微型设备会接收当有人试图说话时发生的神经活动。然后将信号输入人工智能驱动的解码模型,该模型在短短十毫秒内将它们转换为可听语音。速度如此之快,感觉就像日常对话一样自然。

特别值得注意的是,该系统可以重新创建用户自己的声音,这要归功于根据 ALS 发作前录制的录音进行训练的语音克隆算法。这意味着该人的数字声音听起来像他们,而不是通用的计算机声音。系统甚至可以识别用户何时尝试唱歌,并可以改变音高以匹配简单的旋律。它还可以拾取声音的细微差别,例如提出问题、强调单词或插入感叹词,例如“啊”、“哦”或“嗯”。所有这些加起来,对话比以前的技术所能提供的更具表现力和人性化。

它翻译了通常控制用于说话的肌肉的大脑信号,允许用户几乎立即通过计算机“说话”甚至“唱歌”。(加州大学戴维斯分校)

技术的工作原理

该过程从参与者尝试说出屏幕上显示的句子开始。当它们试图形成每个单词时,电极会捕获数百个神经元的放电模式。人工智能学习将这些模式映射到特定的声音,实时重建语音。这种方法允许对语音节奏和语气进行微妙控制,使用户能够像其他人一样打断、强调或提出问题。

加州大学戴维斯分校研究最引人注目的结果之一是,听众可以理解近 60% 的合成单词,而没有 BCI 的听众只能理解 4%。该系统还可以处理不属于其训练数据的新词,显示了其灵活性和适应性。

人工智能学习将这些模式映射到特定的声音,实时重建语音。(加州大学戴维斯分校)

对日常生活的影响

能够用自己的声音和个性进行实时交流,对于瘫痪患者来说是一个游戏规则改变者。加州大学戴维斯分校团队指出,这项技术可以让用户更多地参与对话。他们可以打断、快速反应并细致入微地表达自己。与早期仅将大脑信号转换为文本的系统相比,这是一个巨大的转变,这通常会导致缓慢、生硬的交流,感觉更像是发短信而不是说话。

正如参与这项研究的神经外科医生大卫·布兰德曼所说,我们的声音是我们身份的核心部分。失去它是毁灭性的,但这种技术为恢复我们的重要部分提供了真正的希望。

加州大学戴维斯分校团队指出,这项技术可以让用户更多地参与对话。(加州大学戴维斯分校)

展望未来:下一步行动和挑战

虽然这些早期结果很有希望,但研究人员很快指出,该技术仍处于早期阶段。到目前为止,它只对一名参与者进行了测试,因此需要更多的研究来了解它对其他人的效果如何,包括患有不同语言丧失原因(如中风)的人。加州大学戴维斯分校健康中心的 BrainGate2 临床试验正在继续招募参与者,以进一步完善和测试该系统。

该技术仍处于早期阶段。

Kurt 的关键要点

为失去声音的人恢复自然、富有表现力的语音是脑机接口技术最有意义的进步之一。加州大学戴维斯分校的这个新系统表明,可以将实时的个人对话带回受瘫痪影响的人的生活中。虽然仍有工作要做,但迄今为止的进展让人们有机会以一种真正像自己的方式与亲人和周围的世界重新建立联系。