非侵入设备贴在脖子上,就能代替人类发声,研究登《自然通讯》

研究人员开发了一种由 AI 驱动的发声贴片,可以非侵入性地粘附在喉部帮助发声。在你看不到的地方,说话这件小事对于许多人来说「难于登天」:2014 年美国一项针对发声障碍的研究发现,近 1800 万成年人在使用声道说话时存在困难,而该群体中超过一半的人经历过言语衰弱问题的时间超过 10 年。现在,一种新型非侵入式可穿戴设备成为了这一医疗需求新的解决方法。该技术包括粘附在脖子上的轻质贴片,该贴片可以测量人的颈部运动。接着,设备处理器将这些信号转换为语音,然后播放语音音频来代替人类发声。这项研究由来自加州大学洛杉矶分校(

研究人员开发了一种由 AI 驱动的发声贴片,可以非侵入性地粘附在喉部帮助发声。

在你看不到的地方,说话这件小事对于许多人来说「难于登天」:2014 年美国一项针对发声障碍的研究发现,近 1800 万成年人在使用声道说话时存在困难,而该群体中超过一半的人经历过言语衰弱问题的时间超过 10 年。

现在,一种新型非侵入式可穿戴设备成为了这一医疗需求新的解决方法。该技术包括粘附在脖子上的轻质贴片,该贴片可以测量人的颈部运动。接着,设备处理器将这些信号转换为语音,然后播放语音音频来代替人类发声。

非侵入设备贴在脖子上,就能代替人类发声,研究登《自然通讯》

这项研究由来自加州大学洛杉矶分校(UCLA)生物医学工程助理教授 Jun Chen 领导的研究小组完成。相关研究登上《自然通讯》。

图片

论文地址:https://www.nature.com/articles/s41467-024-45915-7

该团队创造了一种灵活的电磁响应可穿戴设备,可以测量细微的颈部肌肉运动。然后,下游设备(不是传感贴片)使用经过训练的可识别一组短语词典的机器学习算法,将贴片感应到的肌肉运动解码为语音。

这项技术可以造福那些受伤或患有声带麻痹疾病的人,以及那些做过喉切除术的人。

不过,该设备可以播放的句子数量有限,目前的原型 AI 模型仅能从五个句子中做出选择:嗨,你今天过得怎么样?;希望你的实验进展顺利!;圣诞节快乐!; 我爱你!; 我不相信你。此外,该模型根据没有任何言语障碍的人的颈部运动进行了训练和测试。

无声的医疗技术

医疗设备公司 Atos Medical 的临床教育家 Barbara Messing 博士表示,「为患者提供更多选择有助于提高他们的生活质量,这就是我们所有人都想要的。」

为了让用户听得见声音,该设备将感应到的肌肉运动信号传递给在外部处理器上运行的机器学习模型。该模型经过训练,可以检测与固定数量的预定义句子相对应的肌肉运动模式。当它检测到这些短语之一时,处理器就会通过像扬声器一样的振动贴片来播放该句子。

图片

研究人员开发了一种由人工智能驱动的发声贴片,可以非侵入性地粘附在喉部。然后,磁感应线圈和其中的柔性磁性材料就可以推断皮肤下颈部和喉咙的运动。

这个系统的喉部贴片应用了 Jun Chen 教授小组的关于新材料科学的研究成果,他们利用了材料当中一种称为磁弹性的特性。在这种特性下,材料在被拉伸和压缩时,其磁场强度会发生变化。日常活动和颈部运动会拉伸贴片,导致磁场发生变化,然后由内置的柔性感应线圈进行测量。这些材料协同工作,感知用户颈部肌肉的微小 3D 运动。

新型磁弹性材料的灵活性使其能够粘附并准确跟踪用户颈部肌肉的运动,这是先前已知的由磁弹性材料制成的类似传感器无法做到的。为了进一步提高其灵敏度,该小组将材料塑造成剪纸图案(一种类似于折纸的纸工艺,允许切割),使传感器在较小的拉伸和偏转下表现均匀。

Jun Chen 教授表示,未来他们致力于将其研究成果转化为医疗设备,不断的优化设备并标准化批量生产的制造程序,改进软件和硬件,增加翻译词汇量和准确性,让设备更加人性化。Jun Chen 教授估计,他们将在 3-5 年内生产出一种可行的医疗设备。

原文链接:https://spectrum.ieee.org/assistive-tech-voice-patch

相关资讯

GPT-4比你更会问问题:让大模型自主复述,打破与人类对话的壁垒

在最新的人工智能领域动态中,人工生成的提示(prompt)质量对大语言模型(LLM)的响应精度有着决定性影响。OpenAI 提出的建议指出,精确、详细且具体的问题对于这些大语言模型的表现至关重要。然而,普通用户是否能够确保他们的问题对于 LLM 来说足够清晰明了?值得注意的是,人类在某些情境下的自然理解能力与机器的解读存在明显差异。例如,“偶数月” 这一概念,在人类看来很明显指的是二月,四月等月份,而 GPT-4 却可能将其误解为天数为偶数的月份。这不仅揭示了人工智能在理解日常语境上的局限性,也促使我们反思如何更有