来自哥伦比亚大学的科学团队近日通过整合语音合成器和人工智能(AI),成功将人脑思想转换为语音。该技术能够高效连接并“监听”大脑,检测活动的模式并“翻译”成为文本。尽管目前实验能力相对比较基础,但正如团队在科学报告中所指出的,它拥有巨大的发掘潜力。
它不仅会颠覆人类和计算机的通信方式,而且在未来有望为语言障碍的人群提供解决方案。例如患有中风,或者像霍金那样患有肌萎缩侧索硬化症(ALS)的人都可以更方便的交流。
此前尝试“读取”电脑活动主要依赖于频谱图分析的计算机模型,但是这条路并不成功。于是科研团队使用了部署在苹果Siri和亚马逊Alexa的AI合成器技术Vocoder。Vocoder是计算机合成语音的一种算法,因此首先需要使用人类的声音进行训练。该项目由哥伦比亚大学Mortimer B. Zuckerman思维脑行为研究所的首席研究员Nima Mesgarani领导,5名癫痫患者在项目的帮助下通过脑部手术接受了训练,当癫痫患者被要求听取各种不同人的讲话时,研究人员监测他们的大脑活动。
Mesgarani教授表示:“声音是人类同他们的朋友、家人和周围世界联系的的重要渠道,而由于受伤或者疾病而失去声音会产生非常严重的破坏。通过今天的研究,我们有望恢复这项能力。我们已经证明,通过正确的技术,这些人的想法可以被任何听众解读和理解。在这种情况下,如果佩戴者认为'我需要一杯水',我们的系统可以获取该思想产生的大脑信号,并将其转化为合成的口头语言,这会让任何失去讲话能力的人,无论是受伤还是疾病,都有可能再次与周围世界接触。”