科学家用人工智能将大脑活动转成文字,准确率达 97%

用脑波沟通!科学家用人工智能将大脑活动转成文字,准确率达 97%

亚马逊(Amazon)和 Google 等公司的智慧助理近几年的发展,已可准确辨识人们的语音指令。但另一个更难以置信的里程碑可能就在眼前,这将使语音辨识相形见绌:人工智能(AI)可将大脑活动转化为文字,而不需要使用者说话。

加州大学旧金山分校(University of California San Francisco UCSF)神经外科医生张复伦(Edward Chang)领导的团队,使用一种新的方法来解码皮层脑电图(electrocorticogram),这是由植入大脑的电极所接收的大脑皮层电脉冲记录。

这项研究招募四名癫痫患者参与实验,这些患者大脑已植入电极以监控癫痫发作状况。实验方式为让参与者大声朗读并重复 30 至 50 个不同的句子,同时记录他们的大脑活动,然后将数据输入到人工智能神经网络。

这个神经网络会根据实验过程收集到的音档,分析与某些语音特征相对应的大脑活动模式,例如母音、子音或口部动作。并使用神经网络从重复句子收集的皮层活动去分析表现特征,然后试着预测说话内容。

实验结果显示,错误率平均低于 3%,但超出训练集使用的句子会产生较差的结果。不过在严格定义的实验条件下,这可能是 AI 有史以来最接近实现读心术的一次实验。

在论文中,团队详细介绍参与者所说句子的许多范例,以及 AI 产生的预测结果,有些显而易见的错误与人耳听到的语音有很大不同,这可能是由于引入 AI 的数据量有限。

尽管存在怪异的明显错误,但整体来说,此 AI 系统仍可成为解读大脑活动的新基准,相当于单字错误率为 5% 的专业语音转文字系统 。当然,处理一般对话的语音转文字系统必须有成千上万个单词的词汇库。相比之下,该系统仅学习有限短句中大约 250 个单词的皮质特征,因此将两者比较未尽公平。

研究小组认为该系统未来可能成为语言障碍患者与外界沟通的机会。作者解释:“已长期植入电极的受测者可用于训练的数据量,将比本研究中使用约半小时语音还要大几个数量级,也就是说词汇库和弹性还有再大幅度扩展的可能性。什么是合成生物学? — 当科学家遇上工程师

日本福岛核电厂熔毁九年后,居民的家乡早已被它们占领。

今日的美国是否有资格匹配世界第一强国的称号?

褪黑激素是什么?治疗失眠的万用药?

第一桶金离我好远?达人分享:理财新鲜人每天这样存,最容易达成目标!