脑波解码的延迟仅为80毫秒,“对话的思想”的技
作者: bet356在线官方网站 点击次数: 发布时间: 2025-04-04 10:00

无法说话的人现在可以通过大脑扫描实时讲话。整个过程没有延迟,不需要打字,也不需要声音。本周,有关大脑计算机界面的最新研究导致了有关社交网络的热烈讨论,Twitter博客作者的帖子超过150万。让我们先看看效果。视频主题严重瘫痪,无法说话。他的大脑活动是在目标句子中解码的,然后使用文本到语音模型单独合成单词。我们可以看到连接主题头的设备(连接器)。屏幕上出现了目标句子,并且文本是从大脑活动中解码的,并应用了“单词级别的文本对形成综合”。接下来是更多例子:Pkaylo T. Littlejohn的吸引力在推特上发布了促销团队的结果,称流媒体的“脑对脑对大脑”神经假体可以恢复瘫痪患者的自然,流利和清晰的语言技能。同时,他强调一般的能力很重要。随着设备的快速改进,现在构建的解码方法应转换为使用案例(例如与入侵性权衡相比,无创的),并为将来的临床临床式神经假体奠定了坚实的基础。这种技术成功在哪里“敬畏”?您应该知道,在此之前,最好的大脑计算机界面系统只能以每分钟8-14个单词的速度“特定”。而且,新系统每分钟都可以以90多个英语MGA字的速度是语音输出,并且不使用任何可听见的培训数据,并且用户不必尝试发出声音。来自加州大学伯克利分校的这项研究在最新一期的《自然神经科学》中介绍了这项研究。论文:流媒体的脑部到舞会神经假体以恢复自然主义纸质通信链接:https://www.nature.com/articles/s41593-025-025-01905-6该系统转录的目标是患者的脑皮质语音语音皮质。它使用253通道的ECOG阵列,深度学习神经解码器进行了23,000次演讲练习,以产生仅延迟80ms的RNN-T体系结构。它不仅可以综合语音或执行实时转录,并且在患者受伤之前记录了音调。大多数大脑计算机界面系统都必须等待在输出任何内容之前先曾经判处完整句子的人,但是在新系统中,人们认为可以将其转换为语音,延迟将近1秒。因此,该系统可以称为实时核心。从实际的试验中可以看出,语音转录的影响是快速,平稳而准确的:对其中的50个短语集(需要)的测试,新方法达到了91 wpm,12%的单词错误率(WE)和角色中的12%字符错误率。在1024个单词集的自然句子测试中,该过程还达到了47 wpm,59%WER和45%的字符错误率。阿尔OUD不太准确,已经证明了系统的有效性。此外,该系统已成功地综合了该实践中尚未看到的新词汇。由24个新词汇,罗密欧祖鲁(Zulu)的诗人(Poetryd)提供,适当认识该词汇的可能性为46%,而机会的可能性则为3.8%。所有这些仅通过神经活动来实现。此外,该系统还采用了提名的神经网络结构,该结构可以在许多技术平台上解码语音信号,包括:ECOG(皮质脑电图),该术语通过在大脑上种植的电极阵列读取神经信号,而不会渗透到脑组织中,而创伤性则较小; MEA(皮质内微电极),该MEA通过在大脑皮层中种植的微电极记录单个神经元活性; EMG(面部表面电极,无需操作)。许多研究仅限于测试阶段,相反,系统可以包括可以在没有预编程的情况下进行工作,可以看到IFSubject主题,并停止与大脑活动交谈。研究人员以6分钟的持续安静声音尝试了一下。结果表明,系统可以在没有错误警报的情况下准确地读取它。这项研究达到了一个新的基准测试,以进行解码速度,以及先前的28个单词/分钟(WPM)的最佳速度,并且该系统进行了90个单词/分钟(WPM),延迟较低。更重要的是,主题不必说话,借助该系统的帮助,主题可以在他的脑海中“说话”。从临床的角度来看,这项研究可以重新获得失去语言技能的人的言语力量。从技术的角度来看,它解决了实时,流畅的神经语音解码的问题。已久的安静的通信已实施,这也表明该语言可以基于神经信号完全传达。如果这项技术变得流行,我们可以想象世界已有20年了,这不会ONGER需要手机,键盘,语音命令等。参考链接:https://x.com/iterinteltectus/status/190699568125382519