本篇文章4133字,读完约10分钟
在《三体》中,伟大的刘威三体文明设计了一种思考和说话的方式。在严酷的三体环境下,三体人依靠这种高效而明确无误的思想交流方式,实现知识的无障碍共享和理性决策的高度统一,从而创造出如此高度发达的文明成果和统一的社会制度。
这个想法就像分散的分布式计算机。只要建立了连接,每个独立的计算机单元就可以学习其他计算机单元的数据,并且每个计算机单元在理论上可以共享共同的执行命令。
与人类相比,我们有些“低能”。首先,我们每个人的大脑就像一块白板。任何数据信息都需要经过大脑发育和长期的经验训练,才能学到一点知识;其次,我们的大脑就像一个神秘的黑匣子。每个人只能通过语言、表情和姿势等外部信号来识别对方的动机。当我们认识自己的脸时,这就是我们的意思。第三,我们的数据信号输出效率很低,我们只能以每秒几千字节的速度输出这种语音和词汇信息,这严重制约了交流效率。
有些人可能会质疑我们是否有必要像三体人一样通过“思想”直接交流。如果有一天我们的思想真的可以直接交流,即使有这么多的好处,同样的个人贪婪和恶意是无法隐藏的,这对我们人类来说可能是一场巨大的灾难。
在高等文明到来之前,自私的欲望和恶意将把人类推入深渊。然而,这个推论仍然是危言耸听。
一方面,这种“脑-机接口”技术水平的实现还很遥远;另一方面,一旦人类提出“思想交流”的想法,只要技术上有任何可能的突破,好奇心就会驱使最聪明的人去实现它。至于这项技术是否会问世,将留待以后再说。
目前,脑-机接口技术正在取得一些显著进展。最近,一项可以称为脑机语言翻译的技术取得了新的突破。
三月底,在《自然》杂志的副刊《神经科学》上,旧金山加利福尼亚大学的研究人员发表了一项新的研究。通过使用机器学习的方法,他们可以将脑电波信号直接翻译成有意义的语音和单词,翻译的准确率大大提高,错误率仅为3%。
这一结果是如何取得的,这项研究意味着什么,距离实现“思想交流”还有多远?这些正是我们接下来要讨论的。
机器学习有一套很好的人脑语言翻译规则
让我们恢复这个实验的过程:研究人员发现了四名癫痫患者,并在大脑中预先控制发音的区域植入了电极装置。在实验中,受试者需要在有限的词汇量内反复阅读一些句子。电极装置可以在大声朗读的瞬间捕捉到活跃的脑电波信号。
记录大脑活动的颅内脑电图电极阵列
然后,研究人员可以找到收集的信号和句子数据库之间的规则,并提取与发声控制相关的脑电波信息。然后,这些数据可以通过机器学习进行训练,这样人工智能就可以在脑电波信号和句子库之间建立一个映射模型。
最后,只要你想象自己在大脑的单词库中说出一个单词,人工智能程序就能根据训练后的映射关系识别出你的内心独白。
(通过声波动作的脑波信号进行语音识别)
因此,实验成功的前提是能够在复杂的脑波信号和显性词汇之间建立精确的映射关系。然后基于数据标记的监督机器学习可以很容易地在训练中“找到规则”。
该论文还表明,人工智能在学习识别人类脑电波方面速度非常快。实验结果表明,经过约40分钟的语音数据简单训练和人工智能翻译语音相关的脑电波,可以达到较高的准确性。其中一个有效的被试,仅经过9次数据训练,单词错误率下降到只有3%。这个词的错误率接近人工智能读者迄今为止的思想表现。研究人员认为,如果给予更多的训练,识别效果会进一步提高。
当然,这组映射规则是在限定语言、限定句子库和限定测试人员的基础上完成的。
首先,本研究使用的句子库只有100多个单词和50-60个句子,比我们每天交流的句子库要少得多。
其次,对脑电波的识别是在同一个人的大脑中完成的,也就是说,无法证明脑电波信号的识别规则在不同的人之间是否具有迁移性。
显然,同一个句子,受不同的语言背景、不同的理解能力甚至更复杂的生理因素的影响,可能在不同的人脑中形成完全不同的脑电波。
根据每个人的脑电波信号的特点,可能有必要建立完全不同的人工智能识别模型。这也意味着大脑信号之间的直接交流几乎难以实现,仍然需要具有共同意义的共同语言作为中介来实现思想的交流。这也是哲学家维特根斯坦提出的“没有私人语言”的现实困境。
那么,如果人工智能可以将脑电波转换到实际水平,这项技术对我们意味着什么?
让失语症再次“说话”,
脑机语言翻译潜力巨大
让我们首先理解这种脑机语言翻译的真正含义。在人类漫长的进化历史中,大脑的复杂性和语言的出现已经成为一对互为因果的因素,帮助人类从恶劣的自然环境中胜出,建立起复杂的文明和文化形态。也就是说,从几万年前人类还是人类的时候起,我们人类的互动手段就是语言,而交流手段如文字和信号都是从语言中衍生出来的。
脑-机语言翻译的出现意味着人类有了一种新的互动形式,即大脑信号直接转换成语言信号。虽然,正如我们所说,这种方法远远不是三个机构的“思想交流”,但它已经是朝着这种“思想交流”的方向迈出的一大步。
至于实际意义吗?对于普通人来说,没有人会轻易尝试在大脑中植入电极装置,日常语言交流仍然是表达信息的最廉价方式。在短期内,我们仍将习惯于把声音和手指作为信息输入的主要手段。
因此,这项技术最可靠的实际应用场景是为失去语言能力或写作能力的病人准备的。事实上,研究人员的出发点是帮助那些因中风偏瘫、渐冻症或其他神经系统疾病而丧失语言功能和交流能力的人恢复他们的语言交流能力。人工智能的脑机语言翻译已经成为他们重新与世界交流的工具。
(大脑控制的打字)
在这项技术实现之前,帮助失语症患者交流的主要脑机接口技术是“脑控打字”,即通过采集脑信号,控制光标选择字母,然后组成单词并输出。Facebook在这个领域很有效,每分钟最多只能输入八个单词。
在脑控打字难以突破效率难度的情况下,人工智能脑机语言翻译可以直接完成脑电波信号到语言的转换,效率一下子提高到正常人的速度水平。这使得失语症在语言输出方面取得了很大的进步。
然而,真正的问题仍然存在,因为这些测试人员可以正常说话。通过收集数据而训练出来的人工智能算法能应用于中风病人或冷冻病人吗?
正如我们上面提到的,每个人的脑电波信号采集可能会有一些差异,所以人工智能算法可能因人而异,所以很难在不同的人之间迁移。
到目前为止,只有在中风或逐渐冻结发生或严重之前,我们才能提前收集他们的脑电波信号,并形成一个专属的人工智能翻译模型,这真的可以帮助病人。
脑-机语言翻译已经到来,
“思想交流”有多远?
与我们已经习惯的人工智能语音识别技术相比,人工智能的脑-机语言翻译似乎非常惊人,因此,如果它达到了脑-脑交互与“心灵交流”的水平,它会觉得有点异想天开。
所谓脑-脑互动,即不再依赖语言,而是直接依赖脑电波信号进行人际交流。这种技术类似于三体人的思想共享,以及《阿凡达》中人与兽之间的联系。
一般来说,当我们通过语言传递大脑信息时,必然会出现信息丢失、传递丢失、效率低下等问题。翻译成中文,我们经常得不到我们想要的东西,耳朵进耳朵出,写几天文章,聊很长时间。
脑-脑互动可以极大地提高人与人之间的交流速度和数量,保存和传递真实、完整的脑信息,避免误解,从根本上改变人类的合作方式。
大脑与大脑的相互作用还没有完成,一些基础实验已经证实了这种可能性。例如,2018年在华盛顿大学,通过以下实验,三个相互隔离的人被戴上脑电图头盔,这是一种非侵入性的脑-计算机设备,只有通过观察和思考,他们才能一起完成俄罗斯方块游戏。他们中的两个人负责观察底部的情况和下落方块的形状,而控制手柄的人根本不知道情况,所以他们只能产生脑电波信号,并通过一种叫做tms的磁刺激方法将信息传递给操作者的大脑,这样他的大脑就可以产生操作指令。
经过五组不同的实验,这种脑-脑互动交流的准确率达到81.25%。尽管它远非人类之间信息传递的准确性和复杂性,但这个实验带来了大脑与大脑互动的可能性。
但是可能性并不意味着现实。在这种可能性之后,我们仍然不得不面对由神秘的大脑黑匣子所造成的无穷无尽的问题。
(大脑皮层的语言部分)
目前,神经科学家已经知道人类的认知功能与大脑分区有关。研究人员可以采集大脑神经活动的空时间信号的高分辨率数据,并配合机器学习算法分离出与感知、运动和语言等各种高级认知功能相对应的神经信号。这样就可以实现脑机语言翻译等基本功能。
然而,实现语言的解码和翻译有许多困难。除了上述声波信号对每个人大脑区域的刺激因人而异,因为世界上有成千上万种语言和方言,相同的语义可能对应于不同语言和方言中的不同脑电波信号。即使不同的年龄、不同的成长环境和不同的情绪状态也可能导致完全不同的脑电波信号。
此外,阅读单词也能触发与语言相关的脑电波活动,这与言语刺激的反应肯定不同。同样,不同的性格会带来不同的脑电波信号模式。
也就是说,实验室状态下未受干扰的测试结果极难应用于真实场景。翻译这么多复杂的脑波语言可能比统一全世界的语言和文字更困难。那么你认为实现后者的可能性有多大?
那么,大脑与大脑的互动呢?我们能绕过堆积如山的语言翻译,先实现一些非语言或语言的大脑信号交互吗?例如,我们可以找到一些常见的识别方向、情绪和本能压力反应的人类脑电波信号,并通过人工智能学习实现信号的解码和共享。
这确实是可能的,例如,上面的俄罗斯方块游戏的方向测试,以及对一些老鼠的预期头部运动的一些信号的测试。然而,如果它更复杂,可能有必要将脑电波信号转换成语言(语音或文本)进行交互。否则,这些检测到的脑电波数据只是一些物理信号,不能有任何信息价值。
这可能仍然符合哲学命题。如果意识不是用语言来表达的,我们怎么能意识到这种意识呢?
在一个需要依靠讲故事来支撑其市场价值的新行业中,脑-机语言翻译的实现确实为脑-机接口的技术开发和商业化注入了一剂强心针。当然,我们也应该冷静地看到,这项技术仍然只有“实验室”的成功价值,它的商业化需要在各个方面成熟,如脑机接口的材料成本、安全性、信号检测的准确性、迁移和翻译模型的通用性等。
至于我们试图回答的“思想交流”的脑-脑互动,我们实际上可以看到未来是无限的,困难仍然是无数的,甚至有一座语言的大山在人类面前。
毕竟,上帝创造世界是通过说话,而不是思考。
标题:机器学习实现了脑机语言翻译,那距离“意念交流”还有多远?
地址:http://www.hcsbodzyz.com/hcxw/431.html