读心术出现?AI模型将脑成像解读为自然语言!

2023-11-04 03:10

本文主要是介绍读心术出现?AI模型将脑成像解读为自然语言!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

大脑解码器如何实现“读心术”

科幻小说中,读心术是一种神奇的超能力。但在现实生活中,我们曾经认为这是不可能实现的。如今,发表在Nature Neuroscience上的一篇工作提出了基于GPT模型和功能性磁共振成像(fMRI)技术的语言解码器,带来了惊人的消息:它能够通过大脑信号的解析,解码人类思想,准确率高达82%!

那么,这个恐怖的大脑解码器究竟是怎样实现“读心术”的呢?原来,它使用基于血氧水平依赖性(BOLD)的fMRI技术,通过监测大脑皮层不同部位的血氧水平得到大脑的动态变化图像。因此只需分析功能磁共振成像数据,就可以以非侵入性的方式,将参与者大脑中所想的故事甚至图像用语言描述出来

接下来,研究人员基于GPT-1训练了一个神经网络语言模型。经过训练,模型能够将志愿者的脑fMRI数据翻译成单词和短语,并将内在的脑部活动“释义”成为可理解的自然语言。研究人员还通过大量实验验证了该模型的有效性,证明其在解读感知到的语音解读想象的内容解读无声电影三个任务上的准确率高达72%~82%。

网络结构与任务细节

该工作使用的方法记录志愿者在听到或想象语音时提供的功能性磁共振成像(fMRI)数据。然后使用解码器对数据进行处理,该解码器从皮质语义表示中重建了连续语言。解码器使用语言模型进行训练,并在皮层的多个区域进行了测试。使用 FSL 5.0 中的 FMRIB 线性图像配准工具 (FLIRT) 对数据进行了运动校正。

上图展示了完整的网络结构。在第一项任务中,三名志愿者被要求听16小时的叙事故事,他们收听时的脑成像BOLD信号被记录下来。随后,训练一个编码器(Encoding model)学习语音中的刺激词特征到脑BOLD信号的映射关系。除了编码器之外,训练一个解码器(Decoding model)学习志愿者实际的脑电波到刺激词的映射关系。为了生成连续的自然语言,该论文使用一个语言模型(LM)来逐单词地生成若干候选语句,并作用先前的编码器以预测最有可能的结果,并不断重复最终生成完整的自然语言输出。

在这项任务中,AI模型翻译得到的自然语言(右)和志愿者实际收听到的内容(左)在语义上基本一致,只是表达方式和句式不相同(如下图所示)。

在第二项任务中,志愿者被要求在脑海中构想一个故事,然后使用解码器生成自然语言(Decoded)。随后,再让志愿者用自然语言复述构想的故事(Reference),以进行对比。下图展示了两者的对比结果。

在第三项任务中,给志愿者播放一段无声电影,用解码器对他们的脑信号进行解码,结果如下所示。

实验数据显示,该模型准确率超过80%,这意味着它能够读取志愿者的大部分思考内容。尤其是在感知语音(收听录音)方面,准确率最高达到82%。而在想象语言(志愿者在内心讲述故事)和无声电影方面,准确率分别为41%~74%和21%~45%。

在被解码后生成的语句中,虽然每个单词都不是一一对应的,但是整个句子的意义被保留了下来,也就是解码器在给大脑信号「释义」。比如,在观看无声电影时,解码器能够精确地翻译出场景中的故事和情感。

最有趣的是,当你在看皮克斯无声电影时,大脑解码器都能读出你的想法。

大脑解码器的潜在威胁与应用前景

虽然这个大脑解码器能够为我们带来很多有益的应用,但同时也引发了我们对隐私保护的深刻思考。目前,虽然需要志愿者的配合才能读取大脑信号,但是未来若被恶意利用,就有可能造成极大的隐私泄露和思想监控

然而,这种技术也可以帮助无法说话的人群,如患有运动失调、自闭症、神经肌肉疾病等的人们,通过大脑解码技术进行交流。此外,该技术还可以应用于研究心理健康,例如在神经科学、临床心理学和精神病学等领域中,探索精神障碍和情绪状态的生物学基础

总而言之,“读心术”的出现开启了大脑成像领域的新潜力,同时也引发了我们对隐私保护的深刻思考。或许,在未来的某一天,它能够帮助我们更好地了解人类思想与心理,但我们还需要不断探索和完善技术的应用前景。

结语

读心术,曾经是人类最神秘的幻想之一。如今,随着脑机接口和GPT等自然语言技术的发展,正在逐渐实现这个幻想。我们不得不承认,它的出现可以给人类带来很多有益的应用。但同时,我们也需要高度警惕这种技术可能带来的潜在威胁。或许,在未来的某个时刻,我们可以找到更好的平衡点,让科技和隐私共存。

论文链接:https://www.nature.com/articles/s41593-023-01304-9


欢迎关注我的个人公众号【THU智能魔术师】

这篇关于读心术出现?AI模型将脑成像解读为自然语言!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/342812

相关文章

Java+AI驱动实现PDF文件数据提取与解析

《Java+AI驱动实现PDF文件数据提取与解析》本文将和大家分享一套基于AI的体检报告智能评估方案,详细介绍从PDF上传、内容提取到AI分析、数据存储的全流程自动化实现方法,感兴趣的可以了解下... 目录一、核心流程:从上传到评估的完整链路二、第一步:解析 PDF,提取体检报告内容1. 引入依赖2. 封装

C语言自定义类型之联合和枚举解读

《C语言自定义类型之联合和枚举解读》联合体共享内存,大小由最大成员决定,遵循对齐规则;枚举类型列举可能值,提升可读性和类型安全性,两者在C语言中用于优化内存和程序效率... 目录一、联合体1.1 联合体类型的声明1.2 联合体的特点1.2.1 特点11.2.2 特点21.2.3 特点31.3 联合体的大小1

Python标准库datetime模块日期和时间数据类型解读

《Python标准库datetime模块日期和时间数据类型解读》文章介绍Python中datetime模块的date、time、datetime类,用于处理日期、时间及日期时间结合体,通过属性获取时间... 目录Datetime常用类日期date类型使用时间 time 类型使用日期和时间的结合体–日期时间(

C语言中%zu的用法解读

《C语言中%zu的用法解读》size_t是无符号整数类型,用于表示对象大小或内存操作结果,%zu是C99标准中专为size_t设计的printf占位符,避免因类型不匹配导致错误,使用%u或%d可能引发... 目录size_t 类型与 %zu 占位符%zu 的用途替代占位符的风险兼容性说明其他相关占位符验证示

Spring AI使用tool Calling和MCP的示例详解

《SpringAI使用toolCalling和MCP的示例详解》SpringAI1.0.0.M6引入ToolCalling与MCP协议,提升AI与工具交互的扩展性与标准化,支持信息检索、行动执行等... 目录深入探索 Spring AI聊天接口示例Function CallingMCPSTDIOSSE结束语

Linux系统之lvcreate命令使用解读

《Linux系统之lvcreate命令使用解读》lvcreate是LVM中创建逻辑卷的核心命令,支持线性、条带化、RAID、镜像、快照、瘦池和缓存池等多种类型,实现灵活存储资源管理,需注意空间分配、R... 目录lvcreate命令详解一、命令概述二、语法格式三、核心功能四、选项详解五、使用示例1. 创建逻

三频BE12000国补到手2549元! ROG 魔盒Pro WIFI7电竞AI路由器上架

《三频BE12000国补到手2549元!ROG魔盒ProWIFI7电竞AI路由器上架》近日,华硕带来了ROG魔盒ProWIFI7电竞AI路由器(ROGSTRIXGR7Pro),目前新... 华硕推出了ROG 魔盒Pro WIFI7电竞AI路由器(ROG STRIX GR7 Phttp://www.cppcn

解读GC日志中的各项指标用法

《解读GC日志中的各项指标用法》:本文主要介绍GC日志中的各项指标用法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、基础 GC 日志格式(以 G1 为例)1. Minor GC 日志2. Full GC 日志二、关键指标解析1. GC 类型与触发原因2. 堆

Java设计模式---迭代器模式(Iterator)解读

《Java设计模式---迭代器模式(Iterator)解读》:本文主要介绍Java设计模式---迭代器模式(Iterator),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录1、迭代器(Iterator)1.1、结构1.2、常用方法1.3、本质1、解耦集合与遍历逻辑2、统一

MySQL之InnoDB存储页的独立表空间解读

《MySQL之InnoDB存储页的独立表空间解读》:本文主要介绍MySQL之InnoDB存储页的独立表空间,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、独立表空间【1】表空间大小【2】区【3】组【4】段【5】区的类型【6】XDES Entry区结构【