中文AI“读心术”来了！研究人员拟基于中文构建大规模脑电数据集

继今年5月美国得克萨斯州奥斯汀分校的团队开发出人工智能“读心术”以来，中国研究人员也开始着手建设中文语料刺激下的大规模高通量脑电数据集，这意味着针对中国人的AI“读心术”也有望问世。

(资料图)

第一财经记者了解到，澳门大学认知与脑科学中心助理教授伍海燕以及南方科技大学刘泉影联合课题组最近的这项工作获得了天桥脑科学研究院（TCCI）MindX数据支持计划的资助，但具体资助金额未披露。

伍海燕解释称，解码非侵入式脑电的一种思路是记录人们在接受特定刺激下产生的脑电，并建立AI模型进行对齐。目前，外国原声电影刺激下的脑电数据集相对完善，但大规模中文语料刺激下的脑电数据集尚属空白。通过中文语料刺激下的大规模高通量脑电数据集项目的建设，可以填补这一空白。

“探索适合中国人的语料刺激下脑电采集框架，未来我们将在大数据支撑的基础上，训练脑电编码模型与中文大模型对齐，促进基于脑电的语义解码技术和脑机接口应用，并进一步加深人类对于大脑学习、语言、记忆与注意力机制的理解。”联合课题组表示。

据了解，该项目的参与人员来自多位海内外脑科学和AI交叉方向的年轻学者，包括上海市精神卫生中心、南京师范大学、新加坡国立大学、北京大学以及科大讯飞的研究人员。

今年5月，美国研究人员已经在《自然神经科学》（Nature Neuroscience）杂志上发表研究文章，基于人工智能GPT大模型技术开发出一种解码器，可将大脑活动转化为连续的文本流，AI首次可以通过非侵入式的方法学会“读心术”。根据实验结果，GPT人工智能大模型感知语音的准确率可高达82%。

上述实验的具体实现方式是让研究对象在 fMRI 扫描仪内听一些音频故事，从而收集受试者的大脑活动数据。数据被发送到计算机系统中，并使用人工智能大模型GPT进行基于英语单词序列数据集的训练。此后，语义解码器根据受试者大脑活动生成单词序列，从而试图重新输出这些故事。整个过程受试者不需要说话，系统便可读取受试者的想法。

尽管这种非侵入性的“读心术”可能会对医学维度的研究以及患者有极大的好处，使其可以与他人进行可理解的交流，但这种技术也存在隐私、伦理审查、不平等和歧视等诸多问题，因此在现实中的应用还面临很大挑战。

“虽然这项技术还处于起步阶段，但重要的是要规范它能做什么，不能做什么。”一位从事脑机接口的专家向第一财经记者表示，“必须要有严格的监管程序，以防止它最终在未经个人许可的情况下使用，如果滥用该技术可能会产生负面后果。”

对此，TCCI中国负责人向第一财经记者介绍称：“MindX数据支持计划面向中国神经科学家、认知科学家、心理学家，以及神经和精神疾病医生开放，在安全合规的前提下，资助人类大脑及相关全身和行为数据的采集、分析和训练。”

这也是MindX计划首个落地的项目。上个月，TCCI发布了MindX计划，首期提供1亿元经费资助，同时表示将免费提供存储服务器、算力等基础设施，创新数据采集技术，以及AI和数据专业人才资源。

“目前，研究院已经在与数十支团队紧锣密鼓地洽谈中，希望尽快帮助更多的科学家和医生。”上述TCCI负责人表示。

关键词：