资讯配图

MIND脑机交互数据集项目

Massive BCI Interaction and Neural Dataset

资讯配图
资讯配图


资讯配图

01

MIND数据集背景

资讯配图

当代人工智能科技发展史表明,大规模、高质量、开放共享的数据资源往往成为颠覆性突破的催化剂。以人工智能领域为例:ImageNet大规模视觉识别挑战赛凭借百万级标注图像创造了具有里程碑意义的"ImageNet时刻",直接推动了深度学习革命,也带来了新的AI科技产业时代的到来。该数据集为AlexNet等架构的性能验证提供了关键支撑,其催生的物体识别技术突破已深入应用于自动驾驶、医学影像分析等前沿领域,正式开启了AI1.0时代。类似地,当前大语言模型(LLMs)的革命性进展,正是建立在CommonCrawl、ThePile等海量文本代码语料库的基石之上,使Transformer模型得以实现前所未有的能力跃迁,开启了AI2.0时代的序幕。同时在机器人及具身智能领域,Habitat与Gibson等平台生成的规模化仿真数据,正持续推动智能体环境交互技术的突破,为安全可扩展的策略学习开辟了新路径,正在开启AI3.0的时代。而不远的未来基于脑科学与脑机接口技术的类脑智能技术的发展,将使得AI技术更加具备人类智能的属性,也使得AI4.0的时代即将开启。

资讯配图

这种数据驱动范式早已超越人工智能范畴,基因组学领域的人类基因组计划与癌症基因组图谱(TCGA)构建了标准化大型生物数据库,为药物研发、精准医疗及疾病机制研究提供了不可或缺的基石;天文学领域的斯隆数字化巡天项目通过构建宇宙三维图谱,催生了大量关于星系形成与宇宙结构的重大发现。这些案例共同印证:系统化构建大规模真实场景基础数据集能有效赋能科研共同体,释放创新链式反应,进一步带动和催生产业科技的革命与变革。

然而脑机接口作为继传统PC交互,智能手机交互,虚拟现实交互等之后的意念交互-终极人机交互范式,脑机接口(BCI)交互领域长期受困于数据瓶颈:缺乏大规模、多场景、标准化的数据集,严重制约了高性能通用智能脑机交互模型的开发,阻碍了实验室成果向真实场景的转化和应用。为破解这一核心难题,姬械机(Maschine)科技正式启动"MIND"(Massive BCI Interaction and Neural Dataset,大规模脑机交互数据集)项目计划。本项目旨在构建具有脑机交互范式意义的真实场景任务基础数据资源,面向神经科学、机器学习与人机交互研究于工程开发应用领域开放共享,为BCI技术与产业应用的跨越式发展提供核心驱动力。

资讯配图

02

MIND数据集项目简介

资讯配图

MIND数据集计划是由姬械机(MachineRobot)发起组织建设的全球范围的大规模多任务脑机交互基座专项数据集项目,旨在通过该数据集的支持集合AI模型算法技术打通脑机接口与人机交互的主要阻碍,助力推进脑机交互时代的到来。姬械机科技在脑机接口硬件平台开发,脑机接口数据平台建设,脑机算法平台设计,脑机多场景脑机交互任务多方面积累了多年的经验和理解,同时姬械机科技自2021年开始持续与国内外多所高校与医学单位合作进行了多项不同任务脑机交互数据集项目的建设和实施,为MIND大规模真实场景脑机交互数据集项目的开展积累了宝贵的经验。

MIND专项脑机交互数据集项目建设,旨在将支持多类型脑机接口设备进行不同真实应用与交互场景的数据采集范式构建,并持续的进行有效数据集的采集。项目重点定完实现脑机设备全,交互任务多,覆盖脑区多,采集范式精,数据粒度细,数据标签准等目标。进一步实现基于意念交互形态打造新一代人机交互范式,希望有朝一日无缝衔接人类智能与人工智能,最终实现AI4.0(脑启发与脑机交互的人工智能-脑机接口与类脑智能)时代的到来。

资讯配图

AI4.0脑机接口与类脑智能


(1)MIND数据集设备
MIND数据集项目将支持不同类型的(医学类,科研类,交互产品类)满足对应数据信号质量的EEG类脑机相关数据采集设备系统,主要设备将覆盖主流的和规模化应用的各类品牌设备,如下图所示(未完全列举,只包含部分设备)。

设备型号

设备展示图

场景

推荐任务

德利凯-EEG系列

资讯配图

实验室

待定

Natus-NicoletOne

资讯配图

实验室

待定

博睿康-NSE系列

资讯配图

实验室

待定

博瑞康-NeuSenW系-

资讯配图

实验室/开放环境

待定

NeuroDance

资讯配图

实验室/开放环境

待定

ANTNeuro-visor2

资讯配图

实验室

待定

ANTneuro-WaveGuard系列

资讯配图

实验室/开放环境

待定

EGI-GES系列

资讯配图

实验室

待定

Natus-LTM系列

资讯配图

实验室

待定

Nox-A1s系列

资讯配图

实验室

待定

BEL-EEGsystem

资讯配图

实验室

待定

康迪-neuroscan系列

资讯配图

实验室

待定

BrainProducts-BrainAmp系列

资讯配图

实验室

待定

Philips-Alice系列

资讯配图

实验室

待定

SOMMOmedics-PSG系列

资讯配图

实验室

待定

Neuroelectrics-便携式脑电帽-

资讯配图

实验室/开放环境

待定

Emotiv-便携式EEG头戴设备

资讯配图

实验室/开放环境

待定

X-BCI脑机接口平台设备

资讯配图

实验室/开放环境

待定

BrianCo头环

资讯配图

实验室/开放环境

待定


(2)MIND数据集通道配置
基于该脑机交互数据集包括了不同不同脑机设备类对应的不同通道,主要有1、2、4、8、16、22、42、64、128、256等通道,对应采集通道位置布设规则标准如下图所示。

资讯配图

1-16通道脑机通道布设参考图资讯配图16-32通道脑机通道布设参考图资讯配图32-64通道脑机通道布设参考图资讯配图64-128通道脑机通道布设参考图资讯配图128-256通道脑机通道布设参考图资讯配图
大脑功能脑区划分图

(3)MIND数据集任务
MIND数据集主要面向打通人工智能脑机接口技术真实应用场景面临的各类人机交互任务应用,主要包括以交互任务为主的5大类数据集:
a.状态任务数据集;(占比20%)
b.交互任务数据集;(占比30%)
c.神经生物反馈数据集;(占比20%)
d.多模态交互数据集;(占比20%)
e.精神健康与神经健康数据集;(占比10%)

该数据集支持不同类型设备进行采集,并且允许多源设备并行采集如眼动信号,运动信号等数据,同时该数据集项目会引入VR及AR和智能眼镜作为内容和交互载体进行脑机数据采集,主要实现数据交互任务全,采集设备种类多,采集信号精,数据粒度细,数据标注准等要求。

资讯配图

MIND数据集采集体系

资讯配图MIND数据集采集方案


(4)MIND数据集项目计划

MIND数据集项目预期将在5年内完成累积10万人次的超过100项不同脑机交互任务的超大规模脑机数据集采集构建。主要项目规划如下:
第一年 基础样本数据范式及数据集采集 2025.10.1-2026.09.30
第二年 规模化数据集采集及测评 2026.10.01-2027.09.30
第三年 第一期规模化数据集采集及发布 2027.10.01-2028.09.30
第四年 第二期规模化数据集采集及发布 2028.10.01-2029.09.30
第五年 第三期规模化数据集采集及发布 2029.09.30-2030.09.30

该数据集建设将于2025年10月1日正式启动,于2026年9.30日完成主要的数据样本范式建设和样本数据集采集,并对第一年度开源采集参与单位提供采集任务与采集方案发放与支持。
于2027年10.1日启动第一期规模化数据集任务配发与数据采集验收测评及数据标注,并于2028年10.1日正式发布第一期MIND数据集供行业使用。
同时后续将持续扩大数据规模,并于2029.10.1日与2030年10.1日陆续发布第二期与第三期MIND数据集。

04

MIND数据集计采集任务与方案

资讯配图

MIND数据集项目在开始之初定位主要包括以交互任务为主的5大类数据集:
(1)状态任务数据集;
(2)交互任务数据集;
(3)神经生物反馈数据集;
(4)多模态交互数据集;
(5)精神健康与神经健康数据集;
其中各类都对应了不同类型的支持采集任务和推荐采集场景,以便在数据集构建过程中实现对应的质量及泛化使用需求。

资讯配图


(1)采集任务设定说明
状态类任务数据集任务主要包括:精神状态如疲劳,注意力集中程度,清醒程度,情绪状态,运动感知状态等数十类状态任务。交互任务数据集任务主要包括:控制指令,操作指令,通信指令等数十类交互指令。神经生物反馈数据集任务主要包括:触觉感知,嗅觉感知,味觉感知,听觉感知等数据类型反馈交互指令。多模态交互数据集任务主要包括:融合了眼动,体动,生理传感等维度数据的数十;类交互任务。精神健康与神经健康数据集主要包括:常规精神障碍类,如抑郁,焦虑,失眠状态以及神经健康如帕精森,渐冻症,老年痴呆等健康类数据集。

(2)数据采集流程说明
MIND数据采集流程主要包括采集任务认领,采集设备申报与校准,采集范式验证与发布,数据采集与标注分析,数据提交与验收,数据标准化处理与数据核准等流程。具体的将基于申领团队的采集环境及采集设备配置合理推荐并配发采集任务,并为采集团队提供经过验证后的标准采集范式,在完成数据采集后将由发起方与采集方共同推进数据标注与数据基础筛选,完成上述环节够将由发起方进行数据查验和验收,达标后将由数据发起方进行统一的数据标准化处理,并在完成处理后进行集中存贮和分类管理,并在达到对应规模和标准后对外提供访问使用。

资讯配图

(3)采集方案说明
MIND数据采集范式将由发起方统一设计定义,并在完成样本数据集采集验证后对参与才机房进行同步发布,确保相同交互任务数据获取范式的一致性。
设备校准将由采集方配合发起方按校准方案进行,在完成校准测评后可以予以进行任务发放采集开展,确保设备的可用性和采集数据的可迁移性。
数据集交互任务标注将由发起方与采集方共同进行标签设置及有效数据匹配与选取,通过严格把控数据标注来保障数据精度与标签准确性。
数据标准化将由发起方进行设计开发并实施处理,通过数据标准化将实现不同设备数据的一致性和复用性,方便跨设备数据使用与模型训练接入。
数据校准将由发起方进行,发起方将使用高精度脑机设备系统采集构建不同范式下对应不同交互任务的基准数据集。由不同采集方提供的数据集将统一基于精准数据集校准分析,确保数据质量的稳定性和可用性。
数据入库与发布,在经过数据校准后将统一进行数据清洗与格式标准化,并且统一基于不同任务进行数据入库,入库后达到一定规模后进行模型测评,在测评稳定后开始正式对外提供数据访问通道。

(4)数据共享权益说明
MIND数据集项目秉承开放与合作的理念,致力于打造一个服务于全球脑机接口交互应用产业数据集。该数据集使用和访问权限将向参与数据采集项目核心贡献单位免费开放,同时也会向科研单位,初创脑机交互科技公司开放模型平台训练支持。
a.核心贡献者:承担了MIND数据集主要采集任务的个人或团队将拥有获取全域数据集权限;
b.非核心贡献者:参与了部分MIND数据集采集任务的个人或者团队,讲获得相关领域数据集访问和限制性获取权限;
c.科研与脑机科技团队:未参与MIND数据及采集任务的研究与科技团队,提供在线平台训练访问支持;

(5)建议参与者
高校脑机实验室,脑机科技公司,脑机个人研究者
医院精神内科科室,医院睡眠医学科室

05

附录-过往脑机数据集项目简介

资讯配图

(1)睡眠与梦境脑机交互数据集

目时间:2021年

合作单位:浙江大学

数据集用途:脑机梦境交互产品研发
(2)渐冻症大脑状态数据集

项目时间:2022年

合作单位:北京协和医院

数据集用途:科学研究项目
(3)渐冻症大脑视觉记忆重建数据集

项目时间:2023年

合作单位:北京协和医院

数据集用途:科学研究项目
(4)情感交互数据集

项目时间:2024年

合作单位:浙江大学

数据集用途:脑机情感交互产品研发
(5)正常人群视觉记忆重建数据集

项目时间:2024年

合作单位:上海交大

数据集用途:
(6)脑机接口技术大赛数据集

时间:2025年

地点:北京脑机交互实验室

数据用途:脑机技术大赛模型训练数据集
(7)脑机交互数据集构建体系

会议时间:2024年

地点:浙江大学

会议目标:大规模真实场景脑机交互数据集构建

资讯配图2022ALS渐冻症大脑状态数据集采集资讯配图2023ALS渐冻症视觉记忆数据采集资讯配图2024正常人群视觉记忆重建数据采集资讯配图2024精细情感交互数据采集资讯配图2025年脑机技术大赛数据集采集资讯配图2024年脑机交互数据集构建研讨会海报

06

MIND项目参与咨询方式

资讯配图

MIND项目将于2025年10月1日正式启动,欢迎相关单位与人员进行数据采集参与咨询,同时后续将陆续开通固定网站进行项目计划同步与数据采集项目任务发布及任务查阅与申领等相关信息,敬请关注!


联系人:陈鑫

联系邮箱:xinchen@maschinerobot.com

END

商务合作
bp@maschinerobot.com
简历投递
hr@maschinerobot.com

关注智姬公众号

获取更多精彩内容