发表:17年四月,world wide web会议,深度学习的网络结构,训练方法,GPU硬件的不断进步,促使其不断征服其他领域
何向南:中科大教授,92年,28岁
点积和矩阵分解的关系:矩阵分解为两个矩阵相乘,又等价于第i行和第j列的点积
矩阵分解的限制性:Jaccard系数作为实际的结果,先计算u1,2,3,而后添加u4,发现,4和2的距离一定比4和3的距离更近
题外话:
Jaccard 主要用于判断集合间相似度,所以他无法像矩阵一样,体现更多的信息。
Cosine 的计算中,则可以把用户对电影的评分信息加进去。
目标:NCF,GMF,MLP,NeuMF
ranking loss:度量学习,相对位置,the objective of Ranking Losses is to predict relative distances between inputs. This task if often called metric learning.
解决方式:使用大量的隐藏因子去学习交互函数。
element-wise product:按元素积
将GMF作为一种特殊的NCF
如果a是恒等函数,h是1的均匀向量
经验:tower structure,halving the layer size for each successive higher layer
generalization ability:泛化能力,适应新样本的能力
神经张量网络,使用加法
神经矩阵分解,使用连结操作
显示评分:回归损失,预测一个值,平方损失
隐式交互:分类损失,预测离散结果,logistic
优化方法:随机梯度下降法
实验环境设置:
数据集,留一法,top-k排序,
HR@10:分母是所有的测试集合,分子式每个用户top-K推荐列表中属于测试集合的个数的总和
NDCG@10:最终所产生的增益(归一化折损累计增益)
BPR:基于矩阵分解的一种排序算法,针对每一个用户自己的商品喜好分贝做排序优化。在实际产品中,BPR之类的推荐排序在海量数据中选择极少量数据做推荐的时候有优势。淘宝京东有在用。部分填充,速度十分快。
eALS:最新的关于隐式数据的协同过滤算法,用一步到位的计算公式全部填充缺失值。
rel表示关联性,就是跟所想要的结果的关联度,0表示没有关联,越高说明关联性越高
i是位置,关联性乘以位置,就是第i个结果所产生的效益
IDCG是理想化的最大效益。
NeuMF,%5更优
NeuMF > GMF > MLP
理论成果
GMF: weights w can simply be absorbed into the embeddings matrices P and Q
总之,应用场景(数据集)不同,采用的方法应该不同,灵活使用推荐算法或模型
本文综述人工智能/机器学习(AI/ML)算法在肾替代治疗(血液透析,腹膜透析和肾移植)中的研究现状及其影响。
包括了哪些医疗方面?
有什么AI/ML算法被使用过?
研究了三个医疗领域关于血液透析(hemodialysis,HD),腹膜透析(peritoneal dialysis,PD),肾移植(kidney transplantation,KT)的四个使用AI/ML的电子数据库或研究。
所以分为了HD,PD,KT三类。
AI能比肾脏学家更好的预测:体积,KT/V(一定透析时间内透析器对尿素的清除量与体积的比值。),透析期间发生低血压或心血管事件。
这些实验报告了AI/ML对G5D/T患者的生活质量和生存期的强大影响。
未来几年,人们可能会看到AI/ML设备的出现,它有助于透析患者的管理,从而提高生活质量和生存。
CKD: chronic kidney disease,慢性肾脏病
G5D/T: 终末期肾脏病,需要长期透析治疗。
FDA: US Food and Drug Administration,美国食品和药物监管局
ESRD: end-stage renal disease,终末期肾病患者
: Preferred Reporting Items for Systematic Reviews and Meta-Analyses,系统综述和Meta分析优先报告的条目
本文按照该标准查找并筛选文章
分为四个流程(对应图1):
通过数据库检索文献
直接剔除重复文献
RCTs: randomized controlled trial,随机对照试验
AI/ML的方法已经步入平稳期:美国食品和药物管理局发布了监管框架,用于修改基于AI/ML的软件作为医疗设备。该委员会去年批准了至少15个涉及医疗领域的人工智能/深度学习平台(例如,用于房颤检测、CT脑出血诊断、冠状动脉钙化评分、辅助中风诊断或乳房x线摄影乳房密度)。
有数据集但没成功:在过去的15年里,许多问题和并发症产生的终末期肾病需要透析,使得人工智能算法得到了初始输入。但上述的成功案例均未发现。
成功案例引起肾学家思考:医学图像处理对医疗保健的重大影响,手术中的智能机器人,苹果手表对心房颤动检测的影响。
思考:
将这种成功应用于透析设计
开发智能透析设备
下一步目标:用AI加强透析机(也就是人工肾)的功能。
理论基础:2019年的论文——基于透析患者特征、历史血流动力学反应和透析相关处方,开发了一个多终点模型来预测特定时段的Kt/V、液体容量去除、心率和血压,
理论意义:为关于ESRD患者的人工智能研究打开了大门,ml驱动的机器连续自主地改变参数(温度、透析液电解质成分、持续时间和超滤速率),避免透析过程中糟糕的情况(例如低血压)。从而告诉我们,肾脏学是一门“个体化医学”,因为透析过程不一样。
遵循PRISMA指导原则(详看上述专有名词)
搜索PubMed、SCOPUS、Web of Science和EBSCO的电子数据库,最早的论文为2019年8月。
筛选阶段获得77篇论文,通过两名审稿人讨论和协商后,69项符合标准。(对应表1-表3)
图1:筛选过程分为四个流程:
按照关键词通过数据库检索文献,获得455篇
直接剔除重复文献,101篇
阅读题目和摘要后再剔除,189篇重复,68篇不是手稿(手写),7篇没有临床,13篇没有文本
阅读全文后再剔除,2篇重复,2篇不是手稿,1篇没有临床,3篇质量差
图2:所有研究分为三大类,12小类:
注:他克莫斯移植后,而不是后移植,指治疗调节。
实验的特征:
大多数研究是观察性的,除了一个随机对照实验(RCT),超过60%的研究是在2010年之后报道的。
大多数HD(血液透析)研究涉及个体化贫血管理和透析过程参数。准确预测移植排斥反应或移植后个体化免疫抑制治疗是AI和KT(肾透析)试验的主要主题。
表2:根据AI算法的类型进行分类:
算法分析:
64项研究包括ML算法: 未指定的、朴素贝叶斯模型、支持向量机(SVM)和马尔可夫决策过程强化学习(MDP)。
1个K近邻,1个MLP,30个未指定的神经网络算法。
11项研究基于树的模型(TBM),随机森林(RF)或条件推理树
4次实验涉及数据挖掘
人工智能如何改善向HD(血液透析)提供的医疗服务?
预防
人工智能能够为临床结果不令人满意的HD实验确定风险概况。
实验一
一个MLP模型使用了来自111名尿毒症患者5年PD数据库的透析前数据并证明了该方法将透析前患者分为高转运蛋白组和低转运蛋白组有效性。
可以为尿毒症患者提供更好的治疗选择,这将改善PD患者的预后,降低发病率和死亡率。
实验二
利用反向传播方法构造和训练了73-80-1节点结构的MLP,确定PD技术失败的相关因素,以便开发干预措施以减轻风险因素
实验三
人工智能的使用如何改善向PD(腹膜透析)提供的医疗服务?
预防
人工智能被用来确定PD技术失败的相关因素,指定干预措施以减轻风险因素
诊断
实验一
NNs可用于预测慢性肾移植排斥反应(作者描述了对27例慢性排斥反应患者的回顾性分析,八个简单变量对排斥反应有很大影响)
实验二
一项对2005年至2011年500名患者的研究使用最大似然算法(SVM、随机森林和离散余弦变换)预测“延迟移植功能”,结果表明线性SVM具有最高的鉴别能力(AUROC为84.3%),优于其他方法。
实验三
DTW(动态时间规整算法)用于识别一系列实验室数据中的异常模式,从而早期发现并报告与急性排斥反应相关的肌酐病程[56]。对数据库中存储的1,059,403个实验室值、43,638个肌酐测量值、1143名患者和680次排斥事件进行数据提取。通过将人工智能集成到电子患者登记系统中,可以前瞻性地评估对移植受者护理的真正影响。
人工智能的使用如何改善向KT提供的医疗服务?
诊断
AI能够通过识别一系列实验室数据中的异常模式来检测和报告急性KT排斥反应相关的早期肌酐病程,从而允许快速干预和改善KT病人的后遗症
6 x 6的字符矩阵
注意力一次集中到一个字符上
行和列以5.7Hz频率连续随机增强
6次行,6次列,分别有一行和一列包含目标字符,此时引起的反应,类似P300
三个时间段的同一个受试者的信号,240Hz
每个会话:包含多个运行
每次运行:用户集中在一系列字符中。
每个字符:
文件名:example.m
该程序比较session10-run01数据集中,对目标与非目标刺激(即,包含/未包含所需字符的刺激)的响应
文件名:testclass.m
使用一个非常简单的分类器来预测session12-run01中单词的第一个字符
它在增强后使用Cz和310ms处的一个样本进行分类。 它确定目标字符为振幅最高的字符(Cz / 310ms)
它针对session12中的单词01中的第一个字符执行此操作
用机器学习(即随机森林):
量化关系质量的可预测程度
确定哪些结构可以可靠地预测关系质量。
关系质量的最高预测因子是:(RF里的重要性?)
感知伴侣承诺
欣赏
性满足
感知伴侣满意度
个体差异最大的预测因子:(方差?)
生活满意度
消极情绪
抑郁
依恋回避
??特定于关系的变量在基线时预测的方差高达45%,在每个研究结束时预测的方差高达18%。
Overall, relationship-specific variables predicted up to 45% of variance at baseline, and up to 18% of variance at the end of each study.
??个体差异和伴侣报告除了行为人报告的关系特异性变量外,没有预测效果。
Importantly, individual differences and partner reports had no predictive effects beyond actor-reported relationship- specific variables alone.
结论:
所有个体差异和伴侣经验的总和通过一个人的特定关系经验对关系质量产生影响,并且由于个体差异的调节和伴侣报告的调节而产生的影响可能很小。
??最后,通过任何自我报告变量的组合,发现关系质量的变化(即,在研究过程中关系质量的增加或减少)在很大程度上是不可预测的。
什么能预测人们对他们的浪漫关系有多幸福?
已经确定了数百个据称影响浪漫关系质量的变量。目前的项目使用机器学习来直接量化和比较11196对浪漫夫妇中许多这样的变量的预测能力。
人们对关系有自己的判断,比如他们对伴侣的满意程度和忠诚程度,感激程度,解释了他们目前满意度的45%。
来自每对情侣的浪漫伴侣的数据
从至少相隔2个月的至少两个时间点收集的数据
在每个时间点收集的关系满意度的测量值
同时处理多个变量,最小化过拟合
建立分类树和回归树
随机森林方法使用一个随机的预测器和参与者子集,通过一个称为递归分区的过程,一次一个地测试每个可用预测器的强度。
举例能够预测非线性关系:
For example, a model with actor- and partner-reported predictors would detect any robust actor × partner interactions (e.g., moderation, attenuation effects, matching effects) that could not be captured in a model featuring actor- or partner-reported predictors alone.
参数设置:
ntree = 5000,树的数量
mtry = 1/3,每个节点上可用于拆分的预测因子数量
R语言中的VSURF包:An R Package for Variable Selection Using Random Forests Robin Genuer
输出:
每个模型都显示了模型解释的总方差量,以及作为预测变量的具体变量
模型设置:
对每个数据集进行了21个随机森林模型,
满意度为因变量
7个预测基线满意度,
7个预测后续满意度
7个预测满意度变化
类似地,我们对每个包含忠诚的数据集(即我们的次要因变量)进行了21个随机森林模型,每个数据集总共有42个随机森林模型(最大值)。
总共有43个数据集,每个数据集最大42个模型
每个数据集的结果在 https://osf.io/4pbfh/
42个模型中的每一个都作为一个??单独的随机效应元分析进行了检验;
21个满意度荟萃分析分别包含k=43个效应量(effect sizes),每个数据集对应一个21个满意度模型
21个忠诚度元分析每个包含k=31个效应量。有31个数据集有忠诚数据,每个数据集对应一个21个忠诚度模型
我们使用综合荟萃分析进行基本分析。
为了计算每个效应量,我们将随机森林模型结果的“方差占比”转换为效应大小r(通过取平方根);
满意度和忠诚度的元分析数据文件在https://osf.io/v5e34/。
分析12种可能的元分析调节因子,
10个是数据集的特征:研究长度、时间点之间的长度、时间点的数量、样本的平均关系长度、样本的平均年龄、开始收集数据的年份、国家、出版状态(至少有1个出版物与未出版过的文献)、样本类型(社区与大学生)、关系状况(约会vs.已婚)。
2个是元分析数据特有特征:
随机森林模型中预测因子的数量
使用了,表现调节分析.
两个问题:
什么能预测我对我的伴侣会有多满意和忠诚
答案:
负面影响、抑郁或不安全的依恋肯定是关系的危险因素
如果人们设法建立起一种以欣赏、性满足和较少冲突为特征的关系,并且他们认为他们的伴侣是忠诚的和有反应的,那么这些个人的风险因素可能无关紧要。
关系质量可以从各种结构中预测,但有些结构比其他结构更重要,而最接近的预测因素是表征一个人对关系本身感知的特征。
import pandas as pd
import numpy as np
from scipy.io import loadmat# AAS011R06.mat
m = loadmat('Data/P300/v2/AA001.mat')
m{'__header__': b'MATLAB 5.0 MAT-file, Platform: PCWIN, Created on: Thu Nov 29 14:36:17 2001',
'__version__': '1.0',
'__globals__': [],
'run': array([[3],
[3],
[3],
...,
[8],
[8],
[8]], dtype=uint8),
'trial': array([[ 0],
[ 0],
[ 0],
...,
[192],
[192],
[192]], dtype=uint8),
'sample': array([[ 0],
[ 1],
[ 2],
...,
[28829],
[28830],
[28831]], dtype=uint16),
'signal': array([[-1136, -416, -592, ..., -816, -496, -624],
[-1456, -912, -752, ..., -48, 336, -48],
[-1888, -912, -480, ..., -240, 0, 64],
...,
[-1952, -2416, -2336, ..., -1376, -2096, -1168],
[-2784, -2912, -2912, ..., 144, -800, -48],
[-1872, -1168, -1264, ..., 1008, 304, 816]], dtype=int16),
'TargetCode': array([[0],
[0],
[0],
...,
[0],
[0],
[0]], dtype=uint8),
'ResultCode': array([[0],
[0],
[0],
...,
[0],
[0],
[0]], dtype=uint8),
'StimulusTime': array([[51992],
[51992],
[51992],
...,
[54165],
[54165],
[54165]], dtype=uint16),
'Feedback': array([[0],
[0],
[0],
...,
[0],
[0],
[0]], dtype=uint8),
'IntertrialInterval': array([[1],
[1],
[1],
...,
[1],
[1],
[1]], dtype=uint8),
'Active': array([[1],
[1],
[1],
...,
[1],
[1],
[1]], dtype=uint8),
'SourceTime': array([[52082],
[52082],
[52082],
...,
[54256],
[54256],
[54256]], dtype=uint16),
'RunActive': array([[1],
[1],
[1],
...,
[1],
[1],
[1]], dtype=uint8),
'Recording': array([[1],
[1],
[1],
...,
[1],
[1],
[1]], dtype=uint8),
'IntCompute': array([[0],
[0],
[0],
...,
[0],
[0],
[0]], dtype=uint8),
'Running': array([[1],
[1],
[1],
...,
[1],
[1],
[1]], dtype=uint8)}for i in m:
try:
print(i,m[i].shape)
except:
continue
# 运行编号(runnr),运行内的强化次数(trinr)和运行内的样品编号(sample)
# 其他部分由于网页乱码看不出来,也可能说明文件中没有展示,需要浏览matlab文件run (172992, 1)
trial (172992, 1)
sample (172992, 1)
signal (172992, 64)
TargetCode (172992, 1)
ResultCode (172992, 1)
StimulusTime (172992, 1)
Feedback (172992, 1)
IntertrialInterval (172992, 1)
Active (172992, 1)
SourceTime (172992, 1)
RunActive (172992, 1)
Recording (172992, 1)
IntCompute (172992, 1)
Running (172992, 1)矩阵显示时间2.5s,此时字符强度相等 ==> 视为空白
每一行和每一列被随机增强100ms,增强后,空白75ms
每个字符重复12组增强15次,共计180次增强
2.5s空白
每次实验的单个通道信号量 = {2.5s + [(100+75) x 180 x 字符数]/1000 + 2.5s }x 240 Hz
阅读题目和摘要后再剔除
阅读全文后再剔除
最终获得69篇论文
最终获得69篇论文
5次使用了模糊逻辑方法
1项研究包括特定的NLP算法
2项包括贝叶斯置信网络和动态时间扭曲(DTW)算法
诊断
用人工智能评估动静脉瘘管的流通性可以改善HD实验的结果和病人的生命质量
通过用人工智能解决方案代替更昂贵的诊断流程能减少医疗成本
处方
人工智能推荐药物剂量预防HD相关的并发症如贫血和血红蛋白的波动、矿物质失衡等
算法的参与会导致更少的并发症和减少药物的使用,减少治疗费用
预测
人工智能用于预测HD期间的死亡率和生存率
特定的算法预测生命质量,对心血管的测量结果和透析内的血流动力学事件的变化
生存和生命质量预测模型可以减轻对公共卫生的影响,更好的指导资源的使用
预测血流动力学事件通过避免低血压、心率和容量的变异性以实时适应HD过程,从而保证HD实验的成功和整体成本效益的干预措施。
挑战和需要更多人工智能研究的HD领域
实时监控的人工智能系统通过在HD实验中的嵌入式自动适应性反应以实现个性化治疗
通过AI/ML系统和专家负责的HD实验的反馈实现两者之间潜在的相互作用,使得两个部分相互学习,为ESRD患者提供更好的决策。
更多的人工智能系统将部署在HD病人护理上,这会产生规模更大的数据。应促使制定有关数据隐私、维护和共享的严格法规,以便在公共医疗保健中更安全地实施
实验四
利用CAPD患者的数据挖掘模型,提取模式,根据他们的血液分析对卒中风险患者进行分类。在最近的一项研究中,分析了850个病例的数据集,五种不同的人工智能算法(朴素贝叶斯、逻辑回归、MLP、随机森林和k-NN)被用来预测患者的中风风险。RT和k-NN预测脑卒中风险的特异性和敏感性均为95%。
人工智能算法可以发现生物标志物特征与不同类型的感染之间的联系
对早期采取适当的治疗方法以及避免易感ESRD患者的严重感染并发症有巨大的意义
AI通过突出PD中病原体特异性炎症反应所涉及的关键途径,为扩大病理生理机制的科学知识做出贡献
处方
通过使用人工智能,将透析前患者分为高转运蛋白组和低转运蛋白组,可以为尿毒症患者提供更好的治疗选择,这将改善PD患者的预后(根据经验预测的疾病发展情况),降低发病率和死亡率
预测
AI能预测流体过载等并发症,心脏衰竭或腹膜炎
算法可以识别患者中风的风险,因此允许早期干预和减少PD的住院数
挑战和需要更多人工智能研究的PD领域
人工智能可以用来识别有腹膜炎风险的患者,以降低感染风险,克服腹膜透析过程中的巨大负担
在自动化PD中开展家庭远程监测的研究可以改善患者的治疗结果和对治疗的坚持
展开家庭远程监控自动地进行腹膜透析
对使用吸附剂技术的透析液再生制造自动化可穿戴人工肾PD装置的安全性的研究
实验四
在一项对257名接受KT的儿科患者进行的回顾性研究中,采用了一个经过反向传播训练的MLP,使用20个简单的输入变量来确定血清肌酐的延迟下降(移植肾功能恢复的延迟)[57]。据报道,其他模型(决策树)突出了有移植物丢失风险的受试者。
实验五
使用USRDS数据库中的数据集(来自5144名患者的48个临床变量),开发了一个作为移植前器官匹配工具的M1软件(基于贝叶斯信念网络(BBN))。该模型可以预测第一年内移植失败,特异性为80%。
实验六
对1045名KT患者进行研究,8项ML技术接受了基于药物遗传算法的TSD()预测培训。确定了与TSD显著相关的临床和遗传因素。高血压、奥美拉唑的使用和CYP3A5基因型用于构建多元线性回归(MLR)
实验七
一项涉及129名KT患者的前瞻性研究证实,通过神经网络将多个ABCB1多态性与CYP3A5基因型结合起来,可以更准确地计算出他克莫司的初始剂量,从而改善治疗并预防他克莫司毒性。
实验八
37名KT患者被随机分为低脂标准组和地中海饮食组。对于黄斑变性组,神经网络有两个隐藏层,分别有223个和2个神经元。在对照组中,网络也有两个隐藏层,分别有148个和2个神经元。结论是在不影响血脂水平的情况下,地中海饮食对移植后患者是理想的。该报告是唯一一项评估移植后不同类型饮食优势的研究。
各种ML模型准确地预测他克莫司稳定的剂量,成功改善移植后的免疫抑制治疗和预防他克莫司毒性
正确地管理免疫抑制对避免移植物丢失有着巨大作用
ML可以评估移植手术后不同类型的饮食的优势,可以使KT对生命质量产生积极的影响
预测
人工智能被用于预测移植排斥反应、“移植延迟功能”和死亡率
人工智能算法可做作为移植前器官匹配工具,使得器官的分配更加合理,从整体优化KT医疗保健管理系统
挑战和需要更多人工智能研究的KT领域
预防性的人工智能工具可以用于识别移植物排斥和移植物丢失的可变危险因素,为病人提供成功率更高的KT
指导方针需要支持使用人工智能来分配器官或预测排斥反应
通过将人工智能整合到电子病人登记系统中,可以很容易地对人工智能对移植受者护理的影响进行前瞻性评估
我们期望在未来几年,所有肾移植程序将通过人工智能管理
AI+HD,血液透析
AI+PD,腹膜透析
AI+KT,肾移植
43个实验
8个实验
18个实验
透析服务管理,透析程序,贫血管理,激素/饮食问题,动静脉瘘(异常通道)评估
腹膜技术问题,感染,心血管事件预测
管理系统(ML用作移植前器官匹配工具),预测移植排斥反应,他克莫斯(肝肾移植的一线用药)治疗调节,饮食问题
主题:
AI+HD,血液透析
AI+PD,腹膜透析
AI+KT,肾移植
实验数量:
43个实验
8个实验
18个实验
功能:
透析服务管理,透析程序,贫血管理,激素/饮食问题,动静脉瘘(异常通道)评估
腹膜技术问题,感染,心血管事件预测
管理系统(ML用作移植前器官匹配工具),预测移植排斥反应,他克莫斯(肝肾移植的一线用药)治疗调节,饮食
冲突
依恋焦虑
分别产生了数千个决策树,然后使用平均值结合在一起。
结果
??依赖性测试中多少方差是可预测的。
哪些变量对模型的贡献度大
??方差占比==特征重要性
不纯度(impurity)在分类中通常为Gini不纯度或信息增益/信息熵,对于回归问题来说是方差。
概率越大,纯度(或熵)越小 ,即发生的不确定性越小
然后我们进行Fisher-zr变换,我们使用N-3作为逆方差权重,其中N等于随机森林中使用的观察数分析
??参考论文31,32
z' = 0.5 * ln((1+z)/(1-z))
我们将meta分析的结果转换回结果中占百分比的方差(通过将值平方)
分类结果应用:神经疾病诊断、情绪测量和驾驶疲劳检测。
脑机接口的深度学习的分类:
仅用于特征提取;
仅用于分类;
同时用于特征提取和分类。
传统BCI所面临的挑战:
大脑信号很容易被各种生物因素(如眨眼、肌肉伪影【肌肉产生的电波对脑电波的影响】、疲劳和注意力集中程度)和环境因素(如噪音)所破坏
低信噪比的非平稳脑电生理信号
特征提取高度依赖于人类在特定领域的专业知识。
大多基于静态数据上,无法对快速变化的大脑信号进行准确分类【最先进的多类别运动图像脑电图分类准确里低于80%】
深度学习好处:
直接作用于原始的大脑信号
深层神经网络和第二层神经网络都能捕获潜在的,具有代表性的特征。
综述论文贡献:
对非侵入性脑信号论文的全面性调查
脑电图及其亚类(运动脑电图,P300等)
功能性近红外光谱(functional near - infrared spectroscopy , fNIRS)【利用血液的主要成分对600-900nm近红外光良好的散射性,从而获得大脑活动时氧合血红蛋白和脱氧血红蛋白的变化情况,产生功能性神经影像】
功能性磁共振成像(FMRI,functional magnetic resonance imaging)【是一种新兴的神经影像学方式,其原理是利用磁振造影来测量神经元活动所引发的血液变化。从而监测大脑活动】
脑磁图(Magneto Encephalo Graphy,MEG)【是一种非侵入性技术,用于测量由大脑中神经元的电活动引起的磁场。通过磁变化反映大脑活动】
研究深度学习和大脑信号之间关系
指出前沿和发展方向
对广泛情况的概述
综述论文内容:
回顾大脑信号和深度学习技术
讨论了流行的深度学习技术和最新的脑信号模型,为在给定特定信号亚类的情况下选择合适的深度学习模型提供了实用指南。
回顾了基于深度学习的脑信号分析的应用,并指出了一些有前景的未来研究课题。
基于信号收集方法的非侵入性脑信号分类(虚线不调查)
P300包含于ERP中。
ERP:一种特殊的脑诱发电位,通过有意地赋予刺激以特殊的心理意义,利用多个或多样的刺激所引起的脑的电位。它反映了认知过程中大脑的神经电生理的变化,也被称为认知电位,也就是指当人们对某课题进行认知加工时,从头颅表面记录到的脑电位。
其他脑成像技术(fNIRS,fMRI)中的视觉/听觉任务未曾有采用过深度学习,但理论上可行。
分类模型:Multi-Layer Perceptron (MLP) , Recurrent Neural Networks(RNN) , Convolutional Neural Networks (CNN) --> 特征提取和分类
表示模型:Autoencoder(AE), Restricted Boltz-mann Machine (RBM) , Deep Belief Networks(DBN) --> 只能特征提取
生成模型:Variational Autoencoder (VAE),Generative Adversarial Networks (GANs) --> 主要用于生成脑信号样本,增强训练集
各个非侵入式脑信号特征:
4.1.1.1 睡眠脑电:
主要用于识别睡眠阶段、诊断睡眠障碍或培养健康习惯
睡眠阶段包括清醒、非快速眼动1、非快速眼动2、非快速眼动3、非快速眼动4和快速眼动。
美国睡眠医学学会(AASM)建议将睡眠分为五个阶段:清醒、非快速眼动1、非快速眼动2、慢波睡眠(SWS)和快速眼动。
识别睡眠阶段,一般通过滤波器实现脑电信号的预处理,数据通常是30s的窗口,50hz。
分类模型:CNN用于单通道EEG的睡眠阶段分类,86%精确度
表示模型:DBN-RBM(深度置信网络-受限玻耳兹曼机)从睡眠脑电信号中提取功率谱密度(PSD,表示随机信号的强度),在局部数据集达到F-1值92.78%(兼顾召回率和精确度)
混合模型:
CNN+MLP来预测睡眠阶段
CNN接收原始的时域脑电振荡
MLP接收经短时傅立叶变换(STFT)处理的0.5~32hz的频谱信号。
DBN+MLP来识别新生儿睡眠状态
CNN+LSTM的睡眠阶段自动评分模型、
前者用于发现”time-invariant dependencies“
后者(双向LSTM)采用睡眠时的时间特征
针对时间睡眠阶段分类的混合深度学习模型
利用MLP检测层次特征
LSTM进行序列信息学习。
4.1.1.2 运动想象脑电:
深度学习在运动想象脑电图和真实运动脑电图的分类上显示出优越性
分类模型:大多使用CNN来识别脑电图,例如:
有分别采用CNN和二维CNN进行分类的
从EEG信号中学习情感信息,构建改进的LSTM控制智能家电
使用CNN进行特征提取
先用CNN捕获潜在的连续特征,然后应用弱分类器选择重要特征进行最终分类
研究CNN如何通过MI EEG样本序列来表示光谱特征
另外,还有MLP分类(前期对EEG相位【波峰,波谷】特征敏感,后期对EEG幅度特征敏感)
表示模型:DBN具有很高的代表性,被广泛应用,例如:
基于RBM组件的卷积DBN
利用离散小波变换对脑电信号进行处理,然后应用基于声发射去噪的DBN-AE
AE模型(用于特征提取)和KNN分类器的组合
混合模型:
利用CNN从EEG信号的时间、频域和位置信息中提取高级表示,然后使用一个包含7个AEs的DBN-AE作为分类器
使用去噪AE进行降维,将multi-view CNN与RNN相结合,在公共数据集上实现了对潜在时空信息的发现,平均准确率为72.22%。
4.1.1.3 情绪脑电图
个体的情绪可以从三个方面来评价:评价值(积极感情的值)、唤起度(激动的程度)和控制力。
这三个方面的结合形成了恐惧、悲伤和愤怒等情绪,这些情绪可以通过脑电图信号来揭示。
分类模型:传统上使用MLP,CNN和RNN正在越来越流行
典型的基于CNN:CNN的分层,扩充CNN训练集
通过多通道脑电信号转化为二维矩阵来捕捉通道之间的空间相关性
GRU(门控循环单元)组成的分类深度学习模型
时空递归神经网络:利用多向RNN层来发现长距离上下文线索,使用双向RNN层来捕获先前空间RNN产生的序列特征
表示模型:DBN-RBN因为情感识别的无监督表示能力强而广泛使用
用三个RBM和一个RBM-AE的DBN-RBM算法来预测情感状态
将DBN-RBM与SVM和隐马尔可夫模型(HMM)相结合来预测情感状态
提出五个隐层的D-RBM算法,用于情感识别中重要的频率模式(??)和信息通道(了解情感的渠道)的搜索
混合模型:常用的是RNN+MLP
采用LSTM架构从情绪EEG信号中提取特征,并将特征转发到MLP中进行分类
多视角集成分类器,利用多模态生理信号识别个体情绪。集成分类器包含多个D-AEs(去噪自编码器?),具有三个隐藏层和一个融合结构。
4.1.1.4 精神病脑电图
大量研究人员利用脑电图信号诊断神经系统疾病,特别是癫痫发作
分类模型:CNN广泛应用于癫痫发作的自动检测
CNN对癫痫发作的高通量(1hz)EEG信号进行研究,获得了94.7%的AUC
在抑郁症检测上采用了13层CNN模型,在30名受试者的局部数据集上进行了评估,基于左半球和右半球EEG信号的准确率分别为93.5%和96.0%
利用CNN结构提取多通道EEG信号的合适特征,将阿尔茨海默病从轻度认知障碍患者和健康对照组中进行分类
回声状态网络(ESNs)模型,它是RNN的一个特殊类别,用来区分RBD和健康个体
眼运动行为障碍(RBD)可引起帕金森病(PD)等多种精神障碍疾病
使用CNN提取潜在特征,并输入随机森林分类器,以最终检测新生儿癫痫发作
将CNN和传统的精神分裂症识别分类器结合起来。
表示模型:对于疾病检测,一种常用的方法是采用具有代表性的模型(例如DBN),然后使用softmax层进行分类
采用DBN-AE从癫痫发作的EEG信号中提取信息特征。将提取的特征输入到传统的logistic回归分类器中进行癫痫检测。
多视图DBN-RBM结构来分析抑郁症患者的EEG信号。
混合模型:一种流行的混合方法是RNN和CNN的结合
研究了CNN-LSTM在信道选择后检测癫痫的性能,灵敏度(实际真,结果真)在33%到37%之间,而假警报(实际假,测出真)在38%到50%之间。
通过整合时间和空间信息来自动解释EEG。二维和一维cnn捕捉空间特征,LSTM网络捕捉时间特征。
将D-AE和MLP结合起来。
4.1.1.5 数据增强
实验1:EEG信号转换为图像
首先证明了脑电波中包含的信息被赋予了区分视觉对象的能力
然后使用RNN提取了更健壮、更具区分性的脑电数据表示。
最后,利用GAN范式训练了一个由学习的EEG表示调节的图像生成器,该生成器可以将EEG信号转换为图像
实验2:将EEG信号转换为图像
当受试者观察屏幕上的图像时,采集脑电图信号。将脑电信号的潜在结构作为输入,提取脑电信号的潜在特征。
GAN的产生器和鉴别器均由卷积层构成。该发生器根据训练后的脑电信号生成图像。
实验3:癫痫发作数据增强的GAN(生成式对抗网络)
发生器和鉴别器都是由全连接层组成的。
作者证明了GAN优于其他生成模型,如AE和VAE(可变自动编码器)。增强后,分类准确率从48%提高到82%。
4.1.1.6 其他
实验1:听觉/视觉刺激(持续存在的刺激)如何影响脑电图信号
13名受试者受到23种节律性刺激的刺激,其中包括12种东非和12种西方刺激。
对于24类分类,提出的CNN平均准确率为24.4%。
之后,作者利用卷积AE进行表征学习,CNN用于识别,12类分类的准确率达到27%
实验2:区分是在听歌还是想象歌曲
提出两个深度学习模型,使用二值分类任务,所提出的CNN和DBN-RBM(三个RBM)的准确率分别为91.63%和91.75%。
实验3:自发脑电图可以用来区分使用者的心理状态(逻辑与情绪)
实验4:认知负荷(处理具体任务时加在学习者认知系统上的负荷)或体力负荷对EEG的影响
首先通过小波熵和频带比功率提取信息特征
然后将其输入DBN-RBM进行进一步细化。
最后,利用MLP对认知负荷水平进行识别。
实验5:在不同心理负荷下,受试者之间及受试者本身中的一般特征是恒定的。
从高水平脑电信号中收集的脑电信号。
脑电信号经低通滤波器滤波后,转换到频域,计算功率谱密度(PSD)。
提取的PSD特征被输入到去噪D-AE结构中,以便于进一步的细化。最终得到了95.48%的准确率。
实验6:驾驶员疲劳检测 --- 三维CNN
精神疲劳程度的识别,包括警觉、轻度疲劳和严重疲劳
实验7:驾驶员疲劳检测 --- ICA+DBN-RBM
ICA(独立成分分析)对脑电信号预处理
采用DBN-RBM进行分类
达到85%左右准确率,二分类(“昏昏欲睡”或“警惕”)。
从时间采样、通道批量和窗口采样三个层面对DBN-RBM进行了评估。实验表明,通道批量的性能优于其他两级。
实验8:驾驶员疲劳值检测 --- DBM-RBM+SVM,精度达到73.29%
实验9:调查了不同低负荷水平下驾驶员的心理状态。提出了一种基于脑电信号直接检测驾驶负荷的CNN方法。
实验10:基于EEG信号的眼睛状态(闭或开)的检测
三个RBM的DBN-RBM和三个AEs的DBN-AE,98.9%的高准确率
MLP,97.5%准确率
事件相关去同步(ERD)表示正在进行的EEG信号的功率下降,
事件相关同步(ERS)表示EEG信号的功率增加
实验11:采用CNN在观看特定视频时通过脑电图检测学校欺凌行为。
二分类和四分类分别达到93.7%和88.58%。
实验12:结合RNN和CNN提出了一个级联框架来预测个体的情感水平和个人因素(五大人格特征、情绪和社会背景)。
实验13:试图根据使用者的脑电图信号来识别他们的性别
采用标准的CNN算法,在局部数据集上实现了81%的二元分类精度
实验14:驾驶员的脑电图信号可以区分刹车意图和正常驾驶状态
**实验15:**将大脑信号和推荐系统结合起来,通过EEG信号预测用户的偏好。
共有16名受试者接受了60个手镯状物体作为旋转视觉刺激物(3D物体)时采集脑电信号的实验。
然后采用MLP预测用户喜欢或不喜欢。本次勘探的预测精度为63.99%。
**实验16:**试图探索一个可用于各种脑信号范式的共同框架,并评估鲁棒性。基于compact CNN的EEGNet [73]
4.1.2.1 ERP事件相关电位
在大多数情况下,ERP信号都是通过P300现象来分析的。
4.1.2.1.i VEP视觉诱发电位
较热门。
实验1:通过深度学习提取具有代表性的特征来研究运动开始的 VEP(mVEP)
采用遗传算法结合多级传感结构对原始信号进行压缩。
压缩后的信号被发送到DBN-RBM算法中,以获取更抽象的高层特征。
实验2:P300信号特征提取
通过带通滤波器(2∼35hz)过滤视觉刺激的P300信号,
然后输入混合深度学习模型进行进一步分析。
该模型包括一个2D CNN来捕获空间特征,然后在LSTM层中进行时间特征提取。
实验3:使用AE模型进行特征提取,然后使用支持向量机分类器。
实验中,每一段包含150个点,分为五个时间步,每一步有30个点。
该模型在局部数据集上获得了88.1%的准确率。
实验4:DBN-RBM代表性模型与支持向量机分类器相结合进行隐藏信息测试(??),97.3%准确率
实验5:提高P300写字机准确率
一种基于CNN的新模型,该模型包括5个具有不同特征集的低层CNN分类器
最后由低层分类器投票得到最终的高层结果。
第三届BCI竞赛数据集II中,最高准确率达到95.5%
4.1.2.1.ii AEP听觉诱发电位
较少研究。
实验1:提出并测试了18个CNN结构来对单次试验的AEP信号进行分类。
利用耳机产生古怪范式设计的听觉刺激来获得数据。
实验分析表明,无论卷积层数多少,CNN框架都能有效地提取时空特征。
实验结果表明,下采样数据的效果更好。
4.1.2.1.iii RSVP快速连续视觉表示
CNN和MLP在这里取得一定成功。
实验1:一种针对RSVP的主题间和任务间检测的CNN模型。
实验结果表明,CNN在交叉任务中表现良好,但在跨主题情境下表现不佳。
实验2:比较了三种不同的深度神经网络算法,以预测受试者是否看到了目标。
MLP、CNN和DBN模型的AUC分别为81.7%、79.6%和81.6%。
...
4.1.2.2 SSEP稳态诱发电位
大多数研究稳态视觉诱发电位(SSVEP),指由闪烁的视觉刺激引起的脑震荡,通常产生于顶叶和枕叶。当施加一个恒定频率的外界视觉刺激时,与刺激频率或谐波频率相一致的神经网络就会产生谐振,导致大脑的电位活动在刺激频率或谐波频率处出现明显变化,由此产生SSVEP信号。
实验1:寻找SSVEP的中间表现形式。
提出了一种结合CNN和RNN的混合方法,直接从时域中提取有意义的特征,准确率达到93.59%。
实验2:紧凑CNN直接处理原始结果
平均准确率80%左右
实验3:采用了一种典型的稀疏AE模型,从多频视觉刺激中提取SSVEP的不同特征。
该模型采用了一个softmax层进行最终分类,准确率为97.78%。
...
较少研究。
定义:利用血液的主要成分对600-900nm近红外光良好的散射性,从而获得大脑活动时氧合血红蛋白和脱氧血红蛋白的变化情况,产生功能性神经影像。
实验1:基于fNIRS信号分析了两种心理任务(心算和休息)之间的差异。
从前额叶皮层fNIRS中手动提取了6个特征,并比较了6个不同的分类器。
结果表明,MLP的准确率为96.3%,优于所有传统的分类器,包括SVM、KNN、naivebayes等。
实验2:试图通过fNIRS信号检测受试者的性别。
作者使用三层隐层去噪D-AE来提取显著特征并输入MLP分类器进行性别检测。
该模型在本地数据集上进行了评估,平均准确率为81%
相比fMRI信号,fNIRS具有更高的时间分辨率和更经济的价格
利用磁振造影来测量神经元活动所引发的血液变化。从而监测大脑活动
该领域,近年用了不少深度学习方法,特别是认知功能障碍的诊断上。
分类模型中,CNN是一种很有前途的fMRI分析模型
实验1:根据功能磁共振成像(fMRI)和核磁共振成像(MRI)数据,应用深层CNN识别阿尔茨海默病。
实验2:利用一种新的CNN算法建立了一种基于fMRI的脑肿瘤分割方法,它可以同时捕获全局特征和局部特征
实验3:采用CNN模型处理脑瘤患者的功能磁共振成像(fMRI)进行三类识别(正常、水肿或活动性肿瘤)。在BRATS数据集上对模型进行了评估,得到了88%的F1分数
实验4:利用CNN进行特征提取。提取的特征用支持向量机分类,用于癫痫发作的检测
大量文章证明了表示模型在识别功能磁共振成像数据方面的有效性。
实验1:利用一个由三个RBM分量组成的DBN-RBM从ICA处理的fMRI中提取显著特征,最终在四个公共数据集上实现了90%以上的F1平均测量值。
实验2:DBN-RBM和DBN-AE检测阿尔茨海默病
前者95.4%,后者97.9%。
实验3:应用D-AE模型从静止状态的fMRI数据中提取潜在特征,用于诊断轻度认知功能障碍(MCI)。-
将潜在特征输入支持向量机分类器,识别率达到72.58%。
自然图像的重建引起广泛的关注。
实验1:从fMRI中重建视觉刺激的深卷积GAN,
目的是训练生成器生成与视觉刺激相似的图像。
发生器包含四个卷积层,以便将输入的fMRI转换为自然图像。
用于测量由大脑中神经元的电活动引起的磁场。通过磁变化反映大脑活动
实验1:致力于通过去除诸如眨眼和心脏活动等伪影来细化MEG信号。
首先对MEG单峰进行ICA分解
然后用一维CNN模型进行分类。
最后,该方法在局部数据集上的灵敏度达到85%,特异性达到97%。
实验2:目标同实验1
该方法利用CNN获取时间特征,MLP提取空间信息
基于深度学习的大脑信号系统主要用于检测和诊断精神疾病,如睡眠障碍、阿尔茨海默病、癫痫发作等。
睡眠障碍:
对于睡眠障碍的检测,大多数研究都集中在基于睡眠自发脑电图的睡眠阶段检测上。DBN-RBM和CNN被广泛应用于特征选择和分类。
阿尔茨海默病:
功能磁共振成像在阿尔茨海默病的诊断中有着广泛的应用。优点是高空间分辨率,几项研究的诊断准确率均在90%以上。
癫痫:
癫痫发作的检测主要基于自发脑电图。流行的深度学习模型包括独立的CNN和RNN,以及结合RNN和CNN的混合模型
例如,将D-AE应用于特征提取,然后将支持向量机应用于癫痫诊断
研究人员已经证明了深度学习模型在检测大量精神疾病方面的有效性,如抑郁症[113]、发作间期癫痫放电(IED)[230]、精神分裂症[211]、克雅氏病(CJD)[123]和轻度认知障碍(MCI)
随着物联网的发展,越来越多的智能环境可以连接到大脑信号。
例如,辅助机器人可用于智能家居,其中机器人可以由个体的大脑信号控制。
基于视觉刺激的自发EEG和fNIRS信号的机器人控制问题。
大脑信号控制的外骨骼可以帮助那些在行走和日常活动中损坏下肢运动系统的残疾人。
P300 speller,深度学习模型使大脑信号系统能够从非300片段中识别出P300片段
使用一种结合RNN、CNN和AE的混合模型,从MI-EEG中提取信息特征来识别用户想要说的字母。
应用于身份识别和身份验证
前者通过多类别分类来识别一个人的身份[6]。后者进行二元分类来决定一个人是否被授权
主要使用视觉刺激产生的信号来作为输入。
个性化信息(如多媒体内容)检索或智能人机界面设计
试图根据脑电图信号,使用深度学习算法(如CNN及其变体)将用户的情绪状态分为两类(积极/消极)或三类(积极、中性和消极)
DBN-RBM是从情绪自发脑电图中发现隐藏特征的最具代表性的深度学习模型
一般情况下,如果驾驶员的反应时间小于0.7秒,则认为驾驶员处于警戒状态;如果反应时间大于2.1秒,则认为驾驶员处于疲劳状态。
目前,基于EEG的驾驶困倦可以得到较高的识别率(82%∼95%)
适当的心理负荷对于维持人类健康和预防事故是必不可少的。
持续脑电来评估操作者的心理负荷,以警告随着时间,操作者的性能下降。
可以通过fNIRS信号和自发脑电图来测量
通过一个循环卷积框架研究了跨多个心理任务的心理负荷测量。该模型同时从空间、频谱和时间维度学习脑电特征,二值分类(高/低负荷水平)的准确率为88.9%
推荐系统,紧急刹车,视觉对象识别,内疚测试,隐藏信息测试,区分性别。
https://en.wikipedia.org/wiki/Self-driving_car https://physionet.org/physiobank/database/sleep-edfx/ https://massdb.herokuapp.com/en/ https://physionet.org/pn3/shhpsgdb/ https://physionet.org/pn6/chbmit/ https://www.isip.piconepress.com/projects/tuh.eeg/html/downloads.shtml https://physionet.org/pn4/eegmmidb/ http://www.bbci.de/competition/ii/ http://www.eecs.qmul.ac.uk/mmv/datasets/amigos/readme.html http://bcmi.sjtu.edu.cn/seed/download.html https://www.eecs.qmul.ac.uk/mmv/datasets/deap/ https://owenlab.uwo.ca/research/the.openmiir.dataset.html http://adni.loni.usc.edu/data-samples/access-data/ https://www.med.upenn.edu/sbia/brats2018/data.html
70%的EEG论文关注自发EEG(133种出版物)。自发的脑电图分成几个方面:睡眠、运动想象、情绪、精神疾病、数据增强和其他。
睡眠:总共19篇,6篇使用CNN,2篇RNN,还有3种RNN+CNN的混合模型。
运动想象:广泛使用CNN和基于CNN的混合模型。表示型模型常用DBN-RBN提取潜在特征。
情绪:总共25篇,超过一半使用表示模型(D-AE,D-RBM,DBN-RBM)。最典型的状态识别工作将用户的情绪识别为积极、中立或消极。进一步对配价和唤起率进行分类
精神疾病:大部分相关研究集中在癫痫发作和阿尔茨海默病的检测上。大部分相关研究集中在癫痫发作和阿尔茨海默病的检测上。许多研究可以达到90%以上的高准确率。在这一领域,标准的CNN模型和D-AE是普遍存在的。一个可能的原因是CNN和AE是最著名和最有效的深度学习模型的分类和降维
数据增强:基于GAN的数据扩充
其他:大约有30个研究正在调查其他自发脑电图,如驾驶疲劳、视听刺激冲击、认知/心理负荷和眼睛状态检测。这些研究广泛应用标准CNN模型和变体。
视觉诱发电位(VEP)引起大量研究(21篇)。6种混合模型。
快速连续视觉表示(RSVP),只有CNN算法。
fNIRS图像的研究很少采用深度学习的方法,主要的研究只是采用简单的MLP模型。我们认为,由于fNIRS具有高便携性和低成本的特点,应引起更多的关注。
至于功能磁共振成像,有23篇论文提出了深度学习的分类模型。CNN模型因其在图像特征学习中的突出表现而被广泛应用。
结论1:大多数采用判别模型。
结论2:超过70%的判别性模型都采用了CNN及其变体,为此我们提供了以下原因:
首先,CNN的设计足够强大,能够从EEG信号中提取潜在的鉴别特征和空间相关性进行分类。因此,有些研究采用CNN结构进行分类,而有些研究则采用CNN结构进行特征提取。
CNN在一些研究领域(如计算机视觉)取得了巨大的成功,更容易找到代码。
一些脑信号图(如功能磁共振成像)是自然形成的二维图像,有利于CNN进行处理。
其他一维信号(如EEG)可以转换成二维图像,供CNN进一步分析。转换方式如下:
1)将每个时间点转换为二维图像;假设我们有32个通道,我们可以在每个时间点收集32个元素(每个元素对应于一个通道)。收集到的32个元素可以根据空间位置转换为二维图像。
2)将一个片段转换为二维矩阵。假设我们有32个通道,段包含100个时间点。所收集的数据可以被安排为一个形状为[32,100]的矩阵
CNN使用:
单通道脑电信号可以通过一维CNN进行处理。
只有20%的基于判别模型的论文采用RNN,这远远低于我们的预期,因为RNN在时间特征学习方面表现出了强大的能力。造成这种现象的一个可能原因是RNN对长序列的处理非常耗时,而且脑电信号通常是长序列
MLP算法由于其简单的深度学习结构,其有效性(如非线性能力)不如其他算法,因而不受欢迎。
结论3:表示模型中,DBN,尤其是DBN-RBM是最常用的特征提取模型。原因有二:
它能有效地学习揭示相邻层中变量关系的生成参数
它使计算每个隐藏层中潜在变量的值变得简单
【大多数采用DBN-RBM模型的作品都是在2016年之前出版的。可以推断,在2016年之前,研究人员更倾向于使用DBN进行特征学习,然后使用非深度学习分类器;但最近,越来越多的研究希望采用CNN或混合模型进行特征学习和分类。】
结论4:生成模型很少独立使用,基于GAN和VAE的数据增强和图像重建主要集中在fMRI和EEG信号上,有前途。
结论5:53篇论文中,RNN和CNN的组合约占五分之一,结合后具有很好的时空特征提取能力。
结论6:表示模型+判别模型也很常用,28篇中有这种方法,所采用的表示模型多为AE或DBN-RBM,同时所采用的判别模型多为CNN。
将脑信号分析应用于医疗领域是目前最吸引人和最热门的领域。
一般来说,大多数深度学习算法在多个睡眠阶段场景下都能达到85%以上的准确率。
对于fMRI图像,CNN在网格化空间信息学习方面具有很大的优势,使其获得了非常全面的分类准确率(90%以上)。
至于癫痫发作,一般是根据脑电图信号进行诊断。单一的RNN分类器(如LSTM或GRU)由于其良好的时间依赖性表示能力,似乎比其对应的分类器工作得更好。
检测阿尔茨海默病的一个关键方法是通过测量大脑特定区域的功能来分析大脑信号。具体来说,可以通过自发的脑电图信号或功能磁共振成像来进行诊断
由于视觉诱发电位明显且易于检测,许多研究都集中在VEP信号上。一个重要的数据来源是来自第三届BCI竞赛。
脑电信号具有较高的时间分辨率,能够捕捉快速变化的情绪。因此,几乎所有的研究都是基于自发的脑电信号。这些信号是在被试观看视频时收集的,视频被认为是激发受试者特定情绪的。主要是使用层次化CNN,DBN-RBM结合强分类器,前一种更好。
一般框架需要两个关键能力:注意机制和捕捉潜在特征的能力。前者保证了框架能够集中于输入信号中最有价值的部分,而后者使框架能够捕捉到与众不同和信息丰富的特征。
方法2:CNN是最适合捕捉不同层次和范围特征的结构。未来,CNN可以作为一种基本的特征学习工具,并与适当的注意机制相结合,形成一个通用的分类框架。
方法1:可以考虑如何解释由深层神经网络导出的特征表示,学习的特征与任务相关的神经模式或精神障碍的神经病理学之间的内在关系。
方法1:实现这一目标的一个可能的解决方案是建立一个个性化的迁移学习模型。
个性化情感模型可以采用转换参数传递的方法来构造个体分类器,并学习映射数据分布和分类器参数之间关系的回归函数
方法2:从输入数据中挖掘与主题无关的组件。输入的数据可以分解为两部分:一个依赖于主题的主题相关组件和一个所有主题都通用的主题无关组件。一个混合多任务模型可以同时处理两个任务,一个侧重于人的识别,另一个侧重于类识别。在类识别任务中,需要一个训练良好、收敛良好的模型来提取与主题无关的特征。
Adversarial V ariational Embedding (对抗性变异嵌入)-----> 高质量生成模型
有两种方法可以增强无监督学习:
一种是利用众包(给大众志愿者)方法对未标记的观测值进行标记;
另一种是利用无监督域自适应学习,通过线性变换来调整源脑信号和目标信号的分布
在真实场景中,大脑信号系统需要接收实时的数据流并实时产生分类结果
由于受试者注意力不集中和设备固有的不稳定性(例如采样率波动)等诸多因素,采集到的实时信号更具噪声和不稳定性。通过我们的实验,在线脑信号系统的准确率通常比同类系统低10%。
方法:投票和聚合来平均多个连续样本的结果,提高解码性能。
脑电采集设备主要有三种:不便携头戴式、便携式头戴式和耳式脑电传感器。
第一种,采样频率高,信道数多,信号质量高,但价格昂贵。适合医院体检。
第二种,(例如Neurosky、Emotiv EPOC),有1∼14个通道和128∼256采样率,但读数不准确,长期使用后会造成不适。
第三种,还在实验室阶段。EEGrids是唯一商业化的耳脑电设备。
受限玻尔兹曼机 RBN(2000年后流行)
和DNN的区别是,RBM不区分前向和反向。
RBM可以看做是一个编码解码的过程,从可见层到隐藏层就是编码,反之是解码。对于每个训练样本, 期望编码解码后的可见层输出和之前可见层输入的差距尽量的小。
RBM详细推导过程:https://www.cnblogs.com/pinard/p/6530523.html
学习视频:https://www.bilibili.com/video/BV1dt411U7ad?from=search&seid=10143340215037418101
深度波尔茨曼机Deep Boltzmann Machine (DBM)
扩展RBM到三层及以上
RBN实现的深度置信网络 (DBN-RBN)
与DBM的区别是隐藏层之间为单向的。优化计算更简单。
降噪自编码器(D-AE)
DAE(Denoising Autoencoder)的核心思想是,一个能够从中恢复出原始信号的神经网络表达未必是最好的,能够对“损坏”的原始数据编码、解码,然后还能恢复真正的原始数据,这样的特征才是好的。
卷积神经网络(CNN)
池化层
循环神经网络(RNN)
长短期记忆(LSTM)
评价标准
敏感度
特异性
准确率
F1值
遗传算法(用于超参数调整)和MLP(用于分类)的组合
用于多人场景的AE和XGBoost组合
LSTM和强化学习相结合的多模态信号分类方法
首先剔除高误差通道,然后根据剩余通道的代表性特征,采用D-RBM方法进行情感状态识别
双模深度自动编码器(BDAE)来研究男性和女性的情绪模式差异,该模型同时接收EEG和眼球运动特征,并在融合层中共享信息,该层与支持向量机分类器相连接。
结果:女性在恐惧情绪上具有较高的脑电信号差异性,而男性在悲伤情绪上具有较高的差异性。
跨个体(克服不同受试者或不同实验阶段采集的样本之间的不匹配分布):结合AE和子空间对齐方法,提出了一种无监督域自适应技术,称为子空间对齐自动编码器(SAAE)。在独立场景下,该方法的平均准确率为77.88%。[94]
然后将D-AE的输出发送到由另一个D-AE组成的融合结构
最后,利用MLP分类器对混合特征进行预测
结合DBN-RBM有效特征提取和MLP进行分类,实现了一个情感识别系统
所有的输入路径将合并成一个由另一个RBMs组成的共享结构。
有些通过PCA等降维方法对脑电信号进行预处理
有些将原始信号直接输入代表模型
首先用0.5∼70hz的带通滤波后,将其送入具有两个隐藏层的D-AE中进行特征表示。
最后,在局部数据集上,MLP分类器的准确率达到81∼83%。
卷积自动编码器,用卷积和去卷积层代替标准声发射中的完整连接层,以无监督的方式提取癫痫特征











