探秘心脏!

作       者:吴启越,袁银龙

作者单位:无锡太湖学院智能装备工程学院(吴启越);南通大学电气与自动化学院(袁银龙)

作者简介:吴启越,助教,主要从事模式识别、深度学习等相关研究。

通信作者: 袁银龙

基金项目:江苏省高校自然科学基金资助项目(20KJB520008)

目的  为了提高使用心电信号特征参数进行情绪识别的准确率与效率,提出一种基于改进核主成分分析的遗传算法:优化遗传算法反向传播(improved kernel principal component analysis-genetic algorithm-back propagation,IKPCA-GA-BP)神经网络。方法  首先,以心电传感器记录的数据为试验样本,利用自适应选取γ值的改进核主成分分析算法,对二进样条小波变换提取的多组特征进行数据降维和数据重构,得到综合变量;其次,建立反向传播神经网络模型,并利用遗传算法优化网络的初始权值和偏置值;最后,通过改变模型训练样本与测试样本比例,对比分析IKPCA-GA-BP算法与传统识别算法的情绪分类效果。结果  该算法在保证准确率达到96%的前提下,可在1 s左右识别相关情绪。另外,对于悲伤情绪的识别,大多数模型表现得并不理想,而IKPCA-GA-BP算法可实现接近100%的准确率。结论  心电信号中,P波、QRS波群和T波包含许多有助于情绪识别的信息(例如R-R间期、P波振幅等),但这些信息并不能直接用于试验分析,需要通过有效的组合与处理才能发挥最大作用。此外,在高兴、轻松、悲伤和恐惧这四种情绪中,多数识别算法通常较难准确辨别悲伤情绪。

关键词

心电信号;自适应选取γ值;核主成分分析;小波变换;情绪识别

引用格式

吴启越,袁银龙. 基于IKPCA-GA-BP算法的心电情绪识别研究[J]. 实用心电学杂志, 2024, 33(5): 491-498.

DOI: 10.13308/j.issn.2095-9354.2024.05.012

      情绪在人类生活中扮演着极其重要的角色,通过对情绪的研究可以知晓人体某方面的健康状况,例如抑郁症、躁动症的诊断就是依赖于对情绪的监测。世界卫生组织最新的报告显示,目前抑郁症已经成为全球第四大疾病负担,患者已超过3亿,也是导致患者功能残疾的首要原因。在中国,抑郁症的终生患病率达6.9%,患者将终生依赖药物才能维持正常生活。因此,通过情绪识别提前预知身体状况具有重大的现实意义。

      从1997年起,国外已有一系列的实验证明,从人类特定的生理信号中提取某些有效的特征组合进行情绪识别是可行的。心电信号作为人体重要的生理信号之一,可以直观地反映心脏电活动状态,与自主神经系统密切相关,而每一种情绪状态又有特定的自主神经反映模式与之对应,因此心电信号也成为分析和判别情绪的主要依据之一。目前,国内外在提取并分析心电信号特征用于情绪识别方面已取得一定成果。但是提取过多的特征参数会增加识别算法的复杂度,降低识别效率。

      遗传算法-反向传播(genetic algorithm-back propagation,GA-BP)神经网络常用于数据分类,并表现出不错的效果,如文献中的研究使用遗传算法优化后的神经网络,识别速度与精度都有所提高。然而遗传算法优化反向传播神经网络的前提是训练样本维度不能太高,如果维度太高而样本数又不足,不但准确率无法提高,计算量也会大大增加。针对上述两个问题,本研究使用核主成分分析(kernel principal component analysis,KPCA)算法进行特征向量降维,该算法既能降低模型复杂度,又能提高算法识别效率。此外,针对KPCA算法中核函数的γ参数依据经验值选取而导致降维效果差的问题,本研究提出一种自适应选取γ值的方法来改进KPCA算法,即改进的核主成分分析遗传算法:优化反向传播(IKPCA-GA-BP)神经网络。

1

心电信号采集与预处理

1.1  心电信号采集

      外界环境刺激能够使人的情绪发生变化,例如刺耳的声音会使人受到惊吓、感到烦躁;搞笑的视频会使人感到轻松愉悦;不公的待遇会使人感到愤怒等。KIM等曾使用音乐作为情绪诱发因素,采集到被试者的四种生理信号,并完成试验分析。在短视频流行的今天,观看视频自然成为情绪诱发的首选方法。本研究采用的情绪诱发试验流程如图1所示。

      本研究精选不同类型视频(搞笑视频、恐怖视频、风景视频以及灾难视频)共4个,每个视频时长1 min。每轮测试时长3 min,其中1 min用来观看视频,剩余2 min用来平复情绪。5名受试人员均为无心脏疾病的在校大学生,在测试中,受试者全程佩戴心电信号传感器,完成心电信号采集。另外,为了保证情绪诱发成功,受试者每观看完一个视频,填写一次情绪状态,共收集了20组心电信号数据(每组心电信号持续60 s,总计6 000个采样点)。

      本研究使用的心电传感器型号为Keyes-AD-8232,采用三导联监测形式(RA、LA和LL),采样频率为100 Hz,额定电压为3.3 V。此外,为达到最佳共模抑制性能,传感器自身配置一个0.5 Hz的高通滤波器和一个40 Hz的低通滤波器。

1.2  心电信号去噪处理

      心电信号由P波、QRS波群和T波组成,记录了一段时间内心脏的电活动状态。一个周期心电信号的波形如图2所示。

      心电信号是一种非常微弱的生理信号,其电压幅度只有0.05~0.5 mV,频率主要集中在0.05~100 Hz。在采集心电信号的过程中容易受到外界因素的影响,使得到的信号掺杂许多噪声,噪声可分为基线漂移、肌电干扰、运动干扰和工频干扰。这些噪声会影响试验判别的准确性,因此在分析心电信号之前必须进行除噪。尽管许多文献提供了有效的心电信号去噪方法,但是小波变换方法检测精度更高,是去除心电信号中各类噪声的首选方法。研究表明,Db4小波(Daubechies4)与心电信号相关系数最大,是处理心电信号的最佳小波基函数。图3是使用Db4小波变换滤波处理前后的心电信号,可以看出经处理后噪声被有效去除。

2

心电信号特征值提取与特征数据降维

2.1  心电信号特征值提取

      对于一般信号而言,采用傅里叶变换即可取得良好的处理结果,但该方法仅在单独的时域或频域上对信号特征进行表征。而对于心电信号的分析,找出P波、QRS波群和T波持续的时间非常重要,因此傅里叶变换不适用于该类信号的处理。本研究采用二进样条小波变换寻找心电信号的关键点位置。

      1) 设计二进样条小波滤波器。该滤波器由一个高通滤波器和一个低通滤波器组成,滤波器的系数分别为(1/4,3/4,3/4,1/4)和(-1/4,-3/4,3/4,1/4)。分别求各个尺度的近似系数与细节系数。

      2) 提取极大、极小值对。遍历各个尺度下细节系数大(小)于0的点,找到比前一个点值大(小)的点,该点即为极大(小)值点。各个尺度下细节系数的极大、极小模值图如图4所示。

      3) 选取合适的阈值定位QRS波群、P波及T波。在一层细节系数中,R波细节系数的绝对值明显大于其他信号点,因此只要设置合适的阈值就能准确找到R波细节系数极大、极小值对,两极值的过零点即R波位置。同理,定位得到P波和T波的位置,不同的是,定位P波选择二层细节系数,定位T波则选择四层细节系数。另外,由于信号奇异点与极大值、极小值过零点之间有固定的时移量[(2j-1)/2,j表示细节系数的层数],所以需要用该时移量修正得到正确的结果。图5是心电信号上各波位置定位图。

      在图5(扫描OSID码可查阅彩图)中,带紫色星号的红线表示R波位置,其左边的一条红线表示P波位置,其右边的则表示T波位置。离星号红线最近的两条黑线从左到右分别表示Q波和S波位置,其余黑线表示各个波的起始位置与终止位置。

      4) 提取特征向量。根据QRS波群、P波及T波位置,一共提取了9个特征向量:RR间期、PR间期、QT间期、ST间期、PT间期、PR幅值、RP幅值、P波幅值和T波幅值。

2.2  改进的KPCA算法实现特征数据降维

【心电大数据与人工智能】基于IKPCA-GA-BP算法的心电情绪识别研究

      本研究提取的特征值较多,且可能包含许多冗余信息。这对于神经网络训练来说,不仅不能提高识别准确率,还会使运算量加大,从而降低运行效率,因此,在将数据输入到神经网络之前需进行数据降维。主成分分析算法是一种常用的数据降维方法,但对于心电信号这种非线性数据的处理效果并不理想。而本研究使用的KPCA算法是一种专门针对非线性数据的降维方法,并且试验证明其处理心电信号的表现优越。

      使用KPCA算法时,核矩阵元素Ka,b=k(xa,xb)=exp[-γ(x2a+x2b)]中,γ值一般依据经验值而定,然而γ值的大小不仅影响第一主成分的贡献率大小,而且影响数据的分类效果。在试验过程中,γ值越小,第一主成分的贡献率就越大,总贡献率达到96%所需主成分个数越少,但是降维后的数据不论是组内(同一情绪)差距还是组间(不同情绪)差距都会减小,不利于之后的分类识别。所以对于不同的待处理数据,γ的经验值并不完全适用。针对这个问题,本研究提出一种γ自适应选取方法来改进KPCA算法,使其能更加有效地进行数据降维。

      确定优化目标函数:设四种情绪样本经过数据降维后分别得到矩阵AN×K、BN×K、CN×K和DN×K,其中N表示样本个数,K表示数据重构后的特征维度。计算每两个样本矩阵的欧氏距离之和:

      当矩阵mn相同时,函数表示组内差异;m与n不同时,函数则表示组间差异。那么情绪A的组内差异与组间差异比值

同理可得:

      这些比值越小,KPCA数据重构后,不同类型之间的差距比同一类型之间的差距就越大,也越有利于之后的识别与分类。定义目标函数L为

L=min{(a+b+c+d)/4}(2)

      选取γ值的流程图如图6所示。

      具体优化步骤:① 根据主成分贡献率粗略初始化γ值的取值范围为0.001~0.1。② 确定当前最佳γ值,第一次循环设γ=0.1。③ 进行KPCA数据降维。④ 用降维后的数据计算目标函数值。⑤ 判断是否满足条件1和条件2。定义条件1:当前γ值计算得到的目标函数值小于最佳γ值计算得到的目标函数值,并且

定义条件2:循环次数是否达到最大值。若满足条件1,更新当前最佳γ值;若同时不满足条件1和条件2,表明优化还未结束,调整γ值重复步骤③、④、⑤,直至满足条件2,输出最佳γ值,至此优化结束。

3

识别算法

      鉴于反向传播神经网络参数待优化问题以及遗传算法优化参数能力,本研究使用遗传算法优化网络初始权值与偏置值。具体模型构建如图7所示。

      将IKPCA算法优化后的特征参数作为反向传播神经网络的输入数据,通过遗传算法对反向传播神经网络初始权值与偏置值进行全局寻优,最终实现模型训练,完成情绪四分类。

4

试验结果与分析

4.1  试验评估方法

      文献提出了许多有效措施,用于评价心电信号分类结果。执行分类任务时,根据分类目标的正例、负例和预测结果,得到一个混淆矩阵如表1所示。

      表1中,TP(True Positive)表示对正例样本的正确预测次数,TN(True Negative)表示对负例样本的正确预测次数,FN(False Negative)表示对正例样本的错误预测次数,FP(False Positive)表示对负例样本的错误预测次数。基于本研究探讨负面情绪的初衷,将恐惧与悲伤情绪划分为正例,高兴与轻松则归类为负例,使用准确率、精确率、召回率和F1指标评价情绪分类模型的性能。

4.2  结果与分析

      本研究讨论情绪四分类问题,每种情绪各提供80组手工特征样本(每人的该种情绪提供16组手工特征),总计5×4×16=320组。试验一共分为三部分:第一部分是首先将320组特征数据(9维特征向量)按照一定比例分为训练集和测试集,然后直接将训练集作为网络输入,分别进行反向传播神经网络和GA-BP神经网络训练,得到情绪分类模型,并记录模型训练所需时间,最后用测试集测试分类模型的准确率;第二部分使用主成分分析算法对原320组特征数据进行降维处理,再将降维后的数据按照一定比例随机分为训练集和测试集,其余步骤同第一部分;第三部分则使用IKPCA算法(最佳γ值计算)对原320组特征数据进行降维和重构,其余步骤同上。

      在第三部分中,优化后的γ值为0.042,此时,KPCA方差贡献度总和统计如表2所示。另外,该表还记录了主成分分析算法主成分贡献度总和。

      由表2可知,KPCA的前3个主成分累计方差贡献率达96%以上,且第四主成分的贡献率仅0.82%,因此本研究选择前3个主成分作为神经网络输入。

      为了体现不同γ值的数据降维效果不同,将原数据与该算法处理后的数据进行对比。由于最多仅能呈现三维图像,原始数据与重构后的数据仅选取前3个特征向量表示,效果如图8所示。

      在图8中,红色、蓝色、绿色和黑色分别表示轻松、悲伤、高兴和恐惧情绪。显而易见,γ=0.042时KPCA算法重构的数据较其余四组数据更加容易区分。

      为了进一步体现本研究提出的自适应选取γ值方法的有效性,将不同γ值处理后的数据按照训练集∶测试集=3∶1的比例进行网络模型训练,多次试验并记录各个γ值的目标函数值(L)与情绪分类准确率,制成表3。

      由表3可知,不同的γ值对应的目标函数值不同,经KPCA算法数据降维后的样本数据训练得到的情绪识别模型识别情绪的准确率也不同。当γ=0.042时,获得最佳情绪识别结果,侧面验证了该方法的有效性。

      将上述试验三大部分两两对照,可以分析得出各方法的情绪分类效果。为了保证试验的严谨性,采用多次试验求均值的方法。表4记录了不同模型训练集与测试集不同比例情况下的情绪识别准确率及模型训练时间。

      分析表4可得出以下结论:

      (1) 对比的三组试验中,不论是识别准确率还是识别模型训练时间,基于IKPCA-GA-BP算法的情绪识别新方法都要优于其余几组,其准确率接近97%,模型训练时间控制在1.40 s以内。

      (2) 对比传统反向传播神经网络和主成分分析反向传播神经网络模型,不论是否使用遗传算法优化网络初始参数,前者的预测准确率都要高于后者(除试验“测试集∶训练集=3∶1”),其原因可能是:本研究使用的心电信号特征向量是非线性的,而主成分分析算法降维只适用于线性数据;此外,被主成分分析算法舍弃的方差贡献率小的特征向量也可能包含许多有利于情绪分类的信息。

      (3) 对比使用遗传算法优化网络初始参数和未使用遗传算法优化网络初始参数的试验可知,遗传算法优化后的网络训练效率更高;另外,在记录的多次试验中,前者的预测准确率较后者更加稳定,有效地解决了反向传播神经网络收敛速度慢、易陷入局部最优解等问题。

      此外,本研究还比对了各个模型的负面情绪识别情况,设置训练集与测试集比例为3∶1,正例样本为恐惧和悲伤情绪,负例样本为轻松和高兴情绪,以其中一次试验结果为准,记录了各组模型的准确率、精确率、召回率及F1指标并制成表5。将各个模型的四分类结果制成混淆矩阵,如图9所示。

      由表5可知,本研究提出的IKPCA-GA-BP情绪识别新方法识别负面情绪性能最好,达到了检测不良情绪的目的。由图9可知,大部分模型识别悲伤情绪的准确率较低,而本研究提出的方法对于四种情绪识别准确率较平均,拥有较好的识别效果。

5

小结

      本研究针对传统识别算法利用心电信号对情绪进行分类的效率、准确率低下的问题,提出一种基于IKPCA-GA-BP神经网络的情绪识别新方法。该方法结合了KPCA有效处理非线性数据、遗传算法全局寻优的特点,提高了反向传播神经网络的识别准确率与收敛速度。此外,针对KPCA算法核函数γ参数依经验值而定、无法保证数据处理效果的问题,提出了自适应选取γ值的方法。在保证情绪识别准确率为96%的前提下,该方法将识别时间控制在1 s左右,能更准确、更快速地分类情绪,可为医学领域根据心电信号进行情绪病症诊断提供参考。

(参考文献略)

责编:陈海林

排版:李政萍

统筹:顾    艳

审核:徐云峰