Recognition and Classification of Heart Sounds
Wang YanwenWang HaibinCheng Jingzhi
(Department of Biomedical Engineering and Instrumentation,Xi'an Jiaotong University,Xi'an710049)
AbstractThis paper reviews the methods and research advances of recognition and classification of heart sounds. The methods include the statistical techniques and artificial neural network. It also discusses the main problems in the methods.
Key wordsHeart soundsPattern recognitionArtificial neural network
1引言
随着现代社会物质生活水平的改善,心血管疾病的发病率和死亡率已越来越高。统计资料表明,在我国因心血管疾病死亡者占总死亡人数的44%。美国1978年报道了4000万人有不同形式的心血管疾病,死于心脏病者近100万人。可见,心脏病已成为危害人类健康的多发病和常见病。因此,心脏系统疾病的防治和诊断成为医学界面临的首要问题之一。
心音是心脏及心血管系统机械运动状况的反映,其中包含着心脏各个部分本身及相互之间作用的生理和病理信息。心音信号的识别与分类对心血管系统疾病的诊断具有重要的意义,其准确性、可靠性的好坏决定着诊断与治疗心脏病患者的效果。早期的心音识别与分类是医生根据听诊结果来完成的,显然这一过程具有一定的主观性且可靠性不高。随着信号处理与分析技术的不断发展,对心音的研究也逐步由定性分析进入了定量分析的阶段。国内外许多生物医学工程研究人员将传统的模式识别方法,以及神经网络方法用于心音的识别与分类,期望实现心音的自动解释和自动诊断,以便向临床医生提供实用的辅助诊断信息。此外,心音的识别与分类还有助于对心音产生机制的理解。
心音信号识别与分类的方法是多种多样的,本文重点介绍了实际中应用较多的基于统计分析以及神经网络的识别与分类方法。
2统计模式识别方法
统计模式识别方法是在对模式结构进行测量和变换的基础上进行分类的。基于统计方法的分类器的性能取决于特征和特征向量的概率分布,这些方法把模式作为随机向量对待,实际上意味着同一类型的模式的分布近似是高斯型的,通常运用线性方法把特征或性质聚类。
根据心音的参数模型提取心音信号的特征参数,用统计分析的方法建立判别函数,采用逐步多元分析来自动筛选特征量,以提高分类的效果。这其中有Joo[1]和Bement[11]的极-零点模型法。他们根据临床经验选择出特征矢量x=,其中f1和f2为对应两个最大谱峰处的频率,且f1处的功率大于f2处的功率。采用以最大熵为准则的Steightz-McBride法(8个极点、8个零点的极-零点模型)求得经过瓣膜修复术后的主动脉瓣关闭音。分类器为二次高斯型,它以双曲线型式将特征空间分为两个部分,根据特征矢量在特征空间的分布区域差别是正常或异常心音。对20例样本的分类结果表明,正确识别率为17/20。而在误判中除一例远离临界线外,其它两例均位于临界线附近。90年代初Durand等[2]针对猪心生物替换二尖瓣的关闭音,研究了它的模式识别。他们分别采用高斯-贝叶斯模型和基于最邻近原则的距离测量算法,并比较了两种模式识别方法检测瓣膜变性的诊断特性。研究中通过两类指导学习处理来决定由6个或更少的参数组成的最优判别模式,分类器的错误概率用“余一”法来估计。此后的进一步研究中[3],他们结合四种窗函数的两种谱分析方法(快速富里叶变换、AR模型),采用两类分类器(贝叶斯模型、基于最邻近原则的距离测量算法)检测心脏瓣膜的特性。对95个病人进行了评估,其中47个病人在主动脉瓣施行猪瓣膜生物修复(24人正常,23人瓣膜变性),48个病人在二尖瓣施行猪瓣膜生物修复(19人正常,29人瓣膜变性)。对于每一类瓣膜,从瓣膜关闭音谱中提取21个参数对识别系统进行训练和测试,并在21个参数中选择2~5个综合参数进行估计。结果表明,FFT结合最近点分类器具有最佳性能:用汉宁窗对主动脉瓣的正确分类率为87%,用矩形窗对二尖瓣的正确分类率为94%。采用AR模型的结果为:用最近点分类器结合汉宁窗对主动脉瓣的正确分类率为81%,用贝叶斯分类器结合海明窗对二尖瓣的正确分类率为92%。
对心脏的生物动力学模型的分析表明[4,14],心脏是一个非线性的、时变的复杂系统。因此,心音信号具有很强的非平稳性和随机性,这种随机性与呼吸状态、心脏的血流动力学状态以及人所处环境等各种不确定因素有关。统计模式识别方法的局限性在于,规范化的特征向量限制了识别系统的灵活性,使得系统对可获取信息的利用率降低,在一定程度上影响了系统的性能。
3神经网络模式识别
人工神经网络是由非处理单元组成的非线性大规模自适应动力系统。它采用分布方式存储信息,具有联想记忆的功能,其处理单元执行非线性运算,使网络具有很强的自适应和容错能力,用它进行信号处理和模式识别可以更接近于人类思维。人工神经网络还具有许多优良的特性:
(1)非线性在人工神经网络中,神经元处于激活或抑制两种状态,在数学上表现为非线性关系。具有阈值的神经元过程构成网络有更好的性能,可以提高容错性和存储容量;
(2)非局域性神经网络的整体行为不仅取决于单个神经元的特征,而且更多地取决于各个神经元之间的相互联接、相互作用;
(3)非定常性神经网络具有自适应、自组织和自学习能力,在处理信息的同时,其非线性动力系统本身也在不断地变化;
(4)非凸性神经网络具有多个较稳定的平衡态,导致系统演化的多样性。
总之,人工神经网络是在结构上模仿生物神经连接的系统,能够设计来进行模式识别工作。但是,神经计算不同于统计模式识别,它不是算法型的方法。因此,神经网络系统需要有存储信息的能力,而且是可以训练的,即系统经过训练后对于任何给定的输入都能给出期望的输出。神经网络模式识别系统的某些组成部分经常是用试算法得到的,而且它是不稳健的。如果要解决的不是一个特定的问题,而是一个一般性的问题,那么就需要一组系统。
3.1网络输入特征矢量
网络输入特征矢量的确定,在神经网络模式识别方法中具有重要的作用。输入特征的选取直接关系着网络识别方法及结果的准确性,对于生物医学信号而言,常用的网络输入特征有时域波形、线性预测系数、预测误差、带通滤波器组、短时富里叶变换谱、倒谱以及小波变换谱。
3.1.1时域波形特征矢量时域波形包含着信号的所有信息,对于确定性信号,或信号的随机变化不很大并且数据长度在一定范围的随机信号,可以作为神经网络的输入特征。德国Paderborn大学的研究人员研究了不同的心脏监护方法,将神经网络用于估计心收缩期和心舒张期,用于从心音图输入信号分析先天性和后天性心脏病[9]。把心音数据不加任何预处理或只做简单的滤波处理后直接作为神经网络的输入,其优点在于体现客观真实性,发挥神经网络自动提取特征和进行模式识别与分类的功能,避免了数据处理方法中人为因素的渗入。但是也存在一定的缺点:(1)输入数据较多,使得网络规模大,计算代价高,需要学习的样本多;(2)对于心音信号而言输入节点的含义不明确,通常要求网络具有移不变性,使得网络结构较为复杂。此外,心音信号既是非平稳的又是非线性的,其时域波形的幅值和相位均呈现随机性的变化。直接将心音图作为网络的输入特征,由于信号随机变化的影响,不易对心音进行准确的分类。因此,心音图多用于临床上辅助诊断,而在一般的网络识别系统中不常采用。
3.1.2线性预测系数特征矢量对心音信号建立模型(AR或ARMA)得到线性预测系数,是获取心音信号特征的方法之一。线性预测系数具有较高的压缩率,并且能够反映信号的大部分信息。Akay[5,6]将神经网络用于冠状动脉声音的检测,作者首先利用自适应线性增强方法减小舒张期心音的背景噪声,再对滤波后的心音计算平均自相关函数延迟,采用修正的Yule-Walker自回归模型,用于计算平均线性预测系数的每个病人的数据要经过10个心周期的平均,在每个病人的记录上计算已滤波的线性预测系数。并将这些参数形成一个10点模拟特征矢量,作为神经网络的输入。所用神经网络为三层BP网络,对网络的测试表明,10个输入节点、10个隐层节点和2个输出节点的网络性能最佳。网络正确识别了64个冠状动脉疾病病人中的50个以及36个无明显阻塞病人中的32个,网络 的检出率为78.1%、假阳性率为11.1%。
作为神经网络输入的线性预测系数是信号分成若干段,然后对每一段建立AR模型得到的,并且假定每段信号是平稳的零均值随机信号。对于心音信号,由于生理和环境等因素的影响,每一心动周期的信号具有明显的时变性和随机性。因此,从严
