您的位置:

应用近似熵对睡眠脑电进行分期的研究

2022-07-29
来源:求医网
摘要主要介绍一种新的度量序列复杂性的统计方法——近似熵(ApEn),并将其应用于睡眠脑电的研究,提取出各睡眠期的近似熵特征。实验结果显示,从清醒期到NREM期的Ⅲ、Ⅳ期,近似熵由最大依次减小,到REM期又回升到接近Ⅰ、Ⅱ期。根据这一特征对睡眠脑电进行分期实验,得到良好的效果。说明近似熵是一种值得重视的、很有前景的复杂度度量方法。

A Study of Sleep Brain EEG at Different Stages of Sleep Using Approximate Entropy

Dong Guoya, Wu Qiyao

(Beijing Institute of Technology, Beijing100081)

Abstract

A new statistical method to measure complexity of sequences is introduced in this paper-Approximate Entropy(ApEn). It was used to study sleep brain EEG. Approximate Entropy features were extracted at different stages of sleep. Experimental results showed that, beginning from stage of consciousness to Ⅲ,Ⅳ stages of NREM stage, ApEn decreased one by one; while at REM stage the ApEn bounced back to near that at Ⅰ,Ⅱ stges. Based on this feature, experiments of brain ECG were carried out stage by stage, and good results were obtained. It was showed that ApEn is a method for measuring complexity, and it is worthy to pay attention to. The method could have a bright future.

Key words:Approximate entropy(ApEn);Sleep EEG; NREM;REM

0概述

近似熵(Approximate entropy,简称ApEn)是最近发展起来的一种度量序列的复杂性和统计量化的规则。由Pincus在1991年提出的。它对于相对较短的(大于100个数据点)、含噪声的时间序列显示出潜在的应用价值,这是因为产生近似熵的主要的技术思想是:它并不是企图完全重构吸引子,而是用一种有效的统计方式——边缘概率的分布来区分各种过程。在应用的过程中,近似熵表现出以下主要的特点[1]

(1)只需要比较短的数据就能估计出比较稳定的统计值。所需的数据点大致在100~5000点,一般在1000点左右。

(2)有较好的抗干扰和抗噪的能力。

(3)对于随机信号或是确定性信号都可以使用,也可以应用于由随机成分和确定性成分混合的信号。

(4)尤其对分析生物系统是有利的。因为生物信号往往既有确定性成分,又含有随机成分。

1近似熵的定义与算法

计算近似熵时,输入两个参数m,r且在整个计算过程中固定不变。m是比较序列的长度,即窗口长度,r是一个有效的阈值。给出N个点u(1),u(2),…,u(N),对固定的m和r定义两个参数,一个是极限值ApEn(m,r),一个是这N个点的统计估计值ApEn(m,r,N)。下面结合算法步骤来说明近似熵的定义[1,2]

(1)设原始数据为u(1),u(2),…,u(N),共N个点。

(2)按序号连续顺序组成一组m维矢量:从X(1)到X(N-m+1),其中:X(i)=[u(i),u(i+1),…,u(i+m-1)]。i=1~N-m+1。这些矢量代表着从第i个点开始的连续m个u值。

(3)定义矢量X(i)和X(j)间的距离d[X(i),X(j)]为两者对应元素中差值最大的一个,即:d[x(i),X(j)]=max[|u(i+k)-u(j+k)|]k=0~m-1

(此时X(i),X(j)中其他对应元素间差值自然都小于d)。并对每一个i值计算X(i)与其余矢量X(j)(j=1~N-m+1,但j≠i)间的距离d[X(i),X(j)]。

(4)给定阈值r,对每个i≤N-m+1的值,统计d[X(i),X(j)]小于r的数目及此数目与距离总数N-m的比值,记作Cmi(r)。即:

的数目}i=1~N-m+1

(5)先将Cmi(r)取对数,再求其对所有i的平均值,记作φm(r)。即:

(6)再把维数加1,变成m+1,重复步骤2—5,得Cm+1i(r)和φm+1(r)。

(7)理论上此序列的近似熵为:

一般言之,此极限值以概率1存在。实际工作时N不可能为∞。当N为有限值时按上述步骤得出的是序列长度为N时ApEn的估计值。记作:

ApEn的值显然与m,r的取值有关。Pincus根据实践,建议取m=2,r=0.1~0.2SD[SD是原始数据u(i),i=1~N的标准差(Standard deviation)]。

2应用近似熵对睡眠脑电数据的研究实验

2.1实验的环境条件

2.1.1本项研究所具备的实验数据的条件

本实验的所有睡眠数据都是在医院中由医生对被测试者进行8小时的睡眠监测而采集的,并且经过去噪后而得到的脑电数据。但是其中仍有一些在睡眠过程中由于被测试者改变体位或呼吸障碍等因素而带来的干扰。所有睡眠数据都经过经验丰富的医生进行了人工的睡眠分期,以此分期结果作为研究各睡眠期特征的参考标准。

2.1.2被测试者脑电数据简介

(1)被测试者7071和7072:整个睡眠过程中没有深度睡眠Ⅲ、Ⅳ期阶段,由于存在呼吸障碍而导致呼吸事件使睡眠EEG中的干扰较多;

(2)被测试者7081和7082:由于睡眠较好,所以有睡眠Ⅲ、Ⅳ期阶段,且睡眠过程中呼吸正常,没有呼吸事件,但Ⅳ期经历的时间又比较短,睡眠深度还不够。

(3)被测试者7091和7092:在睡眠过程中有许多呼吸障碍而导致的呼吸事件,所以脑电EEG中干扰也较多,没有进入Ⅲ、Ⅳ期睡眠;

2.1.3本项研究所具备的软硬件环境条件

此程序是在一台486微机上,Windows 3.1环境下运用Borland C++ 4.5编写的Windows程序。

2.2参数的选取

在计算ApEn时,首先要对3个参数进行选取,即m,r和N。当选取之后,这三个参数将在整个计算中固定不变。

2.2.1m的选取

m是计算近似熵时进行比较序列的长度,即窗口的长度。

选择m=2要好于m=1,这样在序列的联合概率进行动态性重构时,会有更多的详细的信息。对于m>2时,一般不用,因为下面两个因素:1)若m>2,应要求N在数千点以上,但为了确信事物的状态具有相同的性质,输入的点数N一般不宜超过5000;2)一旦选定了N后,m>2时,要想估计出好的结果,r就需要比较大。这样通过ApEn(m,r)来分析序列的分布就会丢失许多信息[3]

所以,选择m=2。

2.2.2r的选取

为了得到的ApEn(m,r,N)具有比较有效的统计特性,r值太小,估计出的统计概率不理想;r值太大,会丢失系统的许多详细信息。经过Pincus等人的对确定性过程和随机过程的理论分析及其计算和在临床应用的基础上,总结出r在0.1~0.25SD(SD为u(i)数据的标准差]之间能够估计出比较有效的统计特性[3]

所以在此基础上,对r=0.15SD和r=0.2SD进行计算比较,我选择了r=0.2 SD。这样既能估计出好的条件概率,且包括了较详细的系统信息。

2.2.3N的选取

对于给定的数据,Pincus等人经过研究认为:要得到有效的统计特性和比较小的ApEn的伪差,输入的数据点数最好在N=100~5000之间。

根据睡眠脑电的特点,30秒钟反应一个睡眠阶段。所采样的数据的取样频率为100Hz,即3000点的数据反映一睡眠阶段。理论上,计算一个ApEn选N=3000点,但对于实际的数据中,各个睡眠阶段之间不可能有明显的分界,这样一来在任选的30秒的数据中,不可能只包含一个睡眠阶段,而是包含有两个或三个睡眠阶段的特征波。所以取30秒,即N=3000点的数据在分析每一个睡眠阶段特点中会造成混淆和丢失该阶段的详细睡眠信息。且计算中遇到的第二个问题就是运算速度太慢。

于是选择N=1000来计算。算出的ApEn中,每三个点反映一个睡眠阶段。这样更能详细地反映出睡眠阶段的信息,且速度提高了3倍多。但由于需要计算的睡眠脑电信号比较长,一般是6~8小时,所以这一速度还不够要求。

最后选择的N=600,速度又提高了2倍。此时用计算出的5个点来反映一个睡眠阶段,