本文用模糊神经网络对单次事件相关电位(single event-related potentials, sERP(P300))进行聚类分析,并提出应用奇异值分解确定最佳聚类数的通用新方法,结果显示它们构成了提取和压缩sERP动态信息的有效方法。
分类号: R318.04; O17
0前言
单次事件相关电位(single (trial or sweep) event-related potentials, sERP)有时是指伴随认知过程记录到的事件相关脑波(event-related EEG);有时又指用某种滤波方法(非平均叠加法)从事件相关脑波中提取的电位。这些滤波方法的效果通常以提取的波形是否接近平均ERP来判定,因而它们在提取sERP动态信息方面往往难以令人满意。
聚类分析是在紧致性假定(compactness hypothesis)下研究事物分类的方法,即假定在特征空间内某类某成员与本类所有其它成员之间的距离要小于与其余类的全部(或大多数)成员间的距离。对sERP进行聚类分析的设想早已提出[1],但直至1995年才有首篇应用矢量量化(vector quantization, VQ)对听觉Oddball范式(paradigm)的sERP进行聚类分析的报告[2],VQ内的LBG算法相当于聚类分析的C均值算法[3],结果多收敛至局部最优。该文应用模拟退火技术获得最优VQ,模拟退火技术是一种通用的优化技术,计算时间长,参数多用试凑法选取,结果实际只是接近而并不能保证一定收敛至全局最优。该文把sERP分为三种亚型,发现只有40%sERP的形态与平均ERP相似。文中未提及如何确定最佳聚类数。通常聚类数过少则聚类误差较大,若分类过细则有悖于聚类分析的目的,尚无确定最佳聚类数的满意方法[14]。
本文尝试用模糊Kohonen聚类网络(fuzzy Kohonen clustering networks, fKCN)对sERP进行聚类分析,FKCN是模糊C均值算法与自组织特征映射(self-organizing feature map, SOFM)的有机融合[5]。
1方法
1.1实验资料
用于本文sERP(P300)聚类分析的数据记录自1例23岁健康男性受试者的事件相关脑波。
所用的Oddball范式(图3)由两张出现概率不同的照片(视觉刺激)组成,其中一张为靶照片出现30次,另一张非靶照片出现70次,各照片以随机次序在计算机屏幕上均呈现300ms,照片之间的显示起始时刻间隔1102ms。要求受试者在低概率的靶照片出现时尽快按鼠标键应答,尽量避免眨眼及眼球运动。该被试者在靶照片出现时,均以右手按鼠标键应答,未出现漏击及误击现象。在此过程同步记录了相应的100条事件相关脑波及历次的反应时间。
其余测试条件如下:实验在隔音屏蔽暗室内进行,受试者取舒适坐位;记录仪器为北京纽科公司产MEDICID-3E型事件相关电位仪,通频带为0.50~30Hz,头皮电阻低于10kΩ,电极放置位置依据国际10/20标准,记录电极与参考电极的组合为Pz-(A1+A2),采用该导联的原因主要是通常P300成分在该导联最大且眼动伪差的干扰较小,接地电极置于Fpz,采样频率为500Hz,每条脑波信号长度为1102ms,故各有551个数据点。未做去除伪差等数据编辑工作。测试完毕,数据存盘后另外输入486微机进行聚类分析。
1.2数据预处理
100条各长551点(1102ms)的sERP每隔5点取1点得到110点的时间序列。我们将利用sERP形态信息聚类。在聚类分析中,要求数据有统一的量纲。若量纲不一致,某些量纲级别较高(低)的数据对聚类分析的结果影响过大(小),将掩盖事物本质属性,因此原始数据聚类分析前须统一量纲。对长度为T的第n条sERP时间序列{xn(t),1tT,1nN}sERP作极差正规化变换:
1.3模糊Kohonen聚类网格
FKCN可用多个输出结点来表征输入样本,在输出结点较少也能保证失真度较小的高效表征。FKCN通过改变随时间变化的权重指数mt来控制SOFM中的学习率和邻域函数:
mt=m0-t。(m0-1)/tmax,m0>1(3)
其中tmax为训练次数高限,m0为权重指数初值,用试凑法选择。算法如下:
FKCN1. 确定聚类数C(1CN),给出距离测度‖‖,ε>0为一个任意小的正数。
FKCN2.初始化聚类中心wi,0,1iC。
FKCN3.对于第t次训练,1ttmax:
a.利用(3)及(4)式计算所有N个输入样本的模糊化学习率:
其中uin,t是输入模式xn对于第i类的模糊隶属函数值
当mt接近1时,FKCN接近于采用竞争学习规则,“获胜”类学习率逼近1,而其余类学习率逼近0。FKCN的特点是每一次学习所有输出结点的权矢量均得到更新,因此网络不受呈现的训练样本先后顺序影响。FKCN将高维数据进行非线性映射,投影至低维空间。
我们简化了FKCN算法对sERP进行聚类分析:由于选择任意小的正数ε时仍凭经验或试凑,因此聚类过程的终止仅由训练次数高限tmax确定。FKCN的各项参数如下:输入层结点110个,输出层结点则尝试了多种不同的数值,权重指数初值m0=2.0,网络训练100次后终止,在486微机上仅需数分钟。
2结果
2.1sERP及其平均叠加结果
图1示中心化后的sERP及其平均叠加结果:30条靶刺激引出的(a)sERP及其对应的(b)平均ERP,其中可见350~700ms时程内明显的P300成分包含了P3a和P3b双峰;70条非靶刺激引出的(c)sERP及其对应的(d)平均ERP,其中峰潜伏期约为400ms的P3a成分较明显。
LATENCY(100ms)
图1靶刺激引出的(a)30条sERP及其对应的(b)平均ERP;非靶刺激引出的(c)70条sERP及其对应的(d)平均ERP
2.2聚类分析结果
由于数据量纲已统一,聚类误差ERROR设为各输入模式xn(t)与最接近的聚类中心xc(t)差异的绝对值之和,图2示聚类误差随训练次数增加而减小。
FKCN训练后得到的4个聚类中心(权矢量)和100条sERP分别归属各聚类中心的隶属函数(构成4条谱曲线)如图3所示。图中T、N分别表示靶刺激(30个长竖条)和非靶刺激(70个短竖条)的出现,是实验所用Oddball范式。几个聚类中心具有同等重要性,排名不分先后。第3、4号聚类中心分别与非靶和靶刺激对应的平均ERP的波形相近;而第1、2号聚类中心的形态有点出乎意料,这两个聚类中心的形态在300ms以前是相似的,在此之后则为两条向相反方向变化的慢电位,看不到波峰与波谷构成的成分。每条sERP对每个聚类中心均有一个隶属函数,此时每条
图2聚类误差随FKCN训练次数增加而下降
sERP均有4个隶属函数值(其和为1),分别刻划了该sERP与各聚类中心的相似性,一些靶刺激引出的sERP对第4号聚类中心的隶属函数小于0.25,表明它们不含明显的P300成分。
权重指数初值m0分别尝试取1.80、2.20时,得到的聚类中心与上述结果相似,聚类误差在相同训练次数(100次)下均收敛至同一数量级水平。
图3对应训练后FKCN(110输入单元-4输出单元)4个权矢量的100条sERP的
隶属函数谱,Oddball范式由100个刺激组成(T:靶;N:非靶)
2.3确定最佳聚类数
利用FKCN在不同聚类数收敛时的(最终)聚类误差作出图4,图中聚类误差按公式(ERROR-5000)/100作了调整,若在聚类误差随聚类数增加而单调递减的曲线中看到明显拐点(聚类误差下降缓慢处),则可以确定最佳聚类类别数,但图中未见明显拐点,这种目测法判断拐点可受到数据量纲影响。
在分类数较大,如图5所示分为9类时,许多聚类中心形态的相似性表明该结果的冗余性,用奇异值分解(singular value decomposition
