热门关键词:

纳通道内λ-DNA过孔信号的小波去噪及统计分析

  • 该文件为pdf格式
  • 文件大小:341.73KB
  • 浏览次数
  • 发布时间:2017-01-17
文件介绍:
本资料包含pdf文件1个,下载需要1积分

W avelet denoising and statistical analysis of signal ofk-DNA translocation through nanoporesW ang Fei Ni Zhonghua Chert Yunfei Liu Lei Ma Jian Bi Chert(Jiangsu Key Laboratory for Design and Manufacture ofMicro-Nano Biomedical Instruments,Southeast University,Nanjing 211189,China)Abstract:To overcome the shortcomings that the signal of -DNA translocation through nanoporeshas high-noise,weak-strength and non-stationary,a wavelet analysis method with excellent resolu-tion capabilities in time and frequency domain is proposed to analyze the signal of -DNA transloca-tion.A statistical analysis is applied to the入-DNA signal after effective denoising.First.accordingto the principle,suitable wavelet base function and the best decomposition level are chosen,and thedenoising threshold is determined.The results indicate that by using sym7 wavelet base function,de-composition level at 5 and using default soft threshold the noise in the signal can be reduced effec-tively and the signal to noise ratio(SNR)can be improved.And then,the characteristic curent sig-rials.which arise from -DNA molecules of 48 kbp translocating through silicon nitride nanopores of60 nm are statistically analyzed.The analysis results show that the curent blockade and tran slocationtime correspond to bimodal and skewed normal distribution respectively,which provides basis forsubsequent DNA molecular identification。

Key words:nanopores;signal of k-DNA translocation;wavelet denoising;signal to noise ratio;statistical analysis利用纳米通道(nanopores)研究 DNA等生物大分子的结构是-种崭新的生物技术,而对纳米通道内的检测信号进行分析是研究生物大分子结构的基础.作为基于微纳制造的第三代基因测序系统中基础理论研究工作的-部分,本文采用膜片钳记录 nA级甚至pA级 的 k-DNA通过氮化硅收稿日期:20124)5.12. 作者简介:王霏(1986-),女,硕士生;倪中华(联系人),男,博士,教授,博士生导师,nzh2003###seu.edu.cn。

基金项目:国家重点基础研究发展计划(973计划)资助项目(201lCB707601,2011CB707605)。

引文格式:王霏,倪中华,陈云飞,等.纳通道内k-DNA过孔信 号的小波去噪及统计分析[J].东南大学学报:自然科学版,20t3,43(1):5054.[doi:10.3969/j.issn.1001-0505.2013.01.010]第1期 王霏,等:纳通道内K-DNA过孔信号的小波去噪及统计分析 51纳米孔的离子电流信号,由于有效信号相对于噪声信号很微弱,分析的准确度较低,因此需要对检测到的 入-DNA信号先去噪再分析。

信号处理中常用的去噪方法包括 Fourier分析、短时 Fourier变换、Wigner-Vile分布等 J,其中基于 Fourier分析的方法只能使用在信号和噪声频带重叠部分非常序者完全分开的情况下,对于纳通道内微弱、非平稳信号,Fourier分析方法有-定的局限性.小波分析是-种时间窗和频率窗都可以改变的时频局域化分析方法,即在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率 。

信号和噪声在小波变换下表现出截然不同的性质,它能更准确地得到信号上特定点的奇异性信息 。

目前国内外关于纳通道 .DNA检测信号去噪的研究,主要是根据噪音产生机理在实验过程中进行去噪.在氮化硅膜片上涂 PDMS可以有效降低高频噪音,实验前用水虎鱼溶液对纳米通道进行表面化学处理可以有效降低低频噪音 J.郑华等在对电泳荧光信号去噪时使用了小波分析的方法,季忠等 也运用小波变换对微弱非平稳脑电信号成功去噪。

本文根据实验信号的特点,采用小波去噪的方法,去除 -DNA微弱电信号中的噪声信号,获取有效的二次数据,为准确识别其分子结构提供可靠的数据.小波去噪处理后,根据 -DNA在纳米通道输运过程中微弱电流脉冲信号的变化,即信号的驻留时间和幅度,对过孔信号的阻塞电流(,h)以及过孔时间(t )进行了统计分析,为今后 DNA分子测序中的信号分析以及大分子辨识工作奠定基础。

1 小波去噪1.1 原理小波变换是 Fourier变换思想的发展与延拓。

Malat算法利用小波变换将信号分解成不同的频段成分,信号 c经过离散小波分解可获得在不同尺度下的带通项,如图 1所示.其中,D (i1,2,, ,z)为信号中的高频部分,称作细节信号,分解次数越多,高频的成分越少.A (i1,2,,n)为信号中的低频部分,称作近似信号。

实际应用中,有用信号通常表现为低频的或者- 些比较平稳的信号,而噪声则通常表现为高频的或者-些非平稳的信号.对小波分解后的高频部分进行去噪处理,再将信号重构,得到需要去噪后的图 1 小波分解示意图信号,-般过程如下:1)信号的小波分解.选择确定的小波基函数和小波分解层数 JV,对信号进行 Ⅳ层小波分解。

2)高频系数的阈值量化.选择-个阈值量化准则,对每-个分解层次中的高频系数进行阈值量化处理。

3)小波重构.根据阈值量化后的第 1层~第Jv层的高频系数和第 Ⅳ层的低频系数进行小波逆变换,重构去噪后的信号。

1.2 效果判定信噪比(SNR)和最轩方误差(MSE)是判断去噪效果的依据.信噪比越大,均方误差越小,去噪效果越好.要得到理想的去噪效果,需要选择合适的小波基函数,确定最佳的分解层数并选认适的阈值.对某-信噪比的含噪声信号,分别改变所取的小波基函数、分解层数和阈值取法,通过大量的对比仿真实验找到最好的去噪方法.然后再对不同信噪比的含噪声信号进行去噪处理。

1)信噪比SNRsNR10lg2)均方误差 MSEM Es N[ n)- ( )] n:1,2,3,(2)式中,P 1∑f2(n)为原始信号的功率;P H÷∑[,( )-f(n)] 为原始信号中噪声的功率;n,(n)为原始信号 ( )为去噪后的信号。

1.3 2-DNA实验信号去噪图2为 入-DNA在氯化钾溶液中通过60 nm氮化硅纳米孔时用膜片钳记录的离子电流信号.采样频率为50 kHz,采样点数为2.5 X 10 。

1.3.1 小波基函数的确定由于小波分析中的小波基函数具有多样性,在htp://journa1.sel1.edu.12/152 东南大学学报(自然科学版) 第43卷249248247脚 2462452440 1 2 3 4 5时间/s图 2 k-DNA通过氮化硅纳米孔的电流信号.DNA电流信号去噪过程中,主要从经过小波变换处理后所获得信号曲线不失真的角度来选择小波基函数。

通过在 Matlab7.1中对纳通道内的过孔信号进行仿真,发现采用 symN和 dbN函数进行小波去噪处理后,信号的峰形良好,且这 2种小波基函数的性质也较好.因此,本文采用信噪比和最轩方误差来确定最佳小波基函数。

对实验信号在默认软阈值下进行5层分解,比较不同小波基函数的去噪效果(见表 1),由表可知,对 -DNA电流信号,sym7小波基函数的信噪比最高,均方误差最小,所以sym7为最佳小波基函数。

表 1 使用不同小波基函数的去噪效果鎏 sNR MsE 篓 sNR MsE 函数 凼裂db1 160.550 8 0.081 4 syml 160.550 8 0.081 4db2 161.179 3 0.078 8 syrn2 161.179 3 0.078 8db3 161.2100 0.078 7 sym3 161.2100 0.078 7db4 l61.296 8 0.078 4 sym4 161.319 1 0.078 3db5 l61.3744 0.078 1 sym5 161.391 1 0.078 0db6 161.196 3 0.078 8 sym6 161.3801 0.078 1db7 l61.137 1 0.079 0 sym7 161.414 8 0.077 9db8 l61.2464 0.078 6 sym8 161.358 2 0.078 1db9 l61.109 3 0.079 l sym9 161.3464 0.078 2dbl0 161.062 3 0.079 3 sym10 161.320 7 0 078 3dbl1 161 142 9 0.079 0 syml1 161.339 5 0.078 2dbI2 160.9962 0.079 6 syml2 161.349 7 0.078 2dbl3 l60.981 7 0.079 6 syml3 161.327 7 0.078 3dbl4 l60.980 7 0.079 6 sym14 161.308 5 0.078 31.3.2 分解层 数 的确定分解层数是决定去噪效果的重要因素,需要根据实际信号的特点确定.本文中,将信号分解层数设置为 1-8.比较不同分解层数去噪后的效果,结果见图3.可以明显看出,分解层数越多,去噪效果越好;但分解层数超过5层后,改善效果不是太明显,且信号会出现失真.所以本文确定分解层数为5层。

《 249248髫2470 0.02 0.04 0.06 0.08 0.10时间/s(a)原始信号0 0.02 0.04 0.06 0.08 0.10时间/s(b)L10 0.02 0.04 0.06 0.08 0.10时间/sf c L20 0.02 0.04 0.06 0.08 0.10时间/s(d)L30 0.02 0.04 0.06 0.O8 0.1O时间/s(e)L40 0.02 0.04 0.06 0.08 0.10时间/s(f)L:50 0.02 0.04 0.06 0.08 0.10时间/s(g)L60 0.02 0.04 0.06 0.08 0.10时间/s(h)L7O图 30.02 0.04 0.06 0.08 0.1O时间/s(i)L8不同分解层数 的去噪效果图1.3.3 阈值 的 选取噪声是-种随机信号,其方差是未知的,首先要对其阈值进行估计.经过小波分解后,信号的系数要大于噪声的系数,但可以找到-个合适的数值作为阈值.当分解系数小于该临界阈值时,认为主要是由噪声引起的,因此可将噪声截掉;当分解系数大于该临界阈值时,认为主要是南信号引起的,可以保留该分解系数。

表 2为 3种不同阈值量化处理方法的信噪比和均方误差.由表可知,使用各层不同阈值去噪,虽然消噪效果最明显,但峰高误差较大,信号失真较严重,所以最后确定使用默认阈值消噪为 -DNA消噪的阈值量化处理方法,去噪前后信号对比见图4。

9 8 7 98 7 9 8 7 98 7 98 7 9 8 7 9S7 9。9 7 I寸《-Ⅱ 脚 《1l 印 vⅡ 删 vIl/ vu媛 u ⅥI .串 vu '申第 1期 王霏,等:纳通道内h-DNA过孔信号的小波去噪及统计分析 53表2 3种不同阈值选取方法的消噪效果本文针对 .DNA在氯化钾溶液中通过纳米孔时产生的电流信号的特点,对小波基函数、分解层数和阈值进行了研究.结果表明,选择 sym7为小波基函数,分解层数为5层,使用默认软阈值,去噪处理后,信噪比提高,峰高误差较小,便于开展后续的信号分析工作。

249杂 48唧 247《 249杂248247O O.o2 0.04 0.O6 O.O8 O.1O时间/s(a)原始信号O O.O2 O.04 0.O6 O.O8 0.1O时间/s(b)去噪后信号图4 默认阈值消噪效果图2 信号统计分析从图2的实验信号中可以看出,电流幅度有-系列的下降,这是由于单个 -DNA分子在电场力的作用下穿过纳米通道时会形成阻塞,导致通道内离子电流减小.由于核酸链上各碱基尺寸和分子结构的差异,在穿孔过程中对孔的阻塞程度也不同,因此在-定实验条件下,通过分析阻塞电流 和过孔时间t 来监测电流信号的变化,能够推测出生物大分子的化学组成、空间结构等特性。

图5为 -DNA(48 kbp)在 1 V电压下通过60nm的SiN纳米通道时,拉直状态(nonfolded)、半折叠状态 (partialy folded)、折叠状态 (fuly fol-ded)3种类 型特征事件 的信号9 J,分别表示 入DNA分子以不同姿态通过纳米通道.由于纳米孔厚度相对于 -DNA分子长度要熊多,故过孔时间只考虑 .DNA 的长度.理论上拉直状态的 。

DNA过孔时,物理占位较小,由此引起的电流降也较小,同时,由于拉直状态的 入-DNA长度较长,因此过孔时间也会相应较长;同理,折叠状态的 。

DNA引起的电流降幅度较大,且过孔时间变短;半折叠状态的入-DNA的电流降和过孔时间均应该位于前两者之间.从图5(a)的半折叠状态信号形态可以看出,信号明显有2个电流降水平(虚线处),这证明了 DNA通过纳米通道时先是折叠状态后是拉直状态,由此可以判断此类信号为 DNA半折叠状态的过孔信号。

斌脚嗍雹O 5 lO l5 2O 25 3O 35 40时间/s(a) 3种特征事件的过孔信号5040 3O赫 201OO5040籁 3O姗 201O0td/mS(b)阻塞电流对过孔时间的散点分布图1.0 1.5 2.O 2.5 3.0 3.5 4.O阻塞电流/nA(c)阻塞电流统计直方图U.4 0.8 1.2 1.6 2.0过孔时间/ms(d)过孔时间统计直方图图 5 k-DNA(48 kbp)通过 60 nm SiN纳米通道电流信号统计分析从大量事件中对阻塞电流和过孔时间进行了统计 ,得到的阻塞电流 的统计直方图(见图5(c))、过孔时间 的统计直方图(见图5(d))以及特征事件的阻塞电流对过孔时间的散点分布图(见图5(b)).由于半折叠状态的事件发生概率很低,数目较少,不易统计得到分布规律,故本文重点统计分析了其余2类事件.图5(b)中的每个散点htp://journa1.seu.edu.cn5 O 5 0 5 O 5 O 凇vⅡ54 东南大学学报(自然科学版) 第43卷表示-个 k-DNA过孑L事件,由此可以看出拉直和折叠2种状态的过孑L信号,h和 t 分布,从而可以计算得到其平均阻塞电流分别为(1.237 1±0.226 3)nA和(2.140 9±0.352 1)nA;平均过孔时间分别为(0.497 1±0.251 2)ms和(0.376 6-0.226 5)ms。

对直方图的高斯拟合可以反映统计数据的实验意义ll .图5(C)为 f 统计直方图,图中的双峰分别表示了拉直和折叠2个状态的过孔信号.对其进行双峰高斯拟合,结果证明这 2种信号的阻塞电流各 自符合高斯分布.图5(d)为 t 的统计直方图,由于2种信号的过孔时间差异在0.1 ITIS左右,因此没有明显的双峰,整体符合偏正态分布。

阻塞电流包含了大分子的尺寸和结构信息,而过孔时间反应了大分子在纳米通道内运动的快慢 ,过孔时间越长采集到的大分子信息越多,更容易大分子辨识工作 。

3 结语本文提出了采用小波去噪的方法消除纳通道中微弱电信号中的噪声,并对膜片钳采集的48 kbp-DNA通过 60 rim SiN纳米孑L的含噪声信号进行去噪处理,确定了合适的小波基函数、最佳的分解层数和合适的阈值.对去噪后的信号进行分析,分辨出3种不同状态的过孔信号,并对拉直状态和折叠状态的入.DNA信号进行了统计和拟合,得到其阻塞电流和平均过孔时间的分布图。

正在加载...请等待或刷新页面...
发表评论
验证码 验证码加载失败