前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇卷积神经网络的特性范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
一、智能装备简介
若想提高消防救援队伍的灭火救援效能,提高装备的智能化水平是必不可少的一步。消防装备的配备情况影响着战术和战术效果,甚至是直接影响救援成功率的重要因素。因此,提升装备的智能化水平、改善装备结构从而提升消防救援队伍的作战能力是关系广大人民群众生命以及财产安全的重要手段。消防装备智能化的研究工作任重而道远。本文着眼于图像法火焰识别技术,通过研究新技术,探讨将其应用于智能消防装备之中的可行性。
二、卷积神经网络的简介
(一)网络结构。卷积神经网络功能繁多,其中多层检测学习神经网是一种多层次的神经监测网络。其中心模块为卷积层,主要由隐藏层与最大池采样层组成,主要功能是特征提取。其中,连接层与传统多层感应器的隐藏层、逻辑归类器相对应。卷积神经网络的输入特征来源使卷积滤波器,而该神经网络的每一层都有多个理论上的神经元以及特征图。在给一个来自卷积和子采样层的输入统计滤波后,系统就提取了图像局部的特征,就可以确定它与其他特征之间的相对方位,上一层的输出值直接输入至下一层。通常情况下,我们可以通过特征层来得到卷积层(特征层是指:输入到隐藏层之间的映射)。(二)局部感受野与权值共享。局部感受野:由于图像空间的连接是局部性的,因此每个神经元都不需要感测全部图像,而只需感觉到局部的特征。然后,通过对较高级别感测量的局部神经元进行集成,可以得到整体的信息,并且减少了连接数量。权重分享:不同神经元之间的参数分享可通过降低求解参数,并通过放大器对图像的放大积获得多种特征图。实际上,权重共享图像上的第一隐藏层的所有神经元由于是在同一卷积上确认的,所以均能在图像的任意一个位置检测到毫无差别的特性。他的最主要的功能是能够通过适应小范围的图像和平移从而达到检测不同位置的目的,也就是良好的不变性平移。(三)卷积层、下采样层。卷积层:通过去卷积来提取图像特征,用来强化初始信号原属性,从而减少噪音。下采样层:由于研究人员发现图像下采样过程中,它能在保留信息的同时降低数据处理量,因此在发现某一特定的特征后,由于这个位置并不重要,所以样本会扰乱特定的位置。我们只需要知道这个特征与其他特点之间的空间相对方位,就可以处理类似的物体由变形和变型而产生的变化。(四)卷积神经网络的不足。如果网络层需要加深,每一个网络层增加的神经元数量会大幅增加,从而使模型复杂化,增大了调整参数的难度,也增大了过度拟合的风险。此外,在反向传播过程中,连续迭代会使梯度不断减小,而梯度一旦归零,权值便无法更新,导致神经元失效。(五)展望与总结随着研究人员对卷积神经网络相关的研究不断推进,其性能日益强大,复杂度也日益提升。目前,卷积神经网络的相关研究已经取得了显著成效。然而,一些人工扰动(如向原图片中键入噪点)仍然会导致图像的错误分类。如何解决这一问题,是今后研究的重点。此外,卷积神经网络的结构升级仍有很大空间,通过提升网络结构设计的合理性,可以完善量化分析能力。
三、图像分割
图像中包含很多数据,需要分割图像。然而,精确区分干扰是对整个系统亮度的精确分类和准确划类的前提。图像的分析技术是计算机视觉技术的基础。通过图像分割、提取特征参量等方法可以将原本的图像抽象化,从而便于分析和处理。多年以来,图像的分割技术研究一直是重中之重,研究人员给出了多种分割方法。一般而言,图像分割是将图像划分为不同的区域,给不同的区域赋予不同的权重,从而获取重要对象的一种技术。特征可能是灰度、颜色、纹理等,目标可能对应一个区或多个地方,这与特殊目的应用程序和特殊目的服务请求程序有关。一般而言,图像取值分割分析算法大致来说可以再细分为图形图像取值分割、边缘图像分割、区域分割和重复图像分析四大个门类。
四、火焰色彩虚拟模型的特征
(一)火焰色彩颜色类型特征。火焰色彩模型一般来说是基于某种火焰色彩类型模式,通过在图像阈值控制范围内通过设置某种色彩模型图像阈值来降噪提取火焰颜色特征图像。可以用任何提取静态火焰的特殊像素或者图案方式来精确描述一个静态火焰特征。然而,单纯地依靠颜色模型来进行火焰识别会导致严重的误判。火焰的颜色范围是非常大的,所以它很可能与其他物体颜色相近,导致模型将其混为一谈。(二)降噪在。火焰发展的初期过程中,是不断处于移动变化的。又一方面,火焰的全部运动都不会跳跃,也就是火焰满足相对稳定性。所谓燃烧火灾的相对稳定性,是指在火灾发生后,燃烧范围的空间会成一个相对稳定的扩增趋势扩增。通过分析火灾的相对稳定性,可以消灭许多虚假信号。(三)静态模型。在基于单帧图像识别的算法中,由于只使用了几个以火焰为基准的单一形状特征,因此算法复杂、误判率很高。因此,一个能够自主优化识别的模型就显得十分重要,图像静态特征提取的方法如下:由于曲率在人的视觉系统中往往是观测场景的重要参数,因此提取几何图像曲率等参数,并以此描绘火焰图像;根据测得的数据,描绘连续零曲率以及局部最大曲率、最高曲率正负值等集合特点。(四)动态模型在动态燃烧过程中,产生的火焰具有持续性。此外,根据火焰自身的特性和各种原因,火焰还会不断发生变化。然而,这种变化并不在单个帧图像中反映出来,而是在连续的多帧图像中只反映。因此,提取火焰的动态特征就是分析处理连续多帧图像。近年来,随着火灾科学的发展,从火焰的随机状态中发现了其规则性:1.火焰的面积增长性;2.火焰的形状相似性;3.火焰的整体移动。基于图像的火焰识别算法可划分为动态识别和静态识别。若将这两种算法同步进行应用,则定能增加工作效率。火焰形成的重要特点之一便是火焰形状。对于采集到的ccd火焰图像,首先进行两个连续的图像差分操作,然后通过分割方法获得连续帧的变化区域,使用扫描窗口得到的像素点数来记述连续帧变化区域。变化区域是指:图像处理中,在获得阈值之后,通过对高光度进行科学计算、实验分析,最终得到的区域。当其他高温物体移动到相机或离开视野时,所检测到的目标区域会逐渐扩大,并容易引起干扰,从而造成系统错误的报告。因此,需要将数据和其他图像的关键性特征进行一个高强度的结合,再深度进行挖掘。火焰的形状相似性:图像之间的类似性通常依赖于已知描述特点之间的差异度。该方法能够在任意复杂程度上建立相应的类似性量。我们可以对两个相似的元素进行比较,也可以对两个相似的场面进行比较,图像之间的相似性通常意义上是指场景以及结构上的相似性。在一般情况下,图像的结构相似度往往并不高,因此,我们倾向于选择更加典型的结构特点进行描述,如区域面积、区域亮度、线段长度等参数。虽然火焰的图像序列中火焰的边缘往往是很不稳定的,但图像的总体变化会被限制在一定范围内,而且一般的干扰信号模式包含了固定点或者光照变化,因此,在火焰识别的过程中,可以用初始火焰形状的变化规则与其进行对照。尽管火焰的变化通常呈现出不规则的特性,然而这种不规则在形态、空间分布等方面往往具有某种相似之处,因此,我们可以用连续图像的结构相似性来进行解析。
五、结语
各种高新技术不断飞跃式发展,这为我国消防智能化技术的开发以及与外国新型消防设备之间的碰撞提供了一个良好的契机,而消防装备的智能化已成为一个必然的趋势。自改革开放至今,我国所研究的有关装备智能化领域内取得的成果,已经为我们打下了坚实的发展基础,因此我们更应该加快消防智能化的进程,综合现有所具备的技术,取其精华去其糟粕,适而用之。由于研究条件和专业方向的局限,本文对智能消防装备中的火焰识别技术仍然存在不足。此次智能消防装备的研究方向主要是火焰识别领域,以建立模型的方法进行测算与研究,而对于理论性知识方面的探讨仍存在很大的不足。之后的研究可以从其他方面进行深入的探讨,探究其对系统化建模会产生哪些方面的影响。
参考文献:
[1]喻丽春,刘金清.基于改进MaskR-CNN的火焰图像识别算法[J].计算机工程与应用,2020,964(21):200-204.
[2]肖堃.多层卷积神经网络深度学习算法可移植性分析[J].哈尔滨工程大学学报,2020,41(03):420-424.
[3]郭昆.基于卷积神经网络的建筑风格图像分类的研究[D].武汉理工大学,2017.
[4]徐晓煜.极化合成孔径雷达舰船检测方法研究[D].西安电子科技大学,2017.
[5]黄忆旻.基于图像检索的导游系统的设计与实现[D].苏州大学,2016.
[6]宋戈.火灾自动检测技术在无人值守变电站中的应用[D].沈阳理工大学,2010.
[7]葛勇.基于视频的火灾检测方法研究及实现[D].湖南大学,2009.
摘要:
针对带钢表面缺陷检测系统的速度滞后,精度偏低等问题,在分析成像理论和图像检测理论的基础上,设计并实现了一种带钢表面缺陷高速高精度在线检测系统.该系统首先采用大功率半导体均匀发光激光器技术、高速线扫描成像技术和基于图形处理器的Gabor纹理滤波技术实现了高速高分辨率的图像采集和处理,然后采用基于嵌套循环的K-折交叉验证、信息增益率和BP神经网络方法构建了高准确率的分类器,以达到对带钢表面缺陷高速高精度在线检测.实验结果表明,该系统满足了现有带钢生产速度的要求,具有较高的精度和准确率.
关键词:
图像采集和处理;图像检测;Gabor纹理滤波;神经网络
0引言
钢铁企业为了提高竞争力,对带钢的生产提出了新的要求,也对带钢表面检测系统提出了更高的要求,既要有更高的检测速度还要有更加准确的检测精度[1].而与此同时,跟随机器视觉技术的发展,带钢表面检测系统也得到了广泛的研究与应用[2].主要研究包括:①光源技术.由于带钢检测对光源要求频度高、体积小,这限制了传统光源在其应用[3],激光具有方向性好、亮度高、体积小等优点,被广泛应用于带钢检测应用中,国内的徐科等[4]提出热轧钢检测中用绿光作为激光光源,但激光照明需解决均匀性问题.②扫描技术.由于电荷耦合元件能够实现实时检测,成为目前研究和应用的主流技术[5].但是,CCD电荷耦合器需在同步时钟的控制下,以行为单位一位一位地输出信息,速度较慢,而互补金属氧化物半导体光电传感器采集光信号的同时就可以取出电信号,还能同时处理各单元的图像信息,速度比CCD电荷耦合器快很多[6].③图像处理算法.受限于带钢加工过程的特性,带钢表面呈现出随机纹理的特点,对于随机纹理图像的处理分析,目前常用的方法有共生矩阵法、频域滤波法、分形法等.作为频域滤波法的代表,二维Gabor滤波器有着与生物视觉系统相近的特点[7],广泛应用于纹理图像的处理分析.但是,CPU很难满足现在的带钢检测的实时要求[8].④分类算法.特征选择的主流算法是主成分分析和信息增益.主成分分析存在特征向量方向不一致的问题,而且如何确定主成分存在主观性[9].信息增益可以衡量特征的优劣,利用它可对特征进行排序,方便后面的特征选择,但信息增益适用于离散特征,信息增益率既适用于离散特征也适用于连续特征[10],被广泛应用于特征选择的过程中.图像分类算法主流算法包括支持向量机和BP神经网络.支持向量机不适用于大样本的分类问题[11].BP神经网络方法具有能够解决非线性分类问题,对噪声不敏感等优点,被广泛应用于带钢检测中,如王成明等[12]提出的基于BP神经网络的带钢表面质量检测方法等,但是BP神经网络的超参的设定往往具有随机性,这严重影响了分类效果[13].本文首先介绍了带钢表面缺陷高速高分辨率成像系统的设计,针对光源的不均匀性、图像处理速度慢等问题,提出改进方法,然后介绍了分类器的构建,针对样本划分的随机性、特征选择的随机性以及BP神经网络超参设定的随机性问题,做出改进,最后介绍试验结果.
1带钢表面缺陷高速高分辨率的成像系统的设计
1)大功率半导体均匀发光激光器技术.激光能够保证带钢表面缺陷的检出率[14],本系统选用808nm半导体激光器作为照明源,出光功率可达30W,亮度可达1500流明.激光照明需解决均匀性的问题,本文采用了基于鲍威尔棱镜的激光线发生办法,解决了激光照明的均匀性问题,其光路如图1所示.该方法首先在激光聚焦位置放置圆形球面透镜,负责将发散的激光束汇聚成准平行光,同时控制光柱的粗细,然后,利用鲍威尔棱镜的扩散效果对圆柱的一个方向进行扩束,最终形成激光线.为保证亮度及宽度的适应性,激光器出光口距离圆透镜、鲍威尔棱镜的距离可以精密调整.为了降低反射亮度损失,在透镜表面镀上808±5nm的T≥99%的增透膜.
2)基于GPU的Gabor纹理滤波技术.二维Ga-bor滤波器具有易于调谐方向、径向频率带宽及中心频率等特征,本文采用该方法来进行图像处理,二维Gabor函数为guv(x,y)=k2σ2exp-N2(x2+y2)2σ[]2×expi(k•()xy[])-exp-σ2{()}2(1)其中:k=kxk()y=kvcosψμkvsinψ()μ;kv=2-v+22π;ψμ=μπN;v的取值决定了Gabor滤波的波长;μ的取值表示Gabor核函数的方向;N为总的方向数.设f(x,y)为图像函数,guv(x,y)为卷积函数,则卷积输出N(u,v)可表示为N(u,v)=f(x,y)*guv(x,y)(2)二维Gabor滤波算法计算量较大,为了保证了带钢表面缺陷检测的实时性,采用基于GPU的并行处理架构,其计算流程如图2所示.GPU的算法分为两个流程:训练过程主要针对无缺陷图像进行,通过训练完成纹理图像的背景建模,一方面消除背景变化带来的干扰,另一方面形成有效的Gabor卷积参数,以便在检测过程中得到最优的检出效果.检测过程对实际拍摄的缺陷图像进行分析,首先按照GPU的核心数和缓存大小对图像进行分解,本文所有GPU的核心数为1024,显存2G,因此将原始图像分解为1000块,分别加载到1000个核心中,同时并发运行卷积运算.最后将各个窗口的卷积结果合并到一起,得到完成的滤波结果,最后借助于背景模式,将背景的干扰消除,得到干净的缺陷区域.
3)成像系统.根据缺陷检测的精度要求(1800m/min的检测速度,0.25mm的精度),带钢的规格要求(1900mm规格),对带钢进行成像系统设计.基于互补金属氧化物半导体(CMOS)的成像芯片具有速度快,用电低等优势.选用两个4K线扫描CMOS相机作为成像核心器件,选用CameraLinkFull接口作为数据输出.两个4K扫描中间重叠100mm作为图像拼接区.两组线激光光源与线扫描组成系统的主要成像模块.成像系统结构如图3所示.
2构建分类器
检测缺陷类别及其特征描述如表1所示.
1)训练集和样本集划分.主要缺陷类别有5个,每个类别收集样本7000,共计35000个样本.为了避免训练集和样本集划分的盲目性,采用10-折交叉验证的方式划分训练集和测试集,即将样本集分成10份,从中选1份为测试集,剩下的为训练集,如图4所示,究竟选择哪一份作为测试集,需在后面的嵌套循环中实现.
2)特征选择.缺陷区域的长度、宽度、面积、区域对比度等共计138个特征形成初始特征集合,利用信息增益率来对各个特征排序.设样本集T的某个特征子集S中,相异值构成集合A,集合A把特征子集S划分为多个子集{S1,S2,Sv,…},|Sv|、|S|为集和大小,信息增益率的公式为Gainration(S,A)=Gain(S,A)Intrinsiclnfo(S,A)(3)式中Gain(S,A)为信息增益,是分裂前的信息减去分裂后的信息,公式为Gain(S,A)=InfoBefore(S)-InfoAfter(S)=Entropy(S)-∑v∈Values(A)|Sv||S|Entropy(Sv)(4)式中Entropy(S)为集合S的熵,公式为Entropy(S)=Entropy(p1,p2,…,pm)=-∑mi=1pilogpi(5)式中pi为第i个类别的概率.式(3)中,Intrinsiclnfo(S,A)为内在信息,公式为Intrinsiclnfo(S,A)=∑v∈Values(A)|Sv||S|log(|Sv||S|)(6)利用信息增益率对特征进行排序,再利用循环(从1到138循环)实现最优的特征个数的确定.
3)BP神经网络隐含层节点数的确定.BP神经网络应用到带钢表面质量检测上具有很多优势,但也存在一些问题,主要体现在隐含层节点数选取的盲目性和初始权值选取的随机性.对于隐含层节点数确定问题,利用隐含层节点数常用计算公式[15](2(m+n)+1,n+槡m+a,log2n,n为输入层节点数,m为输出层节点数,a为的[1,10]常数)求得节点数的可能取值集合n1,求得该集合最大值n1-max和最小值n1-min,从n1-min开始到n1-max,利用循环,节点数逐个增加,确定最优的隐含层节点数[16];
4)BP神经网络初始权值的选取.当隐含层节点数确定后,需要确定输入层和隐含层之间、隐含层和输出层之间的初始权值.首先生成10组随机数数组,利用循环确定最优的随机数数组.
5)判别标准和嵌套循环.上述各循环中,分类效果好与坏的判别标准是分类的总体精度,公式为OA=∑niin(7)式中:nii为样本被预测为类别i,n为样本个数.上述各循环组合在一起就是一个嵌套循环,其N-S盒图如图5所示,最外层是测试集和训练集的10折交叉验证,第1层是确定最优的特征数,第3层是确定最优的隐含层节点数,第4、5层是确定最优的输入层和隐含层、隐含层和输出层的初始权值[17-20].经以上循环,确定D3作为测试集,最优特征数为23个,最优的隐含层节点数是46个,同时也确定了最优的初始权值,对应的3层BP神经网络的网络模型如图6所示.
3实验结果
1)鲍威尔棱镜与柱透镜进行对比在实际工作距离1.5m处,采用0.1m为间隔使用光功率计测试光源功率,如图7所示,横轴为测试点,纵轴为测试点的光功率.实验表明,鲍威尔棱镜均匀性优于柱透镜.
2)Gabor滤波方法与其他方法比较将动态阈值法+Blob分析法(方法A)和灰度共生矩阵纹理背景消除法(方法B)两种方法与Gabor滤波方法进行比较,如图8所示.由于缺陷与背景灰度相近(图(a)),致使方法A缺陷丢失(图(b)),由于缺陷与背景纹理相近(图(d)),致使方法B产生噪声(图(e)),Gabor方法取得了不错的效果(图(e)、(图(f))).
3)GPU与CPU比较以4096×4096的图像为例,选10幅有代表性图像,利用CPU(最新的inteli7-2600处理器,4核8线程,2.6GHz,内存8G)和GPU(nVidiaGTX970,4G缓存显卡)进行Ga-bor运算,计算时间如表2所示,GPU计算效率明显优于CPU,其中CPU的平均耗时为290.4ms,而GPU的平均耗时为31.7ms.
4)检测效果在产线速度为1775m/min,最小检测缺陷的尺寸为0.25mm的检测系统中,对带钢的主要4种类型缺陷进行检测统计,检测结果如表3所示.可计算出整体检出率99.9%,检测准确率99.4%.
4结论
本文提出将基于鲍威尔棱镜的大功率激光器应用到光源的设计中,保证光源光照的均匀性;提出了新的带钢表面缺陷检测系统的成像系统结构设计,保证了快速、高精度的生成图像;提出了基于GPU的二维Gabor滤波图像处理的算法,满足了实时处理的要求;提出了基于嵌套循环的分类器择优算法,避免了样本集选择、特征选择和BP神经网络参数设定的盲目性.借助上述技术,系统实现了较好的效果,满足当前带钢生产的检测需求.
参考文献:
[1]张长富.中国钢铁工业运行情况和发展展望[J].中国钢铁业,2013(4):5-8.
[2]刘彩章.基于机器视觉的带钢表面缺陷成像系统理论与实验研究[D].武汉:武汉科技大学,2012:2-4.
[3]高瑀含,安志勇,李娜娜等.高斯光束整形系统的光学设计[J].光学精密工程,2011,19(7):1464-1471.
[4]徐科,杨朝霖,周鹏.热轧带钢表面缺陷在线检测的方法与工业应用[J].机械工程学报,2009,45(4):111-114.
[5]李霞.基于CCD的钢板测宽仪系统设计[D].秦皇岛:燕山大学,2014:5-10.
[6]石东新,傅新宇,张远.CMOS与CCD性能及高清应用比较[J].通讯技术,2010,43(12):174-179.
[7]高梓瑞.Gabor滤波器在纹理分析中的应用研究[D].武汉:武汉理工大学,2012:6-10.
[8]王成顺.表面缺陷检测GPU并行图像处理技术[D].合肥:合肥工业大学,2012:3-6.
[9]徐永智,华慧川.对主成分分析三点不足的改进[J].科技管理研究,2009(6):128-130.
[10]李佳龙,阎威武,白晓慧,等.基于数据驱动与信息增益率多指标决策模型的生活饮用水水质评估[J].大连理工大学学报,2016,56(1):92-96.
[11]张晓雷.支持向量机若干问题的研究[D].北京:清华大学,2012:1-20.
[12]王成明,颜云辉,李骏,等.基于BP神经网络的冷轧带钢表面质量检测研究[J].机械设计与制造,2007(6):106-108.
[13]高正中,张晓燕,龚群英.基于BP神经网络的超声波流量计的设计[J].现代电子技术,2016,39(16):6-9.
[14]周洋,何平安,蒋千年等.激光束整形光学系统的设计与研究[J].光学与光电技术,2006,4(2):26-28.
[15]飞思科技产品研发中心.神经网络理论与Matlab7实现[M].北京:电子工业出版社,2005.
[16]沈花玉,王兆霞,高成耀等.BP神经网络隐含层单元数的确定[J].天津理工大学学报,2008,24(5):13-15.
[17]文冬林.BP神经网络中一种逃离局部极小点的方法研究[D].贵阳:贵州大学,2008.
[18]甘胜丰.带钢表面缺陷图像检测与分类方法研究[D].北京:中国地质大学,2013:3-20.
[19]吴彬彬.机器视觉方法在带钢表面缺陷检测中的应用研究[D].武汉:武汉科技大学,2015:4-50.
关键词:卷积神经网络;人脸识别;大样本;对抗生成网络
中图分类号:TP391 文献标识码:A 文章编号:2095-1302(2017)07-00-04
0 引 言
近几年,基于大量训练数据的卷积神经网络(Convolutional Neural Networks,CNN)在目标检测、目标识别、显著性检测、行为识别、人脸识别和对象分割等计算机视觉领域取得了举世瞩目的成果。这些令人鼓舞的成绩主要归功于以下几点:
(1)将大量有标签的数据作为训练集,学习出具有百万参数的模型,从而使卷积神经网络能够有效提取对象的本质特征;
(2)不断改进性能优异的网络结构,如Very Deep VGG Network[1],Google Inception Network[2]和Deep Residual Networks[3]等;
(3)各种并行计算硬件设备(如GPU)的支持,大大提高了CNN训练模型的效率。其中,将标签的大量数据作为训练集起着至关重要的作用。
本文以人脸识别为例,讨论和综述多样本算法的研究现状和发展方向。
有效的特征是目标识别的关键,对人脸识别问题来说亦如此。传统的主成分分析(Principal Component Analysis,PCA)[4,5],线性区分分析(Linear Discriminant Analysis, LDA)[6]和局部二值模式化(Local Binary Pattern,LBP)[7,8]等取得了不错的成绩。基于传统特征的人脸识别受限于环境,此类特征作用在复杂或者背景多变的人脸图像时,其识别性能往往大幅下降,如在LFW数据集上其识别率骤然下降[9]。
采用CNN作为特征提取模型,主要考虑到该模型的所有处理层,包括像素级别的输入层,均可从数据中学习到可调节的参数。即CNN能自哟哟笫据中学习特征,无需人工设计特征。合理有效的特征需从大量数据和大量参数中自动学习获取,从而达到优秀的识别性能。基于卷积神经网络的世界领先方法均使用了上百万的数据,其中最具有代表性的如VGG-Face网络需要260万个人脸图像样本进行训练[10],Facebook的DeepFace网络需要440万个有标签的人脸图像样本训练[11]。而Google更使用了2亿样本数据来训练FaceNet网络[12]。
1 多样本获取现状
如引言所述,有效合理的特征是目标识别的关键,而CNN能从大量有标签的数据中自动学习图像的本质特征。获得图像特征的关键因素是有标签的大数据。因此许多研究的前提工作均聚焦在人工获取数据和给数据加标签方面。然而,获取百万级的数据并非易事。大数据获取需要人工从网上下载、处理,然后给数据添加标签,耗费大量的人力物力。虽然也有一些公开免费的数据集,且收集该类数据相对比较容易,如CASIA-WebFace[13],有49万个图像,但远少于Facebook和Google的数据集。在这种情况下,缺乏大量样本直接阻碍了深度学习方法的使用,成为阻碍提高检测率和识别率的瓶颈。除了深度学习技术提取特征需要大量样本外,已有研究证明[14-19],基于传统方法的技术同样需要大量样本作为支撑。在这种形势下,通过图像处理与机器学习技术自动增加样本集已成为必要手段。
无论基于传统方法的识别问题,还是基于深度学习的识别问题,大量有标签的数据作为训练集在算法中起着举足轻重的作用。如果样本不足,算法往往过拟合,无法提高算法的性能。为了获得更多样本,一些研究工作从网络上获取数据,例如在IMDb上,已经把9万有标签的数据集扩大到了26万 [10]。除此之外,Facebook获取了440万个有标签的人脸进行DeepFace网络训练[11],而Google使用2亿个数据训练FaceNet网络[12]。
目前获取方法具有如下局限:
(1)现有方法耗时耗力,需要经费支持。获取百万级的数据并非易事。大数据获取需要人工从网上下载、处理,然后给数据添加标签,耗费大量的人力物力。这种情况下,只有像Facebook和Google这样的大公司会收集大量有标签的数据进行网络训练。而大多数情况下的数据收集涉及个人隐私与财力物力等问题,对于一般的小公司或科研院所而言,收集数据普遍难度较大。
(2)收集特殊图片困难。对于一些特殊的图像,如医学图像,遥感图像,现实中数量本身就少,加之无法直接从网上获取,因此小样本很容易导致过拟合。
2 样本集扩大算法研究现状
2.1 基于传统方法的多样本算法研究现状
对于传统的样本生成算法,如果数据集中有足够的训练样本,均可得到比较满意的识别结果,但在现实的人脸数据库中,人脸的数据样本却是有限的。文献[20]表明,增加图像样本的数量可以较大幅度提高识别的准确率。
为了增加样本数量,提高识别准确率,科研工作者已做了大量工作。其中,借助原始样本产生虚拟样本是一种有效的增加数据集方法。这种方法大致分为如下几类:
(1)通过人脸图像的对称性来得到原始样本的虚拟样本,如Xu[14,15]和Liu等[21]提出借助原始图像的“对称脸”和“镜像脸”产生虚拟样本,从而扩大数据集并提高人脸识别的正确率,Song[22]也提出相应的算法来改进人脸识别的性能;
(2)通过改变图像的光照、姿势和表情等来产生虚拟样本,例如Boom等用一种称为VIG的方法对未知光照情况进行建模[16],Abdolali[17]和Ho[18]等提出了类似的算法扩大数据集;
(3)基于人脸图像自身的特征生成虚拟样本,Ryu等根据原始样本的分布来产生虚拟样本[19],Liu等也根据图像本身特性来产生虚拟样本[23]。
(4)基于数学的多样本产生方法,如Zhang等提出利用奇异值分解的方法获得基于原始样本的虚拟样本[24]。借助图像合成方法生成的新样本如图1所示。
图1 借助图像合成方法生成新样本
除了借助图像处理方法获得原始样本的新样本外,还可以利用图像合成算法获取多样本,本研究做了相关实验,其结果如图1所示。假设数据集中有c类人脸图像,每类有ni个样本,令表示第i类中的第j个样本,这里i=1,2,…,c,j=1,2,…,ni,h和w分别代表样本xij的高和宽(均为像素值)。用X=[X1,X2,…,Xc]代表所有样本,则Xi=[xi1,xi2,…,xini],i=1,2,…,c代表第i类样本。则有:
其中, P(Xi)代表所生成的第i类新样本, f(g)表示图像处理函数,代表多个样本的串联,即将多个样本联合起来得到一个类别的新样本。
2.2 基于深度学习的多样本生成算法研究现状
大量有标签的训练数据是机器学习成功的关键,尤其对于强大的深度学习技术,大数据集能提高CNN的性能,防止过拟合[25]。为了扩充数据集,已有一些工作在不改变图像语义的情况下进行,如水平镜像[26]、不同尺度的剪裁[27,28]、旋转[29]和光照变化[27]等传统方法。
DeepID[30]采取了增大数据集手法来训练网络,只有大的数据集才能使得卷积神经网络训练得更加充分,该研究采用两种方法增大数据集:
(1)选择采集好的数据,即映入CelebFaces数据集。
(2)将原始数据集中的图片多尺度、多通道、多区域的切分,然后分别进行训练,再把得到的向量串联起来,即得到最后的向量。
以上方法仅局限于相对简单的图像处理技术,该类方法生成的多样本具有一定的局限性。比如,真正意义上的旋转应按一定的角度进行3D旋转,而不仅仅是图像本身的角度旋转。合成数据能一定程度上解决以上问题,如Shotton等通过随机森林合成3D深度数据来估计人体姿势,Jaderberg等使用合成数据来训练CNN模型识别自然场景下的文字[31]。这些研究的结果均优于使用剪裁,旋转等传统方法。但使用3D合成图像比较复杂,需要较多的前期工作。
近年来,借助生成对抗网络(Generative Adversarial Networks,GANs)来生成原始样本的方法吸引了很多学者。2014年6月,Goodfellow 等发表了论文《Generative Adversarial Nets》[32],文中详尽介绍了GANs的原理、优点及其在图像生成方面的应用,标志着GANs的诞生。早期的GANs模型存在许多问题,如GANs网络不稳定,甚至有时该网络永远不会开始学习,生成的结果无法令人满意。文献[32]中生成器生成的图片十分模糊,针对此问题,Denton等提出一个被称为 LAPGANs的模型[33],该模型用多个卷积神经网络连续生成图像,这些新图像的清晰度不断提高,最终得到高分辨率图像。GANs除了基于图像生成图像外,还可以通过文字生成图像,如文献[34]搭起了文本到图像的桥梁,通过GANs将文本直接转换成对的图像。文献[35]将GAN应用于超分辨率中,该文献提出了全新的损失函数,使得 GANs 能对大幅降采样后的图像恢复其生动纹理和小颗粒细节。另外,Radford 等提出了名为DCGANs的网络[36],该文献指出,用大数据集训练出的 GANs 能学习一整套层级的特征,并具有比其他无监督学习模型更好的效果。以上方法均为基于一大类原始样本生成另一大类图像。
基于GAN生成样本的过程如图2所示。首先将同类别的原始图像输入到生成对抗网络GAN的生成器网络G中,生成“假冒”图像G1和G2,接着借助判别器D来判断输入的图像是真实图像还是“假冒”图像。生成器G努力生成类似原始样本的图像,力争判别器D难以区分真假;而判别器D应不断提高自身性能,有能力鉴别出由生成器G生成的图像为赝品。生成器G和判别器D的价值函数如下:
生成器G最小化log(1-D(G(z))),判别器D最大化logD(x),使得最大概率按照训练样本的标签分类, 生成模型G隐式定义了一个概率分布Pg,希望Pg 收敛到数据真实分布Pdata。
图2 GAN生成新样本示意图
3 结 语
综上所述,基于原始样本的多样本生成算法是一个值得深入研究探索的问题,具备清晰而明确的理论意义和现实应用意义。虽然研究人员已经对相关问题进行了一些研究,取得了一系列成果,但是多样本的产生方法缺乏全面、深入的理解,尚未出现具有里程碑意义的研究成果。具体而言,本文认为,基于原始样本的多样本生成问题需要在如下几个方面展开深入的研究:
(1)在研究多样本生成算法时,保留原始样本的本质特征,如在人脸识别中,抛弃不必要信息(光照、表情和姿势)的影响是一项十分有意义的工作。
(2)在合成新样本时,设计合理有效的构造元素,使合成的新表示更接近自然亦是一个值得研究的方向。
(3)基于生成对抗网络,研究某一类对象的生成新样本的核心算法是一项有意义的工作。
参考文献
[1] K Simonyan, A Zisserman.Very deep convolutional networks for large-scale image recognition [Z]. Computer Science, 2014.
[2] C Szegedy,W Lin,Y Jia, et al. Going deeper with convolutions[C]. in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2015.
[3] K He,X Zhang,S Ren,et al. Deep residual learning for image recognition[C]. in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2016.
[4] Turk, Matthew, Pentland, et al.Eigenfaces for Recognition[J]. Journal of Cognitive Neuroscience, 2014,3(1): 71-86.
[5] A Pentland.Looking at People: Sensing for Ubiquitous and Wearable Computing[J].IEEE Transactions on Pattern Analysis & Machine Intelligence, 2000,22(1): 107-119.
[6] C Liu, H Wechsler.Robust coding schemes for indexing and retrieval from large face databases[J]. IEEE Transactions on Image Processing A Publication of the IEEE Signal Processing Society, 2000,9(1): 132-137.
[7] T Ojala,M Pietik?inen.Multiresolution gray-scale and rotation invariant texture classification with local binary patterns[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2002,24(7): 404-420.
[8] T Ahonen, A Hadid, M Pietikainen.Face Description with Local Binary Patterns: Application to Face Recognition[J]. European Conference on Computer Vision, 2004,28(12): 469-481.
[9] GB Huang, M Mattar, T Berg,et al. Labeled faces in the wild: A database for studying face recognition in unconstrained environments[Z].Month,2008.
[10] OM Parkhi, A Vedaldi, A Zisserman.Deep Face Recognition[C]. British Machine Vision Conference, 2015.
[11] Y Taigman,M Yang, Marc, et al. DeepFace: Closing the Gap to Human-Level Performance in Face Verification[C]. in Conference on Computer Vision and Pattern Recognition,2014.
[12] F Schroff,D Kalenichenko,J Philbin.FaceNet: A unified embedding for face recognition and clustering[C]. in IEEE Conference on Computer Vision & Pattern Recognition,2015.
[13] D Yi,Z Lei, S Liao, et al.Learning face representation from scratch[Z]. Computer Science, 2014.
[14] Y Xu, X Zhu, Z Li, et al.Using the original and ‘symmetrical face’ training samples to perform representation based two-step face recognition[J]. Pattern Recognition, 2013,46(4): 1151-1158.
[15] Y Xu.Integrate the original face image and its mirror image for face recognition[J]. Neurocomputing, 2014,31(7): 191-199.
[16] BJ Boom, LJ Spreeuwers, RNJ Veldhuis.Virtual illumination grid for correction of uncontrolled illumination in facial images[J]. Pattern Recognition, 2011,44(9): 1980-1989.
[17] F Abdolali,S Seyyedsalehi. Improving pose manifold and virtual images using bidirectional neural networks in face recognition using single image per person[Z]. in International Symposium on Artificial Intelligence and Signal Processing,2011.
[18] HT Ho,R Chellappa. Pose-invariant face recognition using Markov random fields[J].IEEE Transactions on Image Processing A Publication of the IEEE Signal Processing Society, 2013,22(4): 1573.
[19] Y.-S., Ryu.,S.-Y., O..Simple hybrid classifier for face recognition with adaptively generated virtual data[J]. Pattern Recognition Letters, 2012,23(7): 833-841.
[20] A Wagner,J Wright, A Ganesh,et al.Toward a Practical Face Recognition System: Robust Alignment and Illumination by Sparse Representation[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2012,34(2): 372-386.
[21] Z Liu,X Song,Z Tang.Integrating virtual samples and fuzzy discriminant analysis for sparse representation-based face classification[J]. Journal of Electronic Imaging, 2015,24(2): 23013.
[22] YJ Song,YG Kim,UD Chang,et al. Face recognition robust to left/right shadows; facial symmetry[J]. Pattern Recognition, 2006,39(8): 1542-1545.
[23] Z Liu, X Song, Z Tang.Fusing hierarchical multi-scale local binary patterns and virtual mirror samples to perform face recognition[J]. Neural Computing & Applications, 2015,26(8): 2013-2026.
[24] G Zhang,W Zou,X Zhang,et al. Singular value decomposition based sample diversity and adaptive weighted fusion for face recognition[J]. Digital Signal Processing, 2017,62: 150-156.
[25] K Chatfield,K Simonyan,A V edaldi,et al. Return of the devil in the details: Delving deep into convolutional nets[Z]. Computer science, 2014.
[26] H Yang, I Patras.Mirror, mirror on the wall, tell me, is the error small? [J]. Der Chirurg; Zeitschrift für alle Gebiete der,2015,69(12):235-240.
[27] A Krizhevsky, I Sutskever, GE Hinton. ImageNet Classification with Deep Convolutional Neural Networks [J]. Advances in Neural Information Processing Systems, 2012,25(2): 1097-1105.
[28] G Levi,T Hassner. Age and gender classification using convolutional neural networks[C].in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops,2015.
[29] S Xie, Z Tu. Holistically-nested edge detection[C]. in Proceedings of the IEEE International Conference on Computer Vision,2015.
[30] Y Sun, X Wang, X Tang.Deep Learning Face Representation from Predicting 10,000 Classes[C]. in Computer Vision and Pattern Recognition,2014.
[31] M Jaderberg, K Simonyan,A Vedaldi,et al.Synthetic data and artificial neural networks for natural scene text recognition[Z]. Eprint Arxiv, 2014.
[32] I Goodfellow,J Pougetabadie, M Mirza, et al. Generative adversarial nets[Z]. in Advances in neural information processing systems, 2014.
[33] E Denton,S Chintala,A Szlam. Deep Generative Image Models using a Laplacian Pyramid of Adversarial Networks[Z]. Computer science,2015.
[34] S Reed,Z Akata, X Yan,et al. Generative adversarial text to image synthesis[C]. in Proceedings of The 33rd International Conference on Machine Learning,2016.
【关键词】神经网络;故障测距;小波包;相对误差
0 引言
我国矿井配电网多为6kV单侧电源供电系统,采取中性点非有效接地方式,属于小电流接地系统(NUGS)。馈电回路选用多段短电缆径向延伸为各种井下高低压电机、电气设备、照明及各种通信、自动化装置和仪表、仪器提供电能。由于井下工作环境恶劣,供电电缆经常发生接地、断线、短路等故障,据电力部门统计,其中单相接地故障的发生率最高。尽管发生单相接地故障时,线电压仍然对称,暂时不影响对负荷的连续供电,但就矿井这类危险易爆场所而言,当发生单相接地故障时,应尽快跳闸断电以确保安全。为此,必须及时对故障点进行定位、排除故障、加快恢复线路供电。
NUGS馈线的故障定位问题一直以来未得到满意的解决,这与其自身的特点有关。由于电网变压器中性点不直接接地,造成单相接地电流无法形成小阻抗回路,故障电流主要由线路对地电容电流提供,其数值较小,且基波分量幅值故障前后变化不大,使得定位保护装置很难准确进行故障选线和定位。考虑到井下环境条件和负荷的特殊性,矿井配电网与传统意义上的NUGS存在一定的差异:单相接地产生的暂态分量较稳态分量大得多,暂态波形畸变严重,应研究利用暂态电气量进行故障测距的可行性;馈电线路分支少、长度短,对测距精度要求高[1]。
鉴于上述原因,本文就井下配电网故障测距问题进行研究,以期提高故障测距的精度和可靠性。
1 BP网络的结构和算法
BP网络结构上类似于多层感知器,是一种多层前馈神经网络,网络权值的训练算法为误差反向传播(BP)学习算法。如图1所示为一典型3层BP网络模型。
图1 3层BP网络模型
以图示BP网络模型为例说明网络的学习过程:
(1)初始化。为每个连接权值wij、wjt、阀值θj、θt赋予(-1,1)区间的随机值。
(2)给定输入输出目标样本。给定输入向量Xp=(x1,x2,...,xn)和期望目标向量Tp=(t1,t2,...,tm),p∈1,2,...,P。
(3)计算网络各层的输出。由输入样本、连接权值、阀值及各层神经元传递函数计算隐含层和输出层的输出。
(4)计算网络实际输出与期望输出的一般化误差。系统的目标函数为:
E=■■■(t■-y■)2=■E■(1)
网络通过调整权值和阀值使满足预先设定的一个极小值。
(5) 利用目标函数调整网络的权值和阀值。BP算法按照目标函数梯度的反方向对网络参数进行调整,使目标函数收敛,即实际输出接近目标输出。对于第p个输入样本的权值、阀值,按下式修正,式中?浊为学习速率。
?驻w=-?浊■, ?驻θ=-?浊■(2)
对应的权值、阀值按下式调整,式中为迭代步数。
w(k+1)=w(k)+?驻wθ(k+1)=θ(k)+?驻θ(3)
(6)随机选择下一组学习样本向量进行训练,直到P个样本对训练完毕。
(7)重新从P个学习样本中随机选取一组输入、目标样本对,返回步骤(3),直到目标函数E收敛于给定值,若训练次数大于设定的最大训练次数,则网络不收敛。
由于BP算法学习速率为固定值,收敛速度较慢,且可能会产生多个局部极小值,另外网络的隐含层层数和神经元数目的选择尚无理论指导,因此网络具有较大的冗余性。为了克服以上不足,提出了许多改进算法,从改进途径上分为两类:
一类为启发式学习算法,如动量BP算法、弹性算法、学习率可变的BP算法等;另一类为快速优化算法,如拟牛顿算法、LM算法等。
2 基于BP小波神经网络的故障测距
小波包具有正交特性、信号分解后的信息量是完整的,因此利用小波包算法分析信号频率的分布情况,能够有效提取信号的暂态特征。对于电缆线路而言,其暂态零序电流的自由振荡频率一般在1500~3000Hz之间[2-3]。本文利用小波包提取该频段的暂态零序电流信号模极大值作为神经网络模型的输入,以期实现高精度的故障测距。
2.1 小波基的选择
在利用小波包提取模极大值时,小波基的选择十分重要,选择不同的小波基对信号进行分解,可以突出不同特点的信号特征。Daubechies小波系是信号分析处理中常用的一类小波,具有紧支性、正交性,满足精确重构条件,但由于其不具有对称性,因而其边界效应会随尺度的增加而扩大,引起分解误差;Morlet小波常用于信号表示、图像特征的提取和识别;Mexican hat小波则用于系统辨识。
3次B样条小波是一种具有线性相位的紧支对称小波,分频能力强,频带相干小,由于具有对称性,只要采取合理的延拓方式,其边界效应引起的误差可忽略不计。
B样条基函数的递推公式如下:
N■(x)=1,x■≤x≤x■0,x?埸x■,x■N■(x)=■N■(x)+■N■(x)(4)
3次B样条基函数N■(x)在xi,xi+4上具有局部支集性,表达式如(5)所示。
(5)若取参数x■=i(i=0,1,...,n)为节点即为均匀B样条基,再对均匀B样条基作参数变换,在每个子区间内以参数代换,在每个子区间的值均为u0,1。3次B样条基函数的表达式如式6所示。
由于二进小波包变换具有平移不变性,不会引起正交小波包变换在所分析信号不连续处产生的伪吉布斯现象[4]。故本文利用3次B样条小波包对短路故障电流进行卷积型二进小波包分解,以期获得更显著的故障特征信息。
N■(x)=■,x■≤x≤x■■+■,x■≤x≤x■■+■,x■≤x≤x■■,x■≤x≤x■0,x?埸x,x■
(5)
N■(u)=■u3■(-3u3+3u2+3u+1)■(3u3-6u2+4)■(-u3+3u2-3u+1) 0≤u≤1(6)
2.2 分解尺度的选择
如何选择分解尺度对于零序电流暂态分量的模极大值提取至关重要,尺度取得越大,信号与噪声的表现差异越明显,越有利于两者的分离。但分解尺度取得越大,则对应的频带宽度越窄,采样点数过小,不利于下一步的信号分析[5-7]。
由于本文仿真的采样频率取1MHz,则Nyquist频率为5kHz,为提取暂态零序电流1500~3000Hz频率段分量,小波包分解层数为3,考虑小波包频带划分规则,取(3,3)、(3,7)频带的零序电流暂态分量即可满足要求。
2.3 BP网络结构参数的选择
欲利用BP小波神经网络计算井下配电网故障测距,必须首先确定BP网络的结构和参数,如各层的初始权值、阀值,学习速率,各层节点数、传递函数等,只有确定了网络的最佳配置,才能有效解决所提出的问题[8]。
(1)网络层数的确定。Hecht-Nielsen已经证明,在不限制隐层节点数的情况下,含有一个隐层的BP网络能够实现任意非线性映射。Cybenko指出,当隐层传递函数选用S型传递函数时,单隐层足以满足解决任意判决分类问题的需要,两个隐层则能够实现输入图形的映射。增加隐层数可以进一步提高精度,但同时会增加网络权值的训练时间。另外,增加隐层神经元个数也能降低误差,训练效果也更易观察,因此,应优先考虑增加隐含层神经元的个数。对于本文研究的故障测距问题,网络需要较快的收敛速度,因此采用单隐层网络。
(2)各层节点数目的确定。网络输入层节点数等于输入向量的维数。由于井下电网大多数实时运行参数如负荷、系统等效阻抗可由监控终端获得,其它随机性因素如发生故障线路、故障时刻可由故障后可测信息准确识别,不可知变化因素仅包括接地过渡电阻及故障点位置,并且神经网络的内插性能优于外推性能,故输入向量维数等于3,分别为(3,3)、(3,7)频带零序电流暂态分量的模极大值和故障点过渡电阻值。输出层节点数为1,表示故障点位置。隐含层节点数的选择比较复杂,需要依据经验和经过多次实验确定,选取过多将导致学习时间过长,过少将引起容错性差,对未经学习的样本识别能力低。根据Hebe准则可以确定最佳隐含层节点数的参考值。另外,也可先令隐含层节点数可变,开始时给以较小数值,学习到给定训练次数最大值,若未达到收敛精度则再增加节点数,直至达到合理数值为止。经过多次仿真训练,隐层节点数为11时,网络的训练误差最小。
(3)初始权值的选取。初始权值的选择对于网络能否收敛和训练的速度关系密切。若权值选择过大,会使加权输入处于激励函数的饱和区,导致无法进行权值的调整。威得罗等人提出一种权值初定策略,选择权值的量级为S1的r次方,其中S1为第一层神经元数目,利用此方法可以在较少的训练次数下获得满意的训练结果。本文选择的输入层及隐含层至输出层的初始权值均为0.25。
(4)训练算法的选择。给定一个具体问题,采用何种训练算法对于是否能够达到目标误差及网络收敛速度的影响很大。就中等规模的前馈神经网络而言,LM算法的训练函数trainlm可以获得比其它任何一种算法更小的均方误差,且收敛速度最快,在精度要求较高时,该算法的优点尤其突出。本文选择LM算法对BP网络进行训练。
(5)学习速率的选择。一般情况下倾向于选择较小的学习速率以保证训练过程的稳定性,但是过小的学习速率会导致训练时间过长,收敛速度很慢,无法保证网络的误差值跳出误差曲面的低谷而最终趋于最小误差,一般选择范围在0.01~0.9之间。
3 系统仿真及测距结果
深井供电系统仿真模型如图2所示。各模块参数如下:进线电缆(In line)采用YJV42,线路正序参数为:R1=0.078/km,L1=0.27mH/km,C1=0.695F/km,零序参数为:R0=0.106/km,L0=1.223mH/km,C0=0.358F/km;配电电缆(Line)采用YJV32;采区电缆(Mine line)、负荷电缆(Load line)采用UPQ,正序参数为:R1=0.024/km,L1=0.516mH/km,C1=0.308F/km,零序参数为:R0=0.196/km,L0=3.98mH/km,C0=0.203F/km;采区变压器(MineT1)型号为KBSG-200/6/0.69kV,Ud%=4%,I0%=2.5%;隔爆移动变电站(MineT2)选用KBSGZY-315/6/1.2kV,P0=1400W,Pd=2200W。负荷变压器采用SL7-100/6/0.4kV。线路长度分别为:进线电缆取1km;
配电电缆1、3、4取0.5km;配电电缆2取0.4km;采区电缆长度均取0.3km;负荷电缆取0.2km。电源线电压有效值6.3kV,X/R ratio=7。
考虑配电线路1在不同故障点位置和过渡电阻下发生单相接地故障(数据窗取故障前1ms至故障后4ms共5ms)得到的暂态零序电流经小波包分析后(3,3)、(3,7)频带的模极大值(为防止边界效应引起的信号值突变,取前2000个采样值进行模极大值分析)经归一化处理后所形成的训练和测试样本集,对BP网络进行训练,并测试网络的测距性能。
选取的训练样本集如下:
(1)过渡电阻值分别为0.01、5、50、100、150、200、250、300、350、400、450、500;
(2)在靠近线路两端发生故障时,应适当减小故障距离以提高测距精度。故障点位置分别为:0.01km、0.02km、0.025km、0.075km、0.125km、0.175km、0.225km、0.25km、0.3km、0.325km、0.375km、0.425km、0.475km、0.48km、0.49km。
组合两因素可形成12×15=180个训练样本集。
训练误差曲线如图3所示,经2794次迭代后误差收敛于0.00099829,基本达到了设定的目标误差0.001。
为检验训练后BP网络的推广能力即测距效果,采用非训练样本集进行测试,选取的测试样本集如下图3:
图3 BP网络训练误差性能曲线
(1)过渡电阻值分别为25、75、125、175、225、275、325、375、425、475;
(2)故障点位置分别为0.015km、0.05km、0.1km、0.15km、0.2km、0.275km、0.35km、0.4km、0.45km、0.485km。
组合两因素形成10×10=100个测试样本集。
对于给定的测试样本集,经BP网络前馈运算得到的实际测距结果及相对误差分别如表1、表2所示。
其中,L表示实际故障距离,l表示测量距离。
相对误差e=(实际故障距离-测量距离)线路总长×100%。
由表2可知,对于测试样本集,训练后的BP网络测距相对误差随过渡电阻值的增加有增大的趋势,最大误差达到了-16.56%,且出现在过渡电阻为475时,同时注意到在故障点接近线路两端时,由于适当增加了训练样本,测距相对误差明显减小,因此,通过增加训练样本数量有望进一步提高测距精度。
4 结论
通过研究得出以下结论:
1)采用小波包提取故障暂态零序电流的模极大值能有效表征故障时所蕴含的物理现象,为准确进行故障测距提供了有效的数据。
2)BP神经网络具有良好的分类及拟合功能,能在获得大量样本数据的基础上,训练出符合要求的前馈型网络,为煤矿井下电网故障测距提供强有力的手段。从测距相对误差结果来看,基于小波分析与BP神经网络的故障测距方法能基本满足测距要求。另外,本文下一步的工作将在样本集数量、网络结构等方面进行更为深入的研究。
【参考文献】
[1]丁恩杰,王超楠,崔连成.矿井配电网输电线路故障测距方法的研究[J].中国矿业大学学报,2006,35(3):311-316.
[2]窦新宇,李春明.小电流接地系统行波测距方法研究[J].电力科学与工程,2010,26(2):51-53.
[3]季涛.基于暂态行波的配电线路故障测距研究[D].济南:山东大学,2006.
[4]姚李孝,赵化时,柯丽芳,等.基于小波相关性的配电网单相接地故障测距[J].电力自动化设备,2010,30(1):71-74.
人工神经网络作为一种智能化的方法近年来在图像数据压缩领域得到了一定的研究与应用[6]。基于人工神经网络的数据压缩主要有2个步骤:①学习训练,将数据送入输入层作为训练样本,不断调整各层间的连接权值,从而使得网络的输出均方差达到最小;②压缩编码,将数据输入到训练好的网络,压缩后的数据通过隐含层输出。DEM数据具有相关性和连续性的特点,即DEM数据反映的是地形连续变化的特征,高程剧烈变化的部分是少有的并且DEM网格中某一点的高程值可以通过邻域值用非线性函数表示,这实质上非线性函数逼近或地形曲面拟合的过程。基于以上特点,学者们将人工神经网络引入到DEM数据压缩领域,冯琦等[7]采用BP神经网络实现DEM数据压缩,该研究特色在于:①采用L-M训练算法提高单隐层网络(SHLN)运算速率[8-9];②基于DEM数据相关性特点设置相对误差精度指标实现对最优BP训练网络的选取,在减少结点数的同时获得较高的压缩比;③该方法解压过程对于计算机硬件依赖性不高,能够进行数据的离线压缩处理。根据DEM数据的连续性特征,赵鸿森等[10]提出了一种基于RBF神经网络的压缩方法,该方法将山脊线、山谷线等地形特征作为样本点训练集,能够根据地形特征自适应确定网络结构,神经网络权值是通过网格点高程值获得,可获得较高的压缩比。
基于小波变换的DEM数据压缩
1.基于DWT的DEM数据压缩
DWT(DiscreteWaveletTransform)适合于处理各种冗余度低、相关性低的非平稳信号的压缩处理,对于不稳定、相关性差的DEM数据压缩具有较好的效果。DWT对于信号的压缩是基于其他具有多分辨率分析(MRA)这一特性,即根据Mallat算法[11]原始信号能够被逐级分解为高频和低频信号,由于高频分解信号含有绝大都数信息并且幅值小,通过设定一定的比例将最小幅值的分解系数置为0,再通过小波系数重构达到信号压缩的目的。经过理论分析,原始信号经过DWT,重构信号与原始信号具有高度的一致性。事实上重构信号与原始信号的差别往往不可忽略,特别是对于DME数据的压缩,压缩后数据相对于原始数据而言存在着严重的边界畸变、失真等问题,必须加以解决。针对这一问题,CHANG[12]等将二维离散小波变换的边界问题转变为一维离散小波变换来进行处理,研究结果表明该方法大大减小了边界失真区域,在提高压缩比的同时DEM重建数据精度也得以提高。
2.基于IWT的DEM数据压缩
DWT是通过将信号分解系数直接置0的方式来进行压缩处理,重构信号与原始信号不可避免地出现误差,而基于IWT(IntegerWaveletTransform)信号压缩,由于小波分解系数通过有限精度数(FinitePrecisionNumber)来进行精确描述,因而适合于对信号进行无损压缩处理[13]。基于IWT的数据压缩具有以下特点:①压缩处理很大程度上依赖于多相矩阵因式分解的选择,而因式分解能否对压缩后图像给定一个适当的误差尺度,取决于图形迭代函数;②IWT采用提升方案,并且均为整数运算,数据处理的速率得以提高;③IWT完全可逆,既可以实现有损编码也可以实现无损编码。陈仁喜等[14]将整形小波变换用于DEM数据压缩处理,该方法首先将经过预处理的DEM数据进行整形小波变换,然后对变换系数进行阈值化处理,最后进行量化编码。该方法最大特点是实现了数据压缩比和质量以及数据质量和传输速度的很好折中,具体为:①量化方法基于SPIHT算法平面传送思想,重要信息主要集中于高位,将小波变换后的系数直接去掉后面的n个平面位,该方法在保证数据压缩质量的同时提高了压缩比;②采用基于位平面扫描的算法对量化后的数据进行压缩编码,这使得压缩后的数据具有质量渐进传输特性;③小波变换后各子带分别进行编码,在解码过程中可以不对高频子带解码,得到的恢复数据分辨率较低,这有利于对大型DEM数据进行快速检索和浏览。
3.基于SPIHT小波编码算法
EMZ(EmbeddedZerotreeWavelet)算法由Shaprio[15]于1993年提出,该算法包括嵌入式和零树,在零树结构与逐次逼近量化方法(SAQ)相结合的基础上实现嵌入式编码。该算法能充分利用小波系数特点使得输出的码流具有嵌入的优点,因而在图像处理[16-17]、生物医学[18]等领域得到广泛的应用研究。但该算法也存在着如在相互独立的零树进行编码时浪费大量字节等缺陷,研究者们也做了一些改进[19]。在EMZ算法基础上发展而来的SPIHT(SetPartitioninginHierarchicalTrees)[20]算法具有能够在保证数据压缩质量的前提下提高压缩比,能够进行优化嵌入式编码,均方根误差和计算复杂度低等优点,并且数据压缩后具有很好的渐进传输特性,目前该算法在图像压缩领域得到广泛应用。地形特征是影响DEM压缩质量的一个重要因素,平坦地区数据冗余量大而山地地势高低起伏,数据冗余则较小,但就现有的研究方法而言将这两种地形采用同样地压缩比,压缩结果不尽如人意,李毅等[21]提出了一种基于SPIHT小波的DEM自适应压缩方法,该方法特点在于:①考虑地形特征,根据地形的复杂度进行分析以确定数据压缩比,从而确保数据可视化质量;②自适应性编码,通过才用表征不同尺度的小波高频系数和地形尺度特征向量对地形复杂度进行评估,根据评估结果自适应调节编码算法。但该研究中数据压缩比是根据地形视觉效果选择,存在一定的经验性,在实际应用中很难得到较为理想的压缩比。
4.基于M进制小波的DEM数据压缩
多分辨率分析是传统二进制小波变换的基本特性,即能够获得信号在时间域和频率域局部化特征,这有利于对图像局部信息进行有效地识别和分析。当图像经过多层小波分解时,随着分解层数的增加,图像信息会出现不同程度的丢失,这成为二进制小波变换的主要缺陷。在二进制小波变换基础上发展的M进制小波变换具有如下特点:①能够对图像信号进行更加细致地分解,分解次数不受限制;②图像信息更加集中,并能够精确描述图像的频率分布;③图像重构具备较高的精度;④具有对图像信号相对狭窄的高频部分进行放大处理和对图像信号压缩的特性,这克服了正交小波分解所存在的缺陷.DME由于具有海量化数据,以及复杂的地形信息等特点一直是DEM数据压缩的难点,近年来研究者们将M进制小波变换引入DME数据压缩领域,王宇宙等[22]提出了一种基于多进制小波变换的DEM数据压缩方法,顾及DEM地形因素,将高频和低频信息分别进行编码处理是其主要特色,具体化为:①低频系数采用差分映射编码,这充分顾及地面变化的连续性以及大量数据冗余的情形,能够对低频信息进行无损的压缩编码;②并未直接舍弃系数值较小的高频小波系数,而是通过自适应对数量化表,对各个高频小波系数子块分别加以量化处理,能够获得较好的压缩效果。但该方法不足之处在于:对数量化位数是根据压缩率来进行确定,而事实上压缩率不能预先得知,从而量化位数也就无法精确得获得,基于具体地形信息的DEM数据精确压缩也就难以实现。多进制小波函数和尺度函数的构造是基于多进制小波DEM数据压缩的难点之一,对此吕希奎等[23]构造了一种具有插值性质的多进制小波函数和尺度函数,将DEM数据转变为二维图像压缩问题,能够在保持地形特征基本不变的前提下提高压缩比。但基于多进制DEM数据压缩本质上是有损压缩,细节信息的损失不可避免。#p#分页标题#e#
基于组合算法的DEM数据压缩
1.SPHIT算法与小波变换相结合的DEM数据压缩
整形小波变换(IWT)采用了提升方案(LS),避免了传统小波的卷积运算,并且计算过程完全在空间域进行,计算复杂度明显降低,便于硬件实现。因此,IWT能够对于冗余度较大的DEM数据进行有效地去相关性处理,实现对DEM数据的无损或近似无损的压缩。将IWT与新型编码方法的代表——SPIHT算法有机结合,为DEM数据压缩提供了一种有效方法。田继辉等[24]提出一种能够用于应急三维GIS的DEM数据压缩方法,该方法特点在于:①根据压缩精度要求,实现DEM数据单位转换;②对于每块DEM数据均减去其最小值,在降低了小波变换级数的同时使得SPIHT编码级数也得到降低;③通过设定一个小波系数阈值,将高于和低于该阈值的小波系数,分别进行SevenZip和SPIHT算法进行处理;④选用Int5/3实现对DEM数据压缩处理。该方法充分发挥IWT和SPIHT算法的优势,能够顾及到地形平坦和起伏较大情形下的压缩编码,研究表明该方法取得了较好的压缩效果,但对于DEM数据的边界问题并未提及,仍需要进一步加以研究。
2.基于小波变换与熵编码相结合的DEM压缩算法
该算法实现主要有3个步骤:①小波变换,即选择恰当的小波基函数对DEM数据进行小波变换;②量化,经过小波变换后数据相比原始数据而言更加集中,但其数量大小并未改变,必须采用一定的量化方法进行数据量化;量化通常有矢量和标量量化两种方法;③编码,通过将小波变换后的量化数据进行编码,将其转化为字符流。就整个小波压缩流程而言,数据经过压缩后边界失真现象的克服,数据压缩比的提高,以及在于量化和编码方法的选择是该压缩算法的难点所在。DEM数据具有不稳定、相关性差、信息熵高,并且DEM在平原地区具有较大的冗余,而在山区则冗余度较低等特点,这使得数据压缩比难以得到提高,常占强等[25]利用具有线性相位的双正交小波变换与混合熵编码相结合的方法对山区DEM数据进行压缩处理,具体来说:首先对DEM数据进行小波变换,通过选取最大分解系数的1/6作为自适应阈值并与硬阈值函数相结合,对小波分解后的高频系数进行处理,能够使得大约95﹪小波系数为0;然后将高频和低频分解系数分别采用游程编码和Huffman编码;最后再次通过游程解码和Huffman解码进行数据解压。该研究充分发挥了小波变换与编码方法各自的优势,在提高数据重建精度的同时获得了较高的压缩比,但小波阈值的选取局限于单一的情形,对多种情形的小波阈值的自适应确定规则的研究仍有待于进一步深入。
3.纹理优化技术与其他方法相结合的DEM数据压缩
纹理数据作为一种重要的场景数据,在对三维DEM数据进行渲染时一般存在两个问题:①由于采用分辨率高而且颜色丰富的纹理,从而存消耗急剧增加;②无法有处理决纹理分辨率与视距之间的关系,即相机与图的距离较近时,图形分辨率较大,相机与图形距离较大时,图形分辨率较小。Mipmap(Multi-imagepyramidmap)技术能够很好解决以上问题,该技术由Willams提出,并很快得到了广泛的研究和应用。从广义角度上分析,DME数据压缩、传输与显示是一个有机整体,同属于DEM数据压缩范畴,即广义DEM数据压缩。杨晓东等[26]结合Mipmap纹理优化技术与顶点法向量编码方法对DEM数据进行压缩处理,该研究主要实现如下功能:①数据的渐进传输和显示:通过对DEM数据进行小波变换,分别采用标量量化器和EZW对小波系数进行量化和编码;②DEM数据优化显示,采用顶点法向量的计算和编码方法并结合Mipmap纹理优化技术,能够对模型数据进行光照效果的计算。该研究突破了将DEM数据的压缩、传输以及优化显示有机结合,突破了现有的DEM数据压缩的固有模式,为该领域提供了一个较好的研究思路。
4.基于判别规则(指标)的DEM数据压缩
TIN由于采用不规则的空间分布高程采样点描述地形,在数据结构、三角网生成算法等方面相对于排列规则且结构简单的Grid数据而言,数据压缩方面难度较大。通过预先定义某一判别规则(指标)来对数据量进行适当的取舍,从而实现对DEM数据的压缩,是实现DEM数据压缩处理的一种有效方法。蔡先华等[27]提出DEM数据压缩地形描述误差(Ep)这一判别指标来实现对DEM数据压缩,该方法首先在充分考虑DEM高程采用点、地形描述以及数据压缩等误差相互影响的基础上,确定数据压缩误差限值EP0;然后对不是TIN边界的高程点产生的地形误差Ep与所给限值进行比较,剔除小于该值的高程点,从而实现DEM数据的压缩。三角网在地形起伏较大的情况下,相邻法线向量之间夹角较大,而当地形平坦时,相邻法线向量近乎平行。刘春[28]等提出一种基于TIN的DEM数据压缩方法,该方法将相邻三角形法线间的夹角作为判别依据,判别阈值步骤如下:①确定大概阈值T,采用该阈值进行TIN压缩;②计算DEM采样点高程差的方差S;③将S与压缩误差允许值进行比较,如果大于该值则适当减少阈值T,并重新计算;反之则增大阈值T并重新计算直到满足要求为止。该方法间接地顾及地形特征,并且阈值的选择是根据所给点的压缩误差指标进行迭代选择的,研究表明该方法对TIN数据压缩较为有效,但对于特殊地面模型的压缩处理仍有待于进一步研究。
结束语