基于声音识别的多阀门泄漏检测系统
阀门在石油工业中使用频繁且出现泄漏现象不易检测。论文阐述了通过软件方式根据声音信号识别阀门泄漏的方法。系统利用声音传感器采集有效时间段的声音信号,提取其MFCC 特征参数作为观测序列,并利用隐马尔可夫模型对其进行建模训练,使其能够识别故障信号,及时发现阀门泄漏,并进行报警处理,从而保证输油泵正常工作。实验证明,系统能够有效地识别阀门泄漏故障。
0、引言
在石油工业中,阀门是一种使用数量多、操作使用频繁的设备。据统计,购买阀门的费用相当于一个新建工厂投资的8 %。在阀门的使用过程中,因阀门的磨损等原因会出现内外渗漏或泄漏等情况,从而引起跑油、混油等严重事故,影响石油质量,造成极大的经济损失和资源浪费。因此,阀门泄漏的检测有着重大的现实意义。当阀门关闭时,若有泄漏,其主要特征是在泄漏处形成多相湍射流,该射流不但使流体发生紊乱,而且与泄漏孔壁相互作用,在孔壁上产生高频应力波,并在阀体中传播,称之为被动声发射。用声发射传感器接触阀体外壁,接收泄漏产生的在阀体中传播的弹性波,转换成电信号,经信号放大处理后显示和监听,从而达到检测阀门泄漏的目的。声学检测具有动态、快速和经济的特点,既可以保证阀门的安全使用,又可以为维修、决策提供依据,降低更换费用。当前的理论和实践表明,利用声学检测阀门泄漏是一种行之有效的无损检测的方法。
1、系统介绍
基于声音识别的多阀门泄漏检测系统是德国新型输油泵-软管隔膜活塞泵国产化的一个子系统。软管隔膜活塞泵系统共有七路输油通道,一路原油输送工作原理如图1 所示。图中No1所示位置是原油出口阀,No2 是原油出口阀声音检测传感器位置;对应右下部是原油入口阀及声音检测传感器位置;No3 是浆料与软管和阀门内侧相接触;No4 是直线形的流通通道;No5 是平隔膜的夹紧区域;No6 是组合式超压安全阀;No7是油泵在油内工作。
图1 输油泵工作示意图
图1 的右边电机带动曲柄使活塞左右移动,同时带动一个凸轮机构(图中未画出) 控制原油出进口阀门的开关。随着进口阀打开,出口阀的关闭,活塞从左向右移动,隔膜软管中的压力变低,原油进入软管;当活塞到达右端时,原油进口阀关闭;活塞向左端前进,到达一定路径时,凸轮机构启动原油出口阀打开,活塞继续向左前进,挤压软管隔膜将原油压出出口阀。在工作过程中,如果进出口阀出现泄漏,就会出现管道内压力不足,石油输出质量降低等一系列的问题,影响泵的工作效率,造成资料浪费和经济损失。因此,需要对泵的进出口阀进行实时监控。
2、系统设计
2.1、系统总体设计
系统主要由特征参数提取、HMM 模型训练、模式识别和结果处理等四部分构成,如图2 所示。
图2 基于声音识别的多阀门泄漏检测系统
2.2、特征参数提取
特征参数提取是指从阀门音频信号中提取出随时间变化的语音特征序列,提取有用的统计数据,是建立HMM 模型库的关键。
Mel 频率倒谱系数( Mel Frequency Cep strum Coefficient ,MFCC) 主要着眼于人耳的听觉特性,利用听觉前端滤波器组模型,能很好地体现音频信号的主要信息,在语音识别、音频分类和检索领域应用十分广泛。本系统选用MFCC特征参数。MFCC 是在Mel 标度频率域提取出来的倒谱参数。它与频率的关系可用式(1)近似表示Mel(f) = 2595*log(1+f/700) (1)式中: f 为频率, 单位Hz。
MFCC 参数的提取过程:
(1) 对音频信号进行分帧和加窗处理,对采集过程或分帧等因素所造成的数据损失予以补偿,本文中窗长30 ms ,帧长N 为256 ,帧移为128点,采样频率为11025 Hz ,采样精度为16 bit 。用Hamming 窗进行加窗处理,减少Jibbs 效应。
(2) 将预处理后的信号进行快速傅立叶变换(FFT) ,将时域信号转换为频域信号,再计算其模的平方得到能量谱P[i] ,1 ≤k ≤ N-1 。
(3) 设计一个具有M 个带通滤波器的滤波器组,采用三角滤波器,中心频率在0 ~ F/2按Mel频率分布;再根据Mel(f) 频率与实际线性频率f的关系计算出三角带通滤波器组Hm(k) 。
其中
则每个滤波器组输出的对数能量为
(4) 对S[m] 进行离散余弦变换(DCT) 即得到MFCC 系数。
(5) 取C[1], C[2] , ⋯, C[V]作为MFCC参数,其中V 是MFCC 参数的维数,本文中取V = 12。
2.3、隐马尔可夫模型
隐马尔可夫模型( Hidden Markov Model ,HMM) 是一种时间序列统计建模工具,它能够对非平稳信号变化的规律进行统计并建立参数化模型,另外利用该模型可以方便地进行概率推理,因此它常常作为动态模式分类的工具。隐马尔可夫模型的强大之处在于观察到的事件与内在的状态间建立了一种概率模型。
HMM 建模方法具有良好的抗噪性能,在交通检测系统、图像识别、语音识别以及基于震动信号的故障诊断等中都得到了较好的应用,也是目前为止最有效的语音信号识别方法。
HMM 可以分为两部分,一个是Markov 链,由π、A 来描述,产生的输出为状态序列;另一个随机过程,由B 来描述,产生的输出为观测值序列。一个DHMM 可以由下列参数进行定义: