基于SVM级联决策树的复合电能质量扰动识别*
Recognition of Complex PQ Disturbances Based on SVM Cascaded Decision Tree
通讯作者: 吕干云,男,1976年生,博士,教授。主要研究方向为电能质量分析和控制,人工智能技术在电力系统中的应用,分布式电源接入优化。E-mail:ganyun_lv@njit.edu.cn
收稿日期: 2022-03-4 修回日期: 2022-06-22
基金资助: |
|
Received: 2022-03-4 Revised: 2022-06-22
作者简介 About authors
陈诺,男,1997年生,硕士研究生。主要研究方向为电能质量扰动识别。E-mail:
针对双重及以上复合电能质量扰动特征重叠和识别困难的问题,提出了一种基于支持向量机(Support vector machine, SVM)级联决策树的电能质量复合扰动分类识别方法。首先,基于S变换提取的扰动初始特征,针对电压暂降、谐波、电压中断等7种单一扰动构建多个二分类SVM;然后通过SVM的二分类统计学习进行扰动蕴含特征的重构,以降低复合扰动的特征重叠;最后利用新构建的复合扰动特征,结合CART决策树的二分离散特征处理,实现SVM级联决策树的复合电能质量扰动多分类识别。仿真试验表明,所提方法可有效降低复合扰动下特征重叠程度,有较强的抗噪性,能准确识别包括双重及多重复合的21种电能质量扰动。
关键词:
Aiming at the problem of features overlapping and difficult recognition of complex power quality(PQ) disturbance, a PQ disturbance recognition method is proposed based on support vector machine(SVM) cascaded decision tree. Firstly, based on the initial characteristics of the disturbance extracted by the S-transform, 7 two-class SVMs are constructed for 7 single PQ disturbances such as voltage sag, harmonics, and voltage interruption. Then, in order to reduce the feature overlap of the complex disturbance, two-class statistical machine learning of the SVMs are used to reconstruct the features of disturbance. Finally, the constructed features are used to realize multi-class recognition of the complex PQ disturbance by the SVM cascade decision tree, combining with the two discrete feature processing of the CART decision tree. Simulation results show that the proposed method can effectively reduce the degree of feature overlap for composite PQ disturbances with strong noise immunity, and accurately identify 21 types of PQ disturbances including double and multiple complex disturbances.
Keywords:
本文引用格式
陈诺, 吕干云, 叶加星.
CHEN Nuo, LÜ Ganyun, YE Jiaxing.
1 引言
目前单一PQD识别的研究已较成熟,典型单一扰动包括电压暂降、谐波等,但实际系统中经常存在多种扰动并存的现象,即复合PQD(也称混合PQD)[5]。复合扰动识别存在较复杂的特征量相互重叠交叉,增加了其检测和识别难度。为解决特征重叠导致的计算复杂、分类准确率降低等问题[6],国内外学者对复合识别展开了较多研究。复合PQD识别通常需要先进行特征提取,其常见方法包括短时傅里叶变换[7]、小波变换[8]、S变换[9]等,在此基础上对各类扰动进行模式识别,方法主要包括SVM[10]、决策树[11]、深度学习[12]等。SVM由于其在解决高维和非线性问题上的优势,成为了复合PQD识别的重要方法。文献[13]选择具有二元树结构的SVMs进行复合PQD识别,基于统计方法进行特征优化,在节省计算量的同时可以准确识别6种单一扰动和2种双重扰动。韩刚等[14]采用优化参数的SVMs,对部分复合扰动进行了直接多分类,具有较快的运算速度和较好的识别精度。决策树易于理解且有短时间内有效处理大型数据集的优势,特别是随着复合扰动类型和样本数量的增加,其效果更显著。文献[15]根据特征基尼系数选择最优特征并构建最优决策树,有效识别了多种复合PQD。通过集成学习和混沌搜索构成集成决策树[16],改善了算法训练出现的样本多样化及收敛慢等问题,实现了双重及多重扰动的准确分类。深度学习因其较好的鲁棒性和自适应能力在复合PQD识别中应用较多。文献[17]通过信号重构后得到稀疏向量,再利用压缩感知理论和深度信念网络实现扰动准确识别。以上研究均对相应的扰动进行了有效识别,然而部分成果考虑的扰动种类偏少,且大多只考虑了单一和双重扰动,对多重复合扰动导致的特征重叠问题分析较少。随着大量新类别多重复合扰动的出现,其特征重叠程度增加导致部分算法效果降低[18]。为应对这一问题,需要构造快速、准确性高、适用性强且易于实现的分类器模型。
本文考虑了多种双重及以上复合PQD,针对这类扰动特征重叠严重导致的识别困难问题,首先采用S变换提取电能质量扰动初始特征,然后通过SVM的二分类统计学习进行扰动蕴含特征的重构,降低复合扰动的特征重叠程度,最后利用新构建的复合扰动特征,结合CART决策树的二分离散特征处理,实现SVM级联决策树的复合电能质量扰动多分类识别。
2 基于S变换的扰动分析与特征提取
2.1 S变换原理
S变换(S-transform, ST)是Stockwell等针对非平稳信号提出的一种时频分析方法,这种方法克服了STFT窗函数宽度难与信号局部平稳长度相适应的不足。S变换利用其高斯窗函数高度、宽度随频率改变而变化的特点[19],可获得信号某一时刻的频率信息和某一频率点的信号幅值信息,因此被广泛应用于信号时频分析领域。
设输入信号为h(t),经过S变换后为S(τ, f),原信号可以由S(τ, f)进行重构
式中,
2.2 扰动信号S变换分析
表1 电能质量扰动信号类型
类型号 | 信号类型 | 类型号 | 信号类型 |
---|---|---|---|
T1 | 电压暂降 | T12 | 电压暂升+振荡暂态 |
T2 | 电压暂升 | T13 | 闪变+振荡暂态 |
T3 | 谐波 | T14 | 谐波+振荡暂态 |
T4 | 电压中断 | T15 | 电压暂降+脉冲暂态 |
T5 | 闪变 | T16 | 电压暂升+脉冲暂态 |
T6 | 振荡暂态 | T17 | 谐波+脉冲暂态 |
T7 | 脉冲暂态 | T18 | 电压暂降+振荡暂态+谐波 |
T8 | 电压暂降+谐波 | T19 | 电压暂升+振荡暂态+谐波 |
T9 | 电压中断+谐波 | T20 | 闪变+脉冲暂态+谐波 |
T10 | 闪变+谐波 | T21 | 电压暂降+振荡暂态+ 脉冲暂态+谐波 |
T11 | 电压暂降+振荡暂态 |
图1
总结对比不同扰动的S变换结果可以发现,电压暂降信号基频对应幅值出现较长时间的下降;电压暂升信号基频对应幅值出现较长时间的上升;电压中断的基频幅值下降趋势比电压暂降更大,接近于0,将不同大小的基频幅值区间时长作为F1~F3特征量。谐波信号中,低次谐波部分偏斜度区别较大,中、高次谐波峰度差异明显,经计算谐波和其他扰动标准差有很大不同,将不同次谐波的偏斜度、峰度、标准值作为其余几个特征量F4~F8。实际电网系统中包含谐波的复合扰动较多,总谐振畸变率(THD)可与其他特征配合识别是否包含谐波扰动,将总谐振畸变率平均值作为特征量F9。
2.3 初始特征提取
本文采用S变换提取如下特征:F1:基频幅度曲线中幅值大于1.01的时长;F2:基频幅度曲线中幅值小于0.99的时长;F3:基频幅度曲线中幅值小于0.15的时长;F4:低次谐波的偏斜度之和;F5:中次谐波的峰度之和;F6:高谐波的峰度之和;F7:中次谐波的标准差之和;F8:高谐波的标准差之和;F9:总谐振畸变率平均值。
峰度能够表征分布曲线在平均值处峰值高低的特征数,用来描述谐波幅值的平坦度。偏斜度能够表征分布曲线总体取值分布对称性的特征数,描述谐波幅值的不对称度。总谐振畸变率能够表征谐波分量与基波分量关系,可与其他特征配合进行识别。
相关特征偏斜度
式中,
3 级联分类器设计
本文提出了二分类SVMs级联CART决策树的复合PQD识别方法,其算法原理如下所示。
定义样本
采样点到分类界面距离为
式中,
求得最优解
图2
图3
通过比较可以明显发现,经过特征重构后,T8、T9两种扰动的特征重叠程度明显降低,以SVM决策值0.5为间隔,两种扰动特征具有较大的差异。
本文依据级联分类器思想,将SVM的单一扰动二分类识别结果作为重构后的特征量,再通过决策树进行多分类,分类流程如图4所示。
图4
决策树作为解决多分类问题的有效方法,在类别较多时效果明显。构建决策树时引入信息增益,信息增益越大,该特征分类能力越强。通过划分分支,计算各特征信息增益并排序,选择信息增益最大的特征建立决策树模型并进行分类。特征C对于扰动集合S信息增益的计算公式为
式中,
21种扰动包含每种单一扰动信号的数量不同,包含谐波的有10种,包括暂降、暂升、中断、闪变、暂态振荡、脉冲暂态的分别为6、4、2、4、8、6 种,分别计算每个特征的信息增益S1~S7,最大值对应的特征作为最本次分类特征,并依次从大到小搭建决策树模型,自上而下的分类特征优先级为
图5
分类规则为:R1—S1=1;R2—S1=0;R3—S6=1;R4—S6=0;R5—S7=1;R6—S7=0;R7—S2=1;R8—S2=0;R9—S3=1;R10—S3=0;R11—S5=1;R12—S5=0;R13—S4=1;R14—S4=0。
4 仿真测试结果
本仿真共生成扰动信号21×200组,其中训练样本和测试样本数量分别为3 360组和840组。信号采样频率设为3.2 kHz,信噪比为40 dB。本文选择高斯径向基核作为多个SVMs的核函数,即
式中,
表3 不同噪声下的按类型扰动识别结果
扰动类型 | 分类准确率(%) | |||
---|---|---|---|---|
20 dB | 30 dB | 40 dB | ||
T1 | 电压暂降 | 98.2 | 100.0 | 100.0 |
T2 | 电压暂升 | 95.7 | 97.3 | 99.5 |
T3 | 谐波 | 96.3 | 99.3 | 100.0 |
T4 | 电压中断 | 96.6 | 99.2 | 100.0 |
T5 | 闪变 | 96.3 | 98.6 | 100.0 |
T6 | 暂态振荡 | 96.8 | 99.8 | 100.0 |
T7 | 脉冲暂态 | 96.0 | 97.5 | 98.7 |
T8 | 电压暂降+谐波 | 95.1 | 97.7 | 98.5 |
T9 | 电压中断+谐波 | 95.6 | 97.8 | 99.2 |
T10 | 闪变+谐波 | 95.8 | 99.4 | 100.0 |
T11 | 电压暂降+振荡暂态 | 96.4 | 97.6 | 98.3 |
T12 | 电压暂升+脉冲暂态 | 97.0 | 97.9 | 98.2 |
T13 | 闪变+振荡暂态 | 96.7 | 97.0 | 100.0 |
T14 | 谐波+振荡暂态 | 95.8 | 98.3 | 100.0 |
T15 | 电压暂降+脉冲暂态 | 96.8 | 98.6 | 99.6 |
T16 | 电压暂升+脉冲暂态 | 95.1 | 97.6 | 98.3 |
T17 | 谐波+脉冲暂态 | 96.1 | 97.7 | 98.7 |
T18 | 电压暂降+振荡暂态+谐波 | 97.0 | 97.4 | 97.9 |
T19 | 电压暂升+振荡暂态+谐波 | 95.5 | 97.2 | 97.5 |
T20 | 闪变+脉冲暂态+谐波 | 96.1 | 96.8 | 97.2 |
T21 | 电压暂降+振荡暂态 +脉冲暂态+谐波 | 94.2 | 96.3 | 96.7 |
平均准确率(%) | 96.2 | 98.1 | 99.0 |
由表3可见,本文所提方法具有较高的识别准确率和抗噪声性能。在40 dB噪声的影响下,单一扰动大多达到了99%以上的精度,除了四重的复合扰动均达到了97%以上的准确率,四重扰动的识别率为96.7%,平均识别准确率达到了99%。在20 dB噪声下,除了四重扰动均达到了95%以上的识别精度,总体上达到了较高的准确率,具有较好的抗噪性。
为了进一步验证该方法的优势,本文与其他非级联单一分类方法进行对比试验,结果如表4所示。
表4 不同分类方法准确率对比
分类方法 | 不同噪声强度下的分类准确率(%) | ||
---|---|---|---|
20 dB | 30 dB | 40 dB | |
SVM | 94.6 | 95.2 | 95.7 |
决策树 | 94.2 | 94.5 | 94.8 |
量化神经网络[12] | 95.9 | 96.9 | 98.0 |
SVM级联决策树 | 96.2 | 98.1 | 99.0 |
结果显示,SVM级联决策树在不同噪声强度下的分类准确率均远远高于两种非级联单一分类方法。文献[21]中也采用了SVM和决策树结合的方法,区别在于其分类过程主要由决策树完成,二类较难用决策树分类的扰动由SVM识别,本文所有扰动均经过SVM二分类与决策树多分类。重构后的特征数量较少,不需要对决策树进行剪枝等处理,优化了分类过程且识别精度较好。
表5 不同数量样本准确率对比
分类方法 | 训练样本 | 测试样本 | 分类准确率(%) |
---|---|---|---|
决策树 | 840 | 210 | 89.2 |
1 680 | 420 | 93.5 | |
3 360 | 840 | 94.5 | |
SVM级联决策树 | 840 | 210 | 95.3 |
1 680 | 420 | 97.9 | |
3 360 | 840 | 98.1 |
仿真显示,SVM级联决策树相比传统决策树,对不同数量的样本分类效果都较好,当增加训练样本时,分类准确率保持上升的趋势,证明了该模型的可靠和准确性。当给21种信号增加不同信噪比的噪声时,该方法总体上达到了较高的准确率,具有较好的抗噪性。
5 结论
本文提出了基于S变换以及SVM级联决策树的扰动识别方法,通过仿真分析得到以下结论。
(1) 通过级联结构设计了基于SVM特征选择的决策树分类器,仿真结果表明新方法能准确识别21种电能质量扰动信号且识别率稳定,抗噪能力强。
(2) 与部分级联扰动识别方法相比,本文基于S变换提取的初始特征,通过SVM进行特征重构,改善了决策树常见的过拟合问题,降低了计算复杂度且提高了复合PQD识别精度,具有良好的抗噪性。
(3) 与传统扰动识别方法相比,本文对不同数量的样本分类效果都较好,总体上达到了较高的识别准确率。
下一步的研究中将考虑更多类型的多重扰动,优化特征重构过程,进一步提高多重复合扰动的分类准确率,并应用于实际工程PQD识别并检验该方法的可行性。
参考文献
IEEE ICHQP2018与电能质量发展方向
[J].
IEEE ICHQP2018 and development directions of power quality
[J].
基于组合赋权和改进灰色关联分析的电能质量综合评价方法
[J].
Comprehensive evaluation method for power quality based on combinatorial empowerment and improved grey correlation analysis
[J].
一种基于时频域多特征量的电能质量混合扰动分类新方法
[J].
A new method for power quality mixed disturbance classification based on time-frequency domain multiple features
[J].
电能质量扰动检测与识别方法研究综述
[J].
Review of power quality disturbance detection and identification methods
[J].
基于多层极限学习机的电能质量扰动多标签分类算法
[J].
Power quality disturbances multi-label classification algorithm based on a multi-layer extremelearning machine
[J].
电能质量扰动检测的研究综述
[J].
Review of research development in power quality disturbance detection
[J].
基于短时傅里叶变换及其谱峭度的电能质量混合扰动分类
[J].
Classification for hybrid power quality disturbance based on STFT and its spectral kurtosis
[J].
基于可调品质因子小波变换和随机森林特征选择算法的电能质量复合扰动分类
[J].
Classification of multiple power quality disturbances based on TQWT and random forest feature selection algorithm
[J].
S变换在电能质量扰动分析中的应用综述
[J].
A summary of S-transform applied to power quality disturbances analysis
[J].
基于聚类改进S变换与直接支持向量机的电能质量扰动识别
[J].
Power quality disturbance identification based on clustering-modified S-transform and direct support vector machine
[J].
基于改进不完全S变换与决策树的实时电能质量扰动分类
[J].
A real time power quality disturbance classification based on improved incomplete S-transform and decision tree
[J].
基于双分辨率S变换和学习向量量化神经网络的电能质量扰动检测方法
[J].
Detection method of power quality disturbances based on double resolution S-transform and learning vector quantization neural network
[J].
基于S变换与SVM的电能质量复合扰动识别
[J].
Identification of power quality complex disturbances based on S-transform and SVM
[J].
多特征组合及优化SVM的电能质量扰动识别
[J].
Power quality disturbance classification based on multi-features combination and optimizing parameters of SVM
[J].
电能质量复合扰动特征选择与最优决策树构建
[J].
Feature selection and optimal decision tree construction of complex power quality disturbances
[J].
基于混沌集成决策树的电能质量复合扰动识别
[J].
Recognition of hybrid PQ disturbances based on a chaos ensemble decision tree
[J].
深度信念网络在电能质量复合扰动识别中的应用
[J].
Application of deep belief network in power quality compound disturbance identification
[J].
电能质量复合扰动分类的研究进展
[J].
Review of power quality mixed disturbances identification
[J].
基于改进S变换的电能质量扰动分类新方法
[J].
New method for power quality disturbance classification based on modified S transform
[J].
基于决策树和支持向量机的电能质量扰动识别
[J].
Power quality disturbance identification using decision tree and support vector machine
[J].
基于多标签Rank-WSVM的复合电能质量扰动分类
[J].
Recognition of multiple power quality disturbances using multi-label wavelet support vector machine
[J].
/
〈 |
|
〉 |
