电气工程学报, 2023, 18(3): 297-306 doi: 10.11985/2023.03.032

电力系统

基于最小二乘支持向量机的小电流接地系统早期故障识别算法研究

李华,1, 朱一民,1, 马海军1, 丁继波1, 楚恬歆2, 张文海2

1.国能集团宁夏煤业公司 银川 750004

2.四川大学电气工程学院 成都 610065

Least Squares Support Vector Machine Based Incipient Fault Identification in Non-solidly Grounding System

LI Hua,1, ZHU Yimin,1, MA Haijun1, DING Jibo1, CHU Tianxin2, ZHANG Wenhai2

1. Ningxia Coal Industry Co., Ltd., National Energy Group, Yinchuan 750004

2. College of Electrical Engineering, Sichuan University, Chengdu 610065

收稿日期: 2022-09-12   修回日期: 2023-03-24  

Received: 2022-09-12   Revised: 2023-03-24  

作者简介 About authors

李华,男,1968年生,硕士,高级工程师。主要研究方向为配电设备运维检修与管理。E-mail:15010082@chnenergy.com.cn

朱一民,男,1969年生,硕士,高级工程师。主要研究方向为配电设备运维检修与管理。E-mail:15010093@chnenergy.com.cn

摘要

早期故障为永久性故障的先兆,及时准确识别系统中早期故障对于实现故障预警、减少永久性故障发生有重要意义。针对小电流接地系统早期故障特征弱、检测识别难度大的难题,提出一种基于最小二乘支持向量机的早期故障识别方法。首先分别基于物理特性和统计特性提取扰动浅层特征集,并基于S变换获取不同频段的能量熵和奇异熵;随后采用最大相关最小冗余法,在保留强相关特征量的同时降低特征集数据维度,构建最优扰动特征集;最后利用PSCAD/EMTDC仿真系统获取各类型扰动样本集,基于最小二乘支持向量机获取早期故障扰动波形识别模型,并采用粒子群算法对支持向量机参数寻优,提高算法效率。根据大量仿真算例分析,所提算法能准确识别小电流接地系统早期故障,验证了其正确性和有效性。

关键词: 早期故障; 最小二乘支持向量机; 小电流接地系统; 最大相关最小冗余

Abstract

The incipient fault is the manifestation before a permanent fault. Timely and accurate identification of incipient fault is of great significance for realizing fault early warning and reducing the occurrence of permanent faults. Incipient fault characteristics in non-solidly grounding system are weak, and it’s quite difficult to be detected and identified. Therefore, an incipient fault identification algorithm is proposed based on least squares support vector machine(LS-SVM). Firstly, the shallow feature sets of disturbances are extracted based on physical characteristics and statistical characteristics respectively, and the energy entropy and singular entropy of different frequency bands are obtained based on S-transformation. Then, the maximum relevance and minimum redundancy method is adopted to reduce the data dimension of the feature set while retaining strongly correlated features, and the optimal feature set is constructed. Finally, PSCAD/EMTDC simulation system is used to obtain various disturbance samples, and the incipient fault identification model is obtained based on LS-SVM, then the particle swarm optimization algorithm is used to optimize LS-SVM parameters to improve the efficiency. Simulation examples show that the proposed algorithm can accurately identify incipient faults in non-solidly grounding system, which verifies the correctness and effectiveness of the proposed method.

Keywords: Incipient fault; least squares support vector machine; low current grounding system; maximum relevance and minimum redundancy

PDF (11625KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

李华, 朱一民, 马海军, 丁继波, 楚恬歆, 张文海. 基于最小二乘支持向量机的小电流接地系统早期故障识别算法研究[J]. 电气工程学报, 2023, 18(3): 297-306 doi:10.11985/2023.03.032

LI Hua, ZHU Yimin, MA Haijun, DING Jibo, CHU Tianxin, ZHANG Wenhai. Least Squares Support Vector Machine Based Incipient Fault Identification in Non-solidly Grounding System[J]. Chinese Journal of Electrical Engineering, 2023, 18(3): 297-306 doi:10.11985/2023.03.032

1 引言

电力设备在绝缘逐渐老化过程中会不断发生瞬时性击穿,产生扰动波形,这一系列扰动被称为早期故障。早期故障具有重复性、随机性和瞬时性的特点,前期研究将其刻画成物理本质为电弧故障的瞬时性单相接地[1-3]。早期故障频发使设备的绝缘劣化处遭受进一步损坏,伤害逐渐累积至永久性故障发生,导致停电事故[4-5]。随着配电网信息化建设,置于站端的扰动波形记录装置能实现早期故障波形的捕获,但同时也记录下大量与其波形特征相似的非早期故障扰动。若能基于扰动波形数据实现对早期故障和其他扰动波形的准确区分,则可以及时感知设备运行状态、指导检修工作安排并消除故障隐患,在一定程度上减少永久性故障导致的停电事故发生[6]。因此,准确识别早期故障对于提高系统供电可靠性具有重要意义。

目前,早期故障识别方法可归纳为基于波形特征[7-10]、故障模型[11]和机器学习[12-15]三大类。其中,基于波形特征的早期故障识别方法主要利用扰动波形中各电气量的相关变化规律,如文献[7]基于电压和电流的各次谐波含量及畸变率对早期故障进行识别;文献[8]则将负序电流及故障电流分量的变化规律作为扰动识别判据;文献[9-10]都利用了卡尔曼滤波器计算电压基波分量,并将其与实测值的偏差作为早期故障扰动的特征量。而基于故障模型的早期故障识别方法主要利用早期故障作为电弧故障的物理本质,建立以电弧模型为基础的早期故障仿真模型,通常以扰动波形的电压畸变程度及故障的自清除特性来进行早期故障识别[11]。上述两类方法均基于知识驱动,所选择的扰动特征量通常具有较明确的物理意义且判据简单、具有一定的实际应用意义,但其受系统参数、故障参数或电弧特性等随机因素的影响较大,算法适应性较弱。

基于机器学习的早期故障识别方法通常依赖于信号分析算法对扰动波形进行处理,获取大量时域或频域的特征信息,在此基础上利用庞大的特征数据对分类器进行训练以构建相应的故障识别模型。例如文献[12]利用小波变换算法将扰动波形拆分为不同基元,并基于类人概念学习采用贝叶斯概率学习法挖掘波形基元特征与扰动类型的关联性;文献[13-14]分别采用了小波变换和S变换算法获取大量的扰动波形特征信息,随后将其输入神经网络进行故障模型的训练;文献[15]基于快速傅里叶算法将每个窗口波形信号对应频域信息表示为相应字母,因此不同类型扰动波形的字母组合存在较大差异。此类方法基于数据驱动,鲁棒性强但对于扰动波形数据样本的依赖性大,且其特征数据集的维度通常较为庞大。另外,我国中压配电网主要采用小电流接地的方式[16],早期故障在该类系统中的表现形式分为单相接地型和异名相两点接地型[17],如图1所示,而目前的早期故障识别方法主要针对单相接地型。文献[18]结合早期故障特性及其扰动波形变化规律,提出了基于复合判据的小电流接地系统早期故障识别方法,能够准确识别单相接地型和异名相两点接地型早期故障,但该算法易受过渡电阻影响,且涉及阈值较多、要求较高,在实际应用中存在一定的局限性。因此,如何解决基于知识驱动方法的适应性不足和基于数据驱动方法特征数据量大的问题,以及充分考虑小电流接地系统早期故障表现形式的多样性,是当前针对我国中压配电网早期故障识别方法研究需要关注的重点。

图1

图1   小电流接地系统中的早期故障仿真波形


为解决上述问题,本文提出一种基于最小二乘支持向量机(Least squares support vector machine,LS-SVM)的小电流接地系统早期故障识别方法。在扰动特征提取阶段,同时计及了扰动波形的物理特性和统计特性,充分利用扰动数据特征,并采用最大相关最小冗余方法(Maximum relevance and minimum redundancy,mRMR)进行数据降维并保留强相关特征,构建最优扰动特征集,并基于粒子群算法(Particle swarm optimization,PSO)优化支持向量机的关键参数。经过仿真数据验证和与几种传统识别方法的对比,证明了所提方法的有效性和更高的准确率。

2 扰动特征提取及优化

早期故障准确识别的关键在于构建适合的扰动特征集,以此实现早期故障与其他非早期故障波形的可靠区分。考虑到早期故障作为典型小样本事件,具有随机性,实现早期故障与非早期故障波形分类的核心问题在于对扰动特征量的降维选择,以避免数据维数灾难,提高分类模型的适应性。因此,本文分别基于扰动的物理特性和统计特性提取浅层特征集,并进一步采用mRMR法构建最优特征集,在尽量保留扰动强相关特征的同时降低数据维度。最优扰动特征集的构建及其所包含特征如图2所示。

图2

图2   最优扰动特征集的构建


2.1 初始扰动特征集提取

2.1.1 基于物理特性的特征提取

经前期研究成果可知,早期故障通常发生在电压峰值时刻附近,这是由于此时电压幅值较高而易导致绝缘薄弱点发生击穿。另外,早期故障具有瞬时性和自清除性,在扰动前后其负荷电流不发生改变。基于早期故障物理特性,将电压故障初相角φU、负荷电流变化量ΔIload及故障相电压和电流的波形形状因数FUFI作为扰动特征子集1。其中,形状因数(Form factor)可用来表征扰动波形的实际形状的信息(如波形幅值的突变),因此本文采用形状因数表征早期故障发生时的故障相电压和电流幅值变化程度,故障相电压波形的形状因数FU的表达式如下所示

FU=UrmsUmean=max1Nhalfm=k1m+NhalfU2(m)1Ndk1k2|U(m)|

式中,UrmsUmean分别表示在扰动期间电压有效值的最大值和平均值;Nd表示扰动期间的总采样点数;Nhalf为信号的半周期采样点总数;k1k2分别表示扰动起止时刻对应的采样点序列数;U为电压采样信号瞬时值;m表示采样点序列(m = k1, k1+1,…, k2)。故障相电流的波形形状因数FI同理可得。另外,若故障相不只一相,则以涉及相别对应形状因数的平均值为最终的特征量。

由此构建的扰动特征子集所含特征量与早期故障的物理特性密切相关。然而,由于故障的不确定性,扰动波形中可能存在大量的隐藏特征信息未被发现,且暂未对其进行基于物理特性的定量刻画,因此基于知识驱动的特征提取思路在当前的研究进展下存在一定局限性。此时,基于数据驱动的特征分析方法则为挖掘隐藏特征信息提供了重要的技术手段。

2.1.2 基于统计特性的特征提取

可变的时频分辨率使S变换具有较好的时频特性和抗噪能力,该类信号处理方式能够提取丰富的时频特征量信息,被广泛应用于电力扰动波形的突变区域分析[19]。对站端扰动电压波形进行S变换并取模处理后,获得一个M×N的模时频矩阵S,其行向量和列向量可分别对应该段扰动电压信号的频率信息和采样时刻的幅值特性。由此可见,模时频矩阵S蕴含了大量的扰动特征信息,在故障分类研究中得到了广泛应用,但此时S所含的数据量仍然很大。为进一步表征扰动波形隐藏特性,并降低特征集的数据维度,本文采用S变换获取能量熵A和奇异熵B对扰动电压波形各频段上的能量分布特性和信号复杂程度进行刻画[19]。假设模时频矩阵S中的第i行第j列个元素表示为sij,则矩阵S在对应频率i和采样时刻j的条件下的信号能量Eij可以表示为

Eij=|sij|2

在频率为i条件下对应的所有采样时刻的扰动信号能量之和Ei以及信号总能量E可分别表示为

Ei=j=1NdEij
E=i=1MEi

根据矩阵S的行数M将该矩阵分为低、中、高三个频段,电压扰动波形在不同频段下对应的S变换奇异熵A可表示为

Af=i=M1M2EiElnEiE

在计算不同频段的奇异熵时,式(5)中的下标f分别取为low、med、high以对应低、中、高三个频段。在不同频段条件下,M1M2分别对应式(6)取值,其中MSS对应频域最大值,MS=采样频率×M÷采样点数。例如,本文所用扰动数据采样频率为10 kHz,其对应的低、中、高三个频段分别取为0~1 667 Hz、1 668~3 334 Hz、3 335~5 000 Hz。

M1=1M2=MS3M1=MS3+1M2=2MS3M1=2MS3+1M2=MS

假设低频段的模时频矩阵Slow为一个Mlow×Nlow矩阵,由奇异值分解理论可知,必然存在一个Mlow×r的矩阵Dr×Nlow的矩阵C以及一个r×r的对角线矩阵R,使得模时频矩阵的低频段矩阵Slow可被分解为

Slow=DRCT

对角线矩阵R的主对角线元素ri(ri = 1, 2, 3,…, r)为非负数且按降序排列,这些元素即为Slow的奇异值,可表示对应采样时刻及频率条件下的信息量的大小。因此将模时频矩阵低频段的奇异熵Blow表示为

Blow=i=1r(rij=1rrj)ln(rij=1rrj)

同理,根据式(8)可分别计算出中频段模时频矩阵Smed和高频段模时频矩阵Shigh对应的奇异熵BmedBhigh

电压扰动波形低、中、高频段对应的S变换奇异熵和S变换能量熵共同组成基于统计特性的扰动波形特征子集2。

2.2 最优扰动特征集构建

基于统计特性构建的扰动波形特征子集2,表征了扰动信号在不同频段上的能量分布情况以及在时频空间中能量分布的复杂程度[19]。对模时频矩阵S进行奇异熵和能量熵的提取,虽然能在一定程度上降低输入分类器的数据维度,但是仍具有较大数据量和信息量,并存在大量与扰动本身相关程度不高的特征量,可能会导致分类模型的训练时间较长,并影响分类结果的准确性。因此,本文基于最大相关最小冗余法对特征子集2进行处理,保留特征集中与扰动波形具有强关联性的特征并消除冗余特征量,降低数据维度。

最大相关最小冗余法的核心思想是从已知的特征数据集中寻找与其目标类别有最大相关性且相互之间具有最小冗余性的特征子集,评价标签类别与特征之间的相关性[20-21]。最大相关最小冗余法能够将扰动特征子集2中具备最大分类能力的最优特征量保留,并将子集中所含的高冗余和不相关信息降低至最小程度,深度挖掘与目标标签相关联的特征信息,提高分类能力[22]

设两个随机变量ab的概率密度函数p(a)、p(b)和p(a, b),则可将这两个变量之间的互信息表示为

I(a,b)=p(a,b)lgp(a,b)p(a)p(b)dadb

特征集X的最大相关和最小冗余衡量标准分别表示如下

maxD(X,Y)=1|X|xiXI(xi,Y)
minR(X)=1|X|2xi,xjXI(xi,xj)

式中,|X|表示特征集X所含的特征数;Y = {y1, y2, y3,…, yn}为类别标签;xixj分别表示特征集X中第i和第j个特征。根据式(9)可得,两个特征量xixj之间的互信息为I(xi, xj),特征量xi与其对应类别之间的互信息为I(xi,Y)。根据式(10)和式(11),最大相关最小冗余准则可被定义为

maxϕ(D,R)ϕ=D(X,Y)R(X)

在实际应用场景中,通常采用增量搜索法寻找近似最优特征[23]。特征集X中已有v-1个特征量被确定,该部分特征量组成子集Xv-1,此时最大相关最小冗余法的目的就是从剩余子集{X-Xv-1}中选择第v个特征量,实现式(12)中ϕ(·)最大化,因此又可将最大相关最小冗余准则定义为如下形式

mRMRv(xi)=maxxiXXv1I(xi,Y)1|X|xjXv1I(xi,xj)

3 支持向量机及其优化

3.1 最小二乘支持向量机理论

支持向量机(Support vector machine,SVM)以核函数理论为基础,基于映射函数将样本投放至高维空间中以获取最优超平面使样本线性可分,随后又将其反映射回低维空间,实现最终分类[24],该过程如图3所示。

图3

图3   支持向量机分类原理示意


LS-SVM则将传统支持向量机模型中的不等式约束改为等式约束[25],简化了拉格朗日乘子的求解过程,并将误差平方和损失函数作为训练集的经验损失,将二次规划求解问题转化为求解线性方程组,极大提高了计算速度和收敛精度。

对于训练样本集Q={(xk, yk)|k = 1,2,3,…,n},xkyk分别表示样本及其对应类别,将不同类别样本分类,其目标函数为

minJ(w,ξ)=12wTw+γk=1nξk2
s.t. yk[wTψ(xk)+h]1+ξk=0

式中,ψ(x)为映射函数;w为权值;h为截距;ξγ分别为估计偏差和惩罚因子,上式的拉格朗日函数可表示为

L(w,h,ξ,α)=J(w,ξ)k=1nαk{wψ(x)+h+ξkyk}

式中,非负数α为拉格朗日乘子。分别对式(16)中whξα求偏导,并令其为零

Lw=0w=k=1nαkψ(xk)Lb=0k=1nαk=0Lξk=0αk=γξkLαk=0wψ(x)+h+ξk+yk=0

由Mercer条件[26],存在映射函数ψ(x)及核函数K(x,xk)使得

K(xk,xl)=ψ(xk)Tψ(xl)

式中,k, l = 1, 2, 3,…, n。根据式(16)和式(18)可将基于LS-SVM的分类决策函数表示为

f(x)=k=1nαkyiK(xk,x)+h=0

研究表明,支持向量机在径向基函数条件下能够获得较好性能[27],因此本文选择径向基核函数为LS-SVM的核函数,其表达式如下所示

K(x,xk)=exp|xxk|2σ2

式中,σ2为径向基核函数的宽度。

3.2 基于粒子群算法的参数选择

LS-SVM存在核函数宽度σ2和惩罚系数γ两个变量,当γ的取值越小,则算法适应性越强,但训练误差也随之增大;而当γ的取值较大时,算法适应性降低;σ2主要影响算法的运行效率[24]。因此需要寻求最优参数组合以满足算法适应性和运算效率的约束。网格搜索法(Grid search)是最常用的参数搜索方法,但该方法的运算时间较长且效率不高[28]。本文选用PSO算法寻找核函数宽度σ2和惩罚系数γ的最优组合。PSO算法将一群初始化粒子经过多次迭代后获取目标函数最优解,在各次迭代过程中,每个粒子基于个体极值pi(该粒子最优解)和全局极值gd(该种群所得最优解)更新自身的位置及速度[29]。第i个粒子在第k+1次迭代过程中的位置xk+1i及其对应速度vk+1i分别表示如下

xk+1i=xki+vk+1i
vk+1i=ηvki+c1r1(pixki)+c2r2(gdxki)

式中,c1c2为学习因子,r1r2为[0,1]之间的随机值,η表示加权因子。

根据前期研究经验对PSO算法中初始参数设置情况如表1所示[30-31]

表1   粒子群优化算法的初始参数设置

算法参数数值
粒子群大小10
加权因子取值范围[0.5, 0.9]
学习因子c1c21.5、1.7
最大迭代次数100
核函数宽度取值范围[2-5, 22]
惩罚系数取值范围[1, 100]
粒子位置取值范围[-10, 10]
粒子速度取值范围[-10, 10]

新窗口打开| 下载CSV


4 早期故障识别算法流程

本文提出基于最小二乘支持向量机的适用于小电流接地系统的早期故障识别方法,其具体流程如图4所示。

图4

图4   早期故障识别流程图


算法具体步骤如下所示。

(1) 基于PSCAD/EMTDC搭建不同扰动模型,构建配电网早期故障及多种常见扰动波形数据库。

(2) 构建基于物理特性的特征子集1和基于统计特性的特征子集2。其中子集1包含电压故障初相角、故障相电压和电流的波形形状因数以及扰动前后的负荷电流变化量;子集2为电压波形经S变换后不同频段的能量熵和奇异熵。

(3) 利用最大相关最小冗余法对特征子集2进行处理,保留特征集中与扰动波形具有强关联性的特征并消除冗余特征量,降低数据维度,构建最优特征集。

(4) 基于K折交叉验证法划分训练样本集和测试样本集,并算取各样本集对应的最优特征集。

(5) 将训练样本集对应特征集输入LS-SVM以构建扰动分类模型,同时基于粒子群算法进行参数寻优。

(6) 基于训练后得到的分类模型对测试样本集进行验证,利用不同评估指标对算法的性能进行验证,并将该算法与传统扰动识别方法进行对比。

5 算例分析

5.1 样本集构建

基于PSCAD/EMTDC系统搭建小电流接地配电网仿真模型,其拓扑结构如图5所示,ZX表示消弧线圈的阻抗。当开关K闭合时,该系统为中性点经消弧线圈接地,断开时则为中性点不接地。仿真系统中线路模型的参数设置情况如表2所示。

图5

图5   配电网仿真系统


表2   仿真系统的线路参数

线路相序电阻/(Ω/km)电感/(mH/km)电容/(μF/km)
架空线正序0.0802.4250.009
零序0.2400.8030.006
电缆正序0.0990.9680.339
零序0.9700.2250.280

新窗口打开| 下载CSV


根据表3,采用PSCAD/EMTDC的Multiple Run元件获取不同类型的扰动波形样本数据,包括早期故障、励磁涌流、电容器组投切和恒定阻抗故障的波形样本各360例。

表3   样本集的参数设置

参数数值
故障距离D/m100~14 600 (步长500 m)
接入电容器值C/mF1~7 000 mF(步长100 mF)
接入变压器S/(kV·A)1~7 000 (步长100 kV·A)
接入恒定阻抗Z1~7 000 (步长100 Ω)
电弧时间常数τ/ms0.2~0.4 (步长0.2 ms)
电弧特征电压u0/V100~1 300(步长200 V)
电弧特征电阻r00.001~0.013 (步长0.003 Ω)

新窗口打开| 下载CSV


5.2 算法性能分析

5.2.1 算法评价指标

本文基于K折交叉验证法(K-fold cross validation,K-CV)对算法有效性进行分析,即将各类型的扰动波形样本集随机分为K组,各组的样本数量相等,随后依次使用其中一组作为测试样本集,剩余K-1组则自动归为训练样本集,本文将K取为5。同时,使用基于混淆矩阵的算法性能度量指标对本文算法性能进行评价[32],如式(23)~(26)所示。

(1) 算法识别结果和实际类别一致的样本占总样本的比例,即准确率P1

P1=T1+T2T1+T2+F1+F2

(2) 算法识别为早期故障且实际类别为早期故障的比例,即精确率P2

P2=T1T1+F1

(3) 算法识别且实际类别为早期故障的样本占所有实际类别为早期故障样本的比例,即召回率P3

P3=T1T1+F2

(4) 由于实际中需要识别的扰动类型可能存在样本数不平衡的问题,仅靠准确率评估不合理,因此表示精确率P2和召回率P3的调和均值的指标P4

2P4=1P2+1P3P4=2T12T1+P1+P2

式中,T1T2分别表示被正确分类的早期故障和非早期故障样本数,F1为被误识别为早期故障的非早期故障样本数,F2为被误识别为非早期故障的早期故障样本数。

基于K折交叉验证法将各类扰动样本集随机均分为5组并编号,各组依次作为测试样本集,在各次测试中的算法性能评价结果如表4所示。根据表4可知,本文所提算法在不同样本集条件下的准确率和精确度均能够高于95%,具备较高的稳健性。

表4   本文算法的各项性能评价指标

测试集训练集P1(%)P2(%)P3(%)P4(%)
12~50.979 210.958 30.978 7
21,3~50.965 30.985 50.944 40.964 5
31~2,4~50.965 30.971 80.958 30.965
41~3,50.958 310.916 70.956 5
51~40.979 20.985 90.972 20.979 0
平均值0.969 460.988 640.949 980.968 74

新窗口打开| 下载CSV


从理论上讲,在寻求最优参数组合时迭代次数越多,最后得到的误差会更小,即识别准确率越高。本文取迭代次数为100,图6展示了不同迭代次数下算法的识别准确率。可知,当迭代次数小于20次时,准确率较低,而随着迭代次数的增加,准确率上升。当迭代次数达到100时,算法的识别准确率已为96.95%,此后继续增大迭代次数,准确率变化非常小,当迭代次数大于120后,准确率不再上升。

图6

图6   迭代次数对算法结果的影响


5.2.2 特征及参数选择优点

为验证基于mRMR的特征优化法有效性,分别将扰动样本的原始特征集和经mRMR法处理后的最优特征数据集作为分类器的输入。表5记录了在两种特征集条件下的算法性能评估指标均值及相应的数据处理时间,各次测试结果中的算法性能指标如图7所示。由表5图7可知,本文采用的扰动最优特征集能够有效降低数据维度并减少冗余特征,减少了数据处理时间且提高了算法准确性。

表5   最优特征集与原始数据集条件下的算法性能比较

特征集P1P2P3P4处理时间/s
最优特征0.969 460.988 640.949 980.968 74129.244
原始数据0.904 160.934 660.868 540.900 621 322.359

新窗口打开| 下载CSV


图7

图7   特征优化前后的算法准确率P1比较


采用PSO算法选择核函数宽度σ2和惩罚系数γ的最优组合,将该方法与常用的网格搜索法进行比较。表6记录了在两种方法下识别算法的平均评估指标及处理时间。图8记录了各次测试中上述两种方法对识别算法准确率P1的影响。由此可知,在多数的测试案例中,PSO算法与网格搜索法相比具有更高的识别精度且所需的数据处理时间更少。

表6   不同参数寻优算法比较

方法P1P2P3P4处理时间/s
粒子群优化0.969 460.988 640.949 980.968 747.236
网格搜索法0.944 440.976 240.911 140.941 4427.835

新窗口打开| 下载CSV


图8

图8   不同参数寻优法下的算法准确率P1比较


5.2.3 与其他分类方法比较

为进一步验证本文算法的有效性,将其与概率神经网络(Probabilistic neural network,PNN)、决策树(Decision tree,DT)和K近邻算法(K-nearest neighbor,KNN)进行比较,识别结果如表7图9所示。

表7   不同分类器条件下的算法各项性能评价指标

分类器P1P2P3P4
LSSVM0.969 460.988 640.949 980.968 74
KNN0.911 120.954 40.863 880.906 6
PNN0.711 10.804 620.558 340.658 86
DT0.717 40.777 420.633 320.697 26

新窗口打开| 下载CSV


图9

图9   不同分类器下的算法准确率P1比较


6 结论

本文提出一种基于最小二乘支持向量机的小电流接地系统早期故障识别方法,根据PSCAD/EMTDC系统构建了典型扰动波形数据库,在此基础上对算法性能进行分析并得出以下结论。

(1) 本文结合扰动的物理特性和统计特性提取初始特征集,并采用最大相关最小冗余方法构建最优特征集,消除了冗余信息并降低了数据维度,更加利于分类。

(2) 根据交叉验证法的分析结果,本文算法的准确率和精确度均能够高于95%,具备较高准确性。

(3) 通过与其他传统识别方法的比较,本文所提算法的准确率和运算速度均有所提升。基于仿真波形数据验证了所提早期故障识别算法的有效性,未来需要进一步使用大量实测数据进行验证。

参考文献

李宇, 杨柳林.

基于卷积神经网络的配电网单相接地故障识别

[J]. 电气工程学报, 2020, 15(3):22-30.

[本文引用: 2]

LI Yu, YANG Liulin.

Identification of single phase to earth fault in distribution network based on convolution neural network

[J]. Journal of Electrical Engineering, 2020, 15(3):22-30.

[本文引用: 2]

STRINGER N T, KOJOVIC L A.

Prevention of underground cable splice failures

[J]. IEEE Transactions on Industry Applications, 2001, 37(1):230-239.

DOI:10.1109/28.903154      URL     [本文引用: 1]

KULKARNI S, SANTOSO S, SHORT T A.

Incipient fault location algorithm for underground cables

[J]. IEEE Transactions on Smart Grid, 2014, 5(3):1165-1174.

DOI:10.1109/TSG.2014.2303483      URL     [本文引用: 1]

SHI S, HU Z, MA Z, et al.

Travelling waves-based identification of sub-health condition of feeders in power distribution system

[J]. IET Generation Transmission & Distribution, 2018, 12(5):1067-1073.

DOI:10.1049/gtd2.v12.5      URL     [本文引用: 1]

JIANG J, CHEN R, CHEN M, et al.

Dynamic fault prediction of power transformers based on hidden Markov model of dissolved Gases analysis

[J]. IEEE Transactions on Power Delivery, 2019, 34(4):1393-1400.

DOI:10.1109/TPWRD.61      URL     [本文引用: 1]

刘亚东, 丛子涵, 严英杰, .

配电设备早期故障检测基本原理、关键技术与发展趋势

[J]. 供用电, 2020, 37(4):10-16,32.

[本文引用: 1]

LIU Yadong, CONG Zihan, YAN Yingjie, et al.

Basic principles,key technologies and development trends of incipient fault detection for power distribution equipments

[J]. Distribution & Utilization, 2020, 37(4):10-16,32.

[本文引用: 1]

戴铭. 10 kV地下电缆早期故障检测与识别方法探讨[D]. 成都: 西南交通大学, 2015.

[本文引用: 2]

DAI Ming. Discussion methods of incipient fault detection and identification in 10 kV underground cables[D]. Chengdu: Southwest Jiaotong University, 2015.

[本文引用: 2]

KASZTENY B, VOLOH I, JONES C G, et al.

Detection of incipient faults in underground medium voltage cables

[C]// IEEE Protective Relay Engineers 61st Annual Conference, April 1-3,2008,Texas A&M University,College Station,Texas. Piscataway:IEEE, 2008:349-366.

[本文引用: 2]

SAMET H, TAJDINIAN M, KHALEGHIAN S, et al.

A statistical-based criterion for incipient fault detection in underground power cables established on voltage waveform characteristics

[J]. Electric Power Systems Research, 2021, 197:107303.

DOI:10.1016/j.epsr.2021.107303      URL     [本文引用: 2]

GHANBARI T.

Kalman filter based incipient fault detection method for underground cables

[J]. IET Generation,Transmission & Distribution, 2015, 9(14):1988-1997.

DOI:10.1049/gtd2.v9.14      URL     [本文引用: 2]

ZHANG W, XIAO X, ZHOU K, et al.

Multi-cycle incipient fault detection and location for medium voltage underground cable

[J]. IEEE Transactions on Power Delivery, 2017, 32(3):1450-1459.

DOI:10.1109/TPWRD.2016.2615886      URL     [本文引用: 2]

熊思衡, 刘亚东, 方健, .

配电线路早期故障辨识方法

[J]. 高电压技术, 2020, 46(22):3970-3976.

[本文引用: 2]

XIONG Siheng, LIU Yadong, FANG Jian, et al.

Detection method of incipient faults of power system lines

[J]. High Voltage Engineering, 2020, 46(22):3970-3976.

[本文引用: 2]

汪颖, 卢宏, 杨晓梅, .

堆叠自动编码器与S变换相结合的电缆早期故障识别方法

[J]. 电力自动化设备, 2018, 38(8):117-124.

[本文引用: 2]

WANG Ying, LU Hong, YANG Xiaomei, et al.

Cable incipient fault identification based on stacked autoencoder and S-transform

[J]. Electric Power Automation Equipment, 2018, 38(8):117-124.

[本文引用: 2]

汪颖, 孙建风, 肖先勇, .

基于优化卷积神经网络的电缆早期故障分类识别

[J]. 电力系统保护与控制, 2020, 48(7):10-18.

[本文引用: 2]

WANG Ying, SUN Jianfeng, XIAO Xianyong, et al.

Cable incipient fault classification and identification based on optimized convolution neural network

[J]. Power System Protection and Control, 2020, 48(7):10-18.

[本文引用: 2]

WENG Y, CUI Q, GUO M.

Transform waveforms into signature vectors for general-purpose incipient fault detection

[J]. IEEE Transactions on Power Delivery, 2022, 37(6):4559-4569.

DOI:10.1109/TPWRD.2022.3151110      URL     [本文引用: 2]

刘健, 张小庆, 张志华, .

提升小电流接地系统单相接地故障处理能力

[J]. 供用电, 2021, 38(10):52-56.

[本文引用: 1]

LIU Jian, ZHANG Xiaoqing, ZHANG Zhihua, et al.

Solutions to improve the single-phase grounding fault management of neural non-effective grounded systems

[J]. Distribution & Utilization, 2021, 38(10):52-56.

[本文引用: 1]

楚恬歆, 张文海, 瞿科, .

小电流接地系统接地型早期故障扰动特征分析

[J]. 电力系统保护与控制, 2021, 49(18):52-61.

[本文引用: 1]

CHU Tianxin, ZHANG Wenhai, QU Ke, et al.

Grounded incipient fault analysis in a non-solidly grounding system

[J]. Power System Protection and Control, 2021, 49(18):52-61.

[本文引用: 1]

楚恬歆, 张文海, 瞿科, .

基于复合判据的小电流接地系统接地型早期故障检测

[J]. 高电压技术, 2022, 48(3):1022-1031.

[本文引用: 1]

CHU Tianxin, ZHANG Wenhai, QU Ke, et al.

The grounded incipient fault detection based on compound criterion in non-solidly grounding system

[J]. High Voltage Engineering, 2022, 48(3):1022-1031.

[本文引用: 1]

陶维青, 夏熠, 陆鼎堃.

S变换熵理论及其在电力系统故障检测中的应用研究

[J]. 合肥工业大学学报, 2016, 39(1):40-45.

[本文引用: 3]

TAO Weiqing, XIA Yi, LU Dingkun.

Study of S-transform entropy theory and its application in fault detection of electric power system

[J]. Journal of Hefei University of Technology, 2016, 39(1):40-45.

[本文引用: 3]

程玉胜, 宋帆, 王一宾, .

基于专家特征的条件互信息多标记特征选择算法

[J]. 计算机应用, 2020, 40(2):503-509.

DOI:10.11772/j.issn.1001-9081.2019091626      [本文引用: 1]

特征选择对于分类器的分类精度和泛化性能起重要作用。目前的多标记特征选择算法主要利用最大相关性最小冗余性准则在全部特征集中进行特征选择,没有考虑专家特征,因此多标记特征选择算法的运行时间较长、复杂度较高。实际上,在现实生活中专家依据几个或者多个关键特征就能够直接决定整体的预测方向。如果提取关注这些信息,必将减少特征选择的计算时间,甚至提升分类器性能。基于此,提出一种基于专家特征的条件互信息多标记特征选择算法。首先将专家特征与剩余的特征相联合,再利用条件互信息得出一个与标记集合相关性由强到弱的特征序列,最后通过划分子空间去除冗余性较大的特征。该算法在7个多标记数据集上进行了实验对比,结果表明该算法较其他特征选择算法有一定优势,统计假设检验与稳定性分析进一步证明了所提出算法的有效性和合理性。

CHENG Yusheng, SONG Fan, WANG Yibin, et al.

Multi-label feature selection algorithm based on conditional mutual information of expert feature

[J]. Journal of Computer Applications, 2020, 40(2):503-509.

DOI:10.11772/j.issn.1001-9081.2019091626      [本文引用: 1]

Feature selection plays an important role in the classification accuracy and generalization performance of classifiers. The existing multi-label feature selection algorithms mainly use the maximum relevance and minimum redundancy criterion to perform feature selection in all feature sets without considering expert features, therefore, the multi-label feature selection algorithm has the disadvantages of long running time and high complexity. Actually, in real life, experts can directly determine the overall prediction direction based on a few or several key features. Paying attention to and extracting this information will inevitably reduce the calculation time of feature selection and even improve the performance of classifier. Based on this, a multi-label feature selection algorithm based on conditional mutual information of expert feature was proposed. Firstly, the expert features were combined with the remaining features, and then the conditional mutual information was used to obtain a feature sequence of strong to weak relativity with the label set. Finally, the subspaces were divided to remove the redundant features. The experimental comparison was performed to the proposed algorithm on 7 multi-label datasets. Experimental results show that the proposed algorithm has certain advantages over the other feature selection algorithms, and the statistical hypothesis testing and the stability analysis further illustrate the effectiveness and the rationality of the proposed algorithm.

毛莺池, 曹海, 平萍, .

基于最大联合条件互信息的特征选择

[J]. 计算机应用, 2019, 39(3):734-741.

DOI:10.11772/j.issn.1001-9081.2018081694      [本文引用: 1]

在高维数据如图像数据、基因数据、文本数据等的分析过程中,当样本存在冗余特征时会大大增加问题分析复杂难度,因此在数据分析前从中剔除冗余特征尤为重要。基于互信息(MI)的特征选择方法能够有效地降低数据维数,提高分析结果精度,但是,现有方法在特征选择过程中评判特征是否冗余的标准单一,无法合理排除冗余特征,最终影响分析结果。为此,提出一种基于最大联合条件互信息的特征选择方法(MCJMI)。MCJMI选择特征时考虑整体联合互信息与条件互信息两个因素,两个因素融合增强特征选择约束。在平均预测精度方面,MCJMI与信息增益(IG)、最小冗余度最大相关性(mRMR)特征选择相比提升了6个百分点;与联合互信息(JMI)、最大化联合互信息(JMIM)相比提升了2个百分点;与LW向前搜索方法(SFS-LW)相比提升了1个百分点。在稳定性方面,MCJMI稳定性达到了0.92,优于JMI、JMIM、SFS-LW方法。实验结果表明MCJMI能够有效地提高特征选择的准确率与稳定性。

MAO Yingchi, CAO Hai, PING Ping, et al.

Feature selection based on maximum conditional and joint mutual information

[J]. Journal of Computer Application, 2019, 39(3):734-741.

[本文引用: 1]

盖晓平, 王冬青, 赵喜兰, .

利用概率统计特性的保护告警信息特征降维方法

[J]. 电网技术, 2021, 45(5):2017-2024.

[本文引用: 1]

GAI Xiaoping, WANG Dongqing, ZHAO Xilan, et al.

Feature reduction method for alarm information protection with probability statistical characteristics

[J]. Power System Technology, 2021, 45(5):2017-2024.

[本文引用: 1]

李扬, 顾雪平.

基于改进最大相关最小冗余判据的暂态稳定评估特征选择

[J]. 中国电机工程学报, 2013, 33(34):179-186.

[本文引用: 1]

LI Yang, GU Xueping.

Feature selection for transient stability assessment based on improved maximal relevance and minimal redundancy criterion

[J]. Proceedings of the CSEE, 2013, 33(34):179-186.

[本文引用: 1]

孙志鹏, 孙志龙, 魏建.

基于决策树支持向量机算法的电力变压器故障诊断研究

[J]. 电气工程学报, 2019, 14(4):42-45.

[本文引用: 2]

SUN Zhipeng, SUN Zhilong, WEI Jian.

Research on power transformer fault diagnosis based on decision tree support vector machine

[J]. Journal of Electrical Engineering, 2019, 14(4):42-45.

[本文引用: 2]

徐世晖. 基于改进在线最小二乘支持向量机电池故障诊断方法研究[D]. 哈尔滨: 哈尔滨理工大学, 2020.

[本文引用: 1]

XU Shihui. Research on battery fault diagnosis method based on improved online least square support vector machine[D]. Harbin:Harbin University of Science and Technology, 2021.

[本文引用: 1]

邓乃扬, 田英杰. 数据挖掘中的新方法——支持向量机[M]. 北京: 科学出版社, 2004.

[本文引用: 1]

DENG Naiyang, TIAN Yingjie. A new method of data mining:Support vector machines[M]. Beijing: China Science Publishing & Media Ltd., 2004.

[本文引用: 1]

郑含博, 王伟, 李晓纲, .

基于多分类最小二乘支持向量机和改进粒子群优化算法的电力变压器故障诊断方法

[J]. 高电压技术, 2014, 40(11):3424-3429.

[本文引用: 1]

ZHENG Hanbo, WANG Wei, LI Xiaogang, et al.

Fault diagnosis method of power transformers using multi-class LS-SVM and improved PSO

[J]. High Voltage Engineering, 2014, 40(11):3424-3429.

[本文引用: 1]

LIN S, YING K, CHEN S, et al.

Particle swarm optimization for parameter determination and feature selection of support vector machines

[J]. Expert Systems with Applications, 2008, 35(4):1817-1824.

DOI:10.1016/j.eswa.2007.08.088      URL     [本文引用: 1]

冯茜, 李擎, 全威, .

多目标粒子群优化算法研究综述

[J]. 工程科学学报, 2021, 43(6):745-753.

[本文引用: 1]

FENG Qian, LI Qing, QUAN Wei, et al.

Overview of multiobjective particle swarm optimization algorithm

[J]. Chinese Journal of Engineering, 2021, 43(6):745-753.

[本文引用: 1]

王文凯, 邓斌.

基于DAE-IPSO-SVM的电缆早期故障识别方法

[J]. 国外电子测量技术, 2021, 40(8):29-35.

[本文引用: 1]

WANG Wenkai, DENG Bin.

Cable incipient fault identification method based on DAE-IPSO-SVM

[J]. Foreign Electronic Measurement Technology, 2021, 40(8):29-35.

[本文引用: 1]

CHANG G, HONG Y, LI G.

A hybrid intelligent approach for classification of incipient faults in transmission network

[J]. IEEE Transactions on Power Delivery, 2019, 34(4):1785-1794.

DOI:10.1109/TPWRD.61      URL     [本文引用: 1]

杨杏丽.

分类学习算法的性能度量指标综述

[J]. 计算机科学, 2021, 48(8):209-219.

DOI:10.11896/jsjkx.200900216      [本文引用: 1]

在机器学习的分类问题研究中,对分类学习算法的正确评价是非常重要的。现实中,许多性能度量指标被从不同的角度提出,文中主要介绍了基于错误率的、基于混淆矩阵的和基于统计显著性检验的三大类性能度量指标,详细地讨论了分类学习算法各性能度量指标的提出背景、意义以及适用范围,分析了各种性能度量之间的差异,提出和分析了各方法中有待进一步研究的问题和方向。进一步,通过实验数据横向(每类度量中各方法之间的类内差异)和纵向(3类度量之间的类间差异)对照了各性能度量指标之间的差异,分析了各性能度量指标在分类算法选择上的一致性。

YANG Xingli.

Survey of performance measure index of classification learning algorithm

[J]. Computer Science, 2021, 48(8):209-219.

DOI:10.11896/jsjkx.200900216      [本文引用: 1]

In the research of classification task of machine learning,it is important for correctly evaluating the performance of the learning algorithm.In practical application,many performance measure indexes are proposed based on different perspectives.Three kinds of performance measure indexes based on error rate,confusion matrix and statistical test are introduced in this paper.The background,significance and scope of each measure index are discussed.The differences of different methods are analyzed.The future research problems and directions are also put forward and analyzed.Furthermore,the differences of these performance measure indexes are also compared by experimental data in portrait and landscape.The consistency of these performance measure indexes is also analyzed in classification algorithm selection.

/