基于卷积神经网络的配电网单相接地故障识别*
广西大学电气工程学院 南宁 530004
Identification of Single-phase-to-earth Fault in Distribution Network Based on Convolutional Neural Network
School of Electrical Engineering, Guangxi University, Nanning 530004
收稿日期: 2020-05-15 修回日期: 2020-07-29 网络出版日期: 2020-09-25
基金资助: |
|
Received: 2020-05-15 Revised: 2020-07-29 Online: 2020-09-25
作者简介 About authors
李宇,男,1995年生,硕士研究生。主要研究方向为配电网自动化技术,深度学习。E-mail:
杨柳林,男,1977年生,博士,副教授,硕士研究生导师。主要研究方向为电力系统分析与计算、深度学习、大数据及其应用等。E-mail:
配电网接地故障类型复杂,故障量常呈现间歇性和微弱性的特点,基于传统机器学习方法难以挖掘故障量的有效信息,限制了故障识别性能的提高。针对该问题,提出了一种基于卷积神经网络(Convolutional neural networks, CNN)自动提取故障特征的配电网接地故障识别方法。运用PSCAD软件构建配电网接地故障仿真模型,并由脚本程序生成CNN所需的海量样本集。搭建CNN框架,采用卷积和池化运算提取故障量的特征,以准确地刻画被识别的故障类型,并通过t-SNE方法可视化展示CNN提取故障特征的能力。进行CNN关键参数的调整以及优化算法的优选,以提升模型收敛速度和识别性能。结果表明,与传统机器学习方法相比,CNN模型识别准确率最高,且不受频率、故障位置、电压波动等干扰,并在配电网信息丢失以及注入谐波的情况下,验证了其容错性和适应性。
关键词:
The type of ground faults in distribution networks is complex, and the amounts of faults is often intermittent and weak. Based on traditional machine learning methods, it is difficult to mine the effective information of the amounts of faults, which limits the improvement of fault identification performance. Aiming at this problem, a method to identify ground faults based on convolutional neural network (CNN) to extract fault features automatically is proposed. PSCAD software builds a simulation model of the grounding fault of the distribution network, and the massive sample set required by CNN is generated by the script program. Build a CNN framework, use convolution and pooling operations to extract the characteristics of the fault amount to accurately characterize the identified fault type. The ability of CNN to extract fault features is demonstrated through t-SNE method. The adjustment of CNN key parameters and the selection of optimization algorithms are done to improve the model convergence speed and identification performance. The results show that, compared with traditional machine learning methods, the CNN model has the highest identification accuracy and is not disturbed by frequency, fault location, voltage fluctuations, etc. Its fault tolerance and adaptability are verified in the case of the distribution network information loss and harmonic injection.
Keywords:
本文引用格式
李宇, 杨柳林.
LI Yu, YANG Liulin.
1 引言
目前,在配电网发生接地故障识别研究中,文献[5]利用Hilbert-Huang transform(HHT)提取零序电压的故障特征量,用卷积神经网络(Convolutional neural networks,CNN)分类器对不同接地故障类型进行识别。文献[6]采用离散小波变换构造故障电压和电流的时频矩阵,基于粒子群算法和贝叶斯分类器对配电网高阻接地故障进行识别。文献[7]利用配电网母线电压、主变低压侧电流信息等构造时频矩阵,并对其进行奇异值分解得到故障特征奇异谱的分布参数,以多级支持向量机分类器进行故障分类。传统的识别方法主要是将人为设计的特征提取器和机器学习算法相结合来实现故障识别。但人工提取的故障特征一般不能够准确刻画被识别对象,其次,传统机器学习也容易出现过拟合,陷入局部收敛点等问题。深度学习作为机器学习的一个重要分支,在配电网故障选线[8]、电压暂降源识别[9]以及时间序列等领域已取得了重大进展,具有分类性能更佳、适应性更强等优点。因此,本文为了解决配电网单相接地故障识别的难题,保证配电网稳定运行以及下一步的运作,在深度学习理论下,建立具有自动提取故障特征的CNN来实现四种故障类型的识别。
2 CNN模型
2.1 CNN模型
CNN主要包括四种层:输入层、卷积层、池化层、输出层。输入层用$x\text{=}\left\{ {{x}_{\text{1}}},{{x}_{\text{2}}},\cdot \cdot \cdot ,{{x}_{n}} \right\}$表示。其中$x$表示一维矢量。卷积层的计算公式为
式中,${{W}^{i}}$为第$i$层卷积核大小;${{b}^{i}}$为第$i$层偏置矢量;$\sigma $为激活函数。
池化层通过对上层卷积运算结果进行下采样,即
全连接层是对池化层进行全连接到一个维度上,即
输出层采用softmax多分类器对上层结果进行输出,即计算公式为
在CNN的前向传播中,常用神经元的激活函数包括Sigmoid、Tanh、ReLU函数。池化主要包括平均池化和最大池化两种方式。对于降低模型过拟合风险,可采用正则化操作,即加入额外的惩罚参数以及在训练过程中限制连接权重等。对于多分类问题,代价函数多采用交叉熵的方法,并与softmax回归函数一起使用,softmax函数为
交叉熵函数为
式中,${{y}_{i}}$表示第$i$种出现的可能性大小;${{y}_{i\_}}$表示第$i$种期望输出。
表1 CNN架构表
网络层 | 参数 |
---|---|
输入层 | 输入矩阵$x\text{=}\left\{ {{x}_{\text{1}}},{{x}_{\text{2}}},\cdot \cdot \cdot ,{{x}_{n}} \right\}$ |
归化层 | 归化后矩阵${{x}^{'}}\text{=}\left\{ x_{\text{1}}^{'},x_{\text{2}}^{'},\cdot \cdot \cdot ,x_{n}^{'} \right\}$ |
卷积层C1 | 卷积大小$3\times 3$,核个数32,步长为1,ReLU激活,regularizer=0.000 1 |
池化层P1 | 最大池化,池化窗口$2\times 2$,步长为2,regularizer=0.000 1 |
卷积层C2 | 卷积大小$3\times 3$,核个数64,步长为1,ReLU激活,regularizer=0.000 1 |
池化层P2 | 最大池化,池化窗口$2\times 2$,步长为2,regularizer=0.000 1 |
全连接层1 | 神经元个数512,ReLU激活,dropout=0.5 |
全连接层2 | softmax函数输出四类 |
输出层 | 输出预测结果 |
CNN的反向传播中主要是优化各个模型参数,调整权重,以加速减小Loss值。为了寻找最合适的优化器,本文对常见的四种优化器进行了比较,包括随机梯度下降算法(Stochastic gradient descent, SGD)、动量优化法(Momentum)以及自适应Adadelta、Adam算法。SGD算法从一批样本随机选取一个样本进行模型权重系数的调整,参数更新 如下
式中,${{W}_{n}}$表示更新的参数;$\alpha $表示学习率;$f({{W}_{n}})$表示随机一个样本的梯度。
Momentum算法在SGD基础上,加入了一个动量,具有加快训练速度、减少训练过程振荡等优点。参数更新如下
式中,$\beta $表示动量的大小;${{V}_{n}}$表示过去一段时间加速度的积累。
Adadelta算法不需要指定全局学习率。Adam算法与随机梯度下降算法有所不同,是采用变化的学习率方法。
式中,$\nu $代表衰减梯度;$r$表示衰减学习率;$\delta $通常为一个常数。
2.2 数据降维与可视化
降维的方法主要有线性降维和非线性降维两种。目前有一种t-SNE方法[10],降维、聚类效果较好。该方法是将欧式距离转化为条件概率来衡量维度空间数据点之间的相似性。
在高维空间中第$i$样本与第$j$样本距离计算公式为
式中,${{\sigma }_{i}}$为高斯标准差,在第$i$样本与其他样本构成总的条件概率分布为${{p}_{i}}=\{{{p}_{1/i}},{{p}_{2/i}},\cdot \cdot \cdot ,{{p}_{i/i}},\cdot \cdot \cdot ,{{p}_{j/i}}\}$。
假设高维空间i、$j$样本映射到嵌入空间对应为m、n样本,则在嵌入空间相似度
在第$m$样本与其他样本构成总的条件概率分布为${{q}_{m}}=\{{{q}_{1/m}},{{q}_{2/m}},\cdot \cdot \cdot ,{{q}_{m/m}},\cdot \cdot \cdot ,{{q}_{n/m}}\}$。这样t-SNE总的目标就是去优化${{p}_{i}}$与${{q}_{m}}$的距离达到最小值。
3 数据集的生成以及特征的构建
3.1 数据集的生成
由于配电网各个采集装置性能存在差异,采样频率不同步,外界干扰大,很难形成一个统一、规范的单相接地故障样本集。因此本文采取自动、批量仿真的形式获取样本集。编写Python脚本程序,遍历修改配电网模型中的元件参数,并通过调用第三方自动化库与PSCAD进行交互,来形成整个自动化仿真流程,流程图如图1所示。选取在不同的过渡电阻、系统频率、故障位置、接地方式、故障初相角、系统电压以及负荷波动下进行仿真,参数值分布如表2所示。仿真结果总样本量为10 800个,其中每类故障样本量为2 700个,并对每类按照 8:1:1的比例随机分成训练集、验证集和测试集。训练集用于模型训练,验证集样本用于模型调整参数,测试集样本用于模型准确率测试。
图1
表2 参数值分布情况
故障类型 | 故障电阻/kΩ | 系统频率/Hz | 故障位置 | 接地方式 | 初相角度/(°) | 负荷/MVA | 系统电压/kV |
---|---|---|---|---|---|---|---|
间歇性电弧 | — | 49.8, 50.0, 50.2 | L1线路总长的10%, 20%, 30%, 40%, 50% | 中性点不接地和消弧接地 | 0, 30, 60, 90, 120, 150 | 1.615 0, 1.657 5, 1.700 0, 1.742 5, 1.785 0 | 105, 110, 115 |
稳定性电弧 | |||||||
线性低阻 | 0.01, 0.10, 0.30, 0.50, 0.70, 0.90 | — | 0, 60, 120 | ||||
非线性高阻 | 1.0, 1.5, 2.0, 2.5, 3.0, 3.5 |
3.2 初始特征的构建
本文所研究的是辐射配电网接地故障识别,结合理论与大量试验分析,在一条支路发生单相接地故障时,提取主变压器低压侧母线处的三相电压、零序电压以及故障馈线零序电流共五个电气量作为样本训练数据。设置故障发生周期为三个周波,为了丰富样本信息,提取故障发生前、完成后各一周波的信息,即共采集故障信息五个周波,时间长度为0.1 s的数据。以低阻接地故障为例,单个样本数据如图2所示。波形采样率为$10\ \text{kHz}$,样本数据大小为1 000$\times $5。样本数据对应的标签采用一维数组表示,发生某类故障的相应位表示为1,其他位表示为0。设低阻故障为第三类故障,则第三位为1,其他位为0,因此,对应的标签表示为$y=[0,0,1,0]$。其他故障类型采用相同的方法进行故障样本与标签之间的对应,以便模型进行监督性的学习。
图2
不同的电气量的数量级具有差异性,因此有必要对数据样本进行归一化处理,一方面是为了提高数据之间的可比性,以防止训练梯度爆炸;另一方面是为了加快训练速度和提高训练准确率。对于故障量在特定数据范围内波动,采用最大值-最小值标准化方法,使故障量大小降落到[0, 1]。
4 配电网模型搭建与故障仿真
图3
表3 线路参数值
线路类型 | ${{R}_{\text{1}}}$./$(\Omega /\text{km)}$ | ${{L}_{\text{1}}}$/$\text{(mH/km)}$ | ${{C}_{\text{1}}}$/$\text{(nF/km)}$ | ${{R}_{0}}$/$(\Omega /\text{km)}$ | ${{L}_{0}}$/$\text{(mH/km)}$ | ${{C}_{0}}$/$\text{(nF/km)}$ |
---|---|---|---|---|---|---|
架空线 | 0.17 | 1.21 | 9.7 | 0.23 | 5.48 | 5.4 |
电缆 | 0.27 | 0.26 | 339.0 | 2.70 | 1.02 | 280.0 |
(1) 通过自定义组件搭建电弧模型,设置关键参数,以A相接地故障为例,仿真出电弧电压、电弧电流如图4所示。
图4
(2) 配电网发生非线性高阻接地故障的仿真,采用经典的伊曼纽尔模型。根据搭建的10 kV配电网模型,进行A相非线性高阻接地仿真,仿真结果故障点电流如图5所示。
图5
由图5可知,仿真结果能够很好地反映非线性高阻接地故障特点。故障点处电流呈现间歇性且幅值大小不一。
5 试验与分析
5.1 CNN训练结果
本文仿真试验在个人计算机(Windows 10,内存8 GB,CPU 2.4 GHz)上完成。CNN采用Python 3.5.2和TensorFlow深度学习框架搭建,TensorFlow-GPU版本为1.14.0。SVM采用Sklearn库搭建,scikit-learn版本为0.21.3。
将训练集和验证集样本批量喂入CNN模型,一次批量分别喂入64个和32个故障样本,迭代200次,并采用SGD算法、Momentum算法、自适应Adadelta和Adam四种优化算法对训练结果进行对比。四种算法训练准确率和验证准确率如图6所示。
图6
图7
同样搭建MLP(Multi-layer perceptron)、支持向量机(Support vector machine, SVM)[13]两种模型,与CNN模型进行对比。MLP含有两层隐含层,每一层隐含层包含256个神经单元,其他优化过程和参数与CNN一样,采用L2正则化,惩罚系数为0.000 1,dropout=0.5,激活函数采用ReLU,权重优化为Adam算法,迭代次数为200次。
由于SVM输入数据必须为一维矢量,而直接将故障信息矩阵转换为一维矢量,产生的维度较高,造成SVM训练困难。因此,先采用t-SNE方法对故障信息矩阵进行降维。为了保证SVM模型最优,采用径向基核函数,惩罚系数分别设置为C=1,5,10,12,14,16,20,使用网格搜索法寻优。SVM训练和验证准确率结果如图8所示。
图8
从图8可知,随着惩罚系数C值增加,训练准确率和验证准确率不断提高,但在惩罚系数C值过大时,验证准确率反而出现了下降,表明此时SVM模型发生了过拟合。结合训练准确率和验证准确率,选取惩罚系数为12,以获得SVM最优训练模型。
图9
从表4可以看到,CNN模型识别效果最好,准确率达到99.72%。SVM模型较CNN低了6.66%,识别效果不佳。MLP模型的准确率达到98.80%,但与CNN还有一定的差距。从F1综合指标来看,CNN的F1值和准确率保持一样,而SVM、MLP的F1值较准确率指标出现了些微下降。
图10
从图10可知,3故障类型与4故障类型在底层数据上较接近,MLP难以挖掘有效故障特征,造成识别困难。另外,通过大量试验分析,3故障类型和4故障类型的频率特征有着较大的差异。因此,可利用小波变换提取故障量的频率特征,并再结合底层数据,即在这两者数据共同作用下来训练MLP模型,但同时也会增加模型的计算量。
CNN模型通过卷积和池化运算,自动提取底层数据的特征,无需添加额外的故障特征,并且较前几种模型识别错误数量更少,总体识别精度更高。
5.2 CNN提取故障特征分析
为了分析CNN提取故障特征的过程,本文选取四类故障共2 160个样本。采用t-SNE对CNN迭代次数在0、50、100、200下的全连接层输出结果分别降维到四个x-y二维平面上,并归一化到[0, 1]。结果如图11所示。
图11
从图11可以看出,随着迭代次数的增加,CNN具有良好的自动提取故障特征的能力,四种故障类型逐渐分开,同时也进一步展现了CNN模型优越的识别性能。
5.3 对比分析
表5 对比结果
6 模型适应性分析
6.1 数据丢失
6.2 谐波注入
配电网在新能源、储能装置等接入下,会向其中注入大量的谐波。因此,考虑配电网在谐波注入的情况下,测试模型的识别性能。假设谐波注入相为A相,注入幅值大小为0.1 kA,注入的频率为50~100 Hz。在不同的负荷、电压、频率、接地电阻下,一共仿真360个在注入谐波下的测试样本。采用SVM、MLP、CNN模型对此样本进行测试,结果如表8所示。
从表8可以看出,在注入谐波的情况下,SVM、MLP识别准确率受到较大的影响,出现了10%的下降,而CNN识别准确率和F1指标依然在94%以上。CNN模型受谐波的影响更小,能够很好地应对电力系统谐波干扰。
7 结论
(1) 运用PSCAD仿真软件完成四种单相接地故障类型的仿真,并构建海量故障样本集及标签。
(2) 搭建CNN模型,并采用正则化处理和Adam优化算法,通过与传统机器学习算法SVM、MLP进行了对比,CNN的识别准确率最高,达到99.72%。
(3) 采用t-SNE对故障样本进行降维、聚类,做出二维可视化散点图,展现了CNN自动提取故障特征的能力。
(4) 在配电网故障信息丢失以及注入谐波的情况下,验证了CNN的容错性和鲁棒性。
参考文献
韧性背景下的配网故障恢复研究综述及展望
[J].
Review and prospect of distribution network fault recovery under the background of toughness
[J].
小电流接地系统铁磁谐振过电压关键影响因素辨识
[J].
Research on key influencing factors of ferroresonance fault in ineffective grounding system
[J].
配电网故障检测与保护方法研究
[D].
Research on fault detection and protection of distribution network
[D].
小电流接地故障多层次分类及其识别模型
[J].
Multilevel classification and identification model for earth faults in non-solidly earthed network
[J].
A fault pattern and convolutional neural network based single-phase earth fault identification method for distribution network
[C]// 2019 IEEE Innovative Smart Grid Technologies-Asia (ISGT Asia),Chengdu,
基于PSO和贝叶斯分类器的配电网高阻接地故障识别技术
[J].
High impedance ground fault identification technology based on PSO and Bayes classifier
[J].
基于LCD-Hilbert谱奇异值和多级支持向量机的配电网故障识别方法
[J].
Identification method of distribution network faults based on singular value of LCD-Hilbert spectrums and multilevel SVM
[J].
基于卷积神经网络的配电网单相接地故障选线方法:中国,CN108279364A
[P].
Single-phase grounding fault line selection method of distribution network based on convolutional neural network:China,CN108279364A
[P].
基于深度学习模型融合的电压暂降源识别方法
[J].
Recognition method of voltage sag sources based on deep learning models’ fusion
[J].
Parametric nonlinear dimensionality reduction using kernel t-SNE
[J].DOI:10.1016/j.neucom.2013.11.045 URL [本文引用: 1]
Deep- learning-based fault classification using Hilbert-Huang transform and convolutional neural network in power distribution systems
[J].DOI:10.1109/JSEN.7361 URL [本文引用: 1]
通信和电网联合仿真的配电网局部异常因子故障辨识算法
[J].
A local outlier factor fault identification algorithm based on the co-simulation between cyber and power system for distribution network
[J].
系统薄弱点电压分布特性分析及识别方法
[J].
Analysis and identification method of voltage distribution characteristics of system weak point
[J].
基于神经逻辑网络冗余纠错和FNN组合的配网高容错性故障定位
[J].创造性提出了基于多值神经逻辑网络(MNLN)冗余纠错和前馈神经网络(FNN)组合的配网故障定位原理和实现方法.根据配网SCADA系统汇集的信息具有冗余特征,及配网拓扑结构的关联性可获得各馈线终端单元(FTU)信息之间的冗余关系,提出了基于MNLN原理的信息冗余纠错的模型及逻辑推理规则.经过纠错处理的、无畸变的信息即形成故障定位FNN模型的输入矢量集.文中所提出原理和方法对配电网具有广泛的通用性,具高容错性能和重要实用价值.
Fault section diagnosis with high fault-tolerance performance for distribution networks based on the combination of neural logic network redundant error correct and FNN
[J].创造性提出了基于多值神经逻辑网络(MNLN)冗余纠错和前馈神经网络(FNN)组合的配网故障定位原理和实现方法.根据配网SCADA系统汇集的信息具有冗余特征,及配网拓扑结构的关联性可获得各馈线终端单元(FTU)信息之间的冗余关系,提出了基于MNLN原理的信息冗余纠错的模型及逻辑推理规则.经过纠错处理的、无畸变的信息即形成故障定位FNN模型的输入矢量集.文中所提出原理和方法对配电网具有广泛的通用性,具高容错性能和重要实用价值.
配电网中谐波传递特性研究
[J].
DOI:10.11985/2019.02.015
URL
[本文引用: 1]
从谐波电流和谐波电压两个方面研究了谐波在配电网中的传递特性,通过公式推导分析了谐波电流在相同和不同电压等级系统中的传递规律。在未投入滤波装置时,谐波电流主要流入上级系统;而当谐波电流注入上级系统后,从低压侧向高压侧传递时,传递系数与变压器电压比有关。详细分析了上级电网谐波电压向本级电网负荷侧的传递过程,结果表明上级电网的谐波电压在配电网中传递时主要集中在本级电网的负荷等效阻抗上;投入滤波器后,上级电网的谐波电压传递主要集中在本级电网的系统阻抗上。最后通过算例仿真验证了结论的准确性。
Research on harmonic transfer characteristics in distribution network
[J].
DOI:10.11985/2019.02.015
URL
[本文引用: 1]
从谐波电流和谐波电压两个方面研究了谐波在配电网中的传递特性,通过公式推导分析了谐波电流在相同和不同电压等级系统中的传递规律。在未投入滤波装置时,谐波电流主要流入上级系统;而当谐波电流注入上级系统后,从低压侧向高压侧传递时,传递系数与变压器电压比有关。详细分析了上级电网谐波电压向本级电网负荷侧的传递过程,结果表明上级电网的谐波电压在配电网中传递时主要集中在本级电网的负荷等效阻抗上;投入滤波器后,上级电网的谐波电压传递主要集中在本级电网的系统阻抗上。最后通过算例仿真验证了结论的准确性。
/
〈 |
|
〉 |
