基于决策树支持向量机算法的电力变压器故障诊断研究
Research on Power Transformer Fault Diagnosis Based on Decision Tree Support Vector Machine Algorithm
收稿日期: 2019-04-3 网络出版日期: 2019-12-25
Received: 2019-04-3 Online: 2019-12-25
作者简介 About authors
孙志鹏,男,1994年生,硕士研究生。主要研究方向为高压电力设备故障。E-mail:1454276041@qq.com
支持向量机算法和决策树算法均广泛应用于电力变压器故障诊断当中。与其他分类算法相比,支持向量机的泛化性能较强,但分类效率较低,而决策树算法的有较高的分类效率。提出了一种基于分类决策树的电力变压器故障诊断模型,对于靠近决定边界的样本点用支持向量机分类,其余样本用决策树分类。经实例证明,该方法有很高的分类准确率。
关键词:
Support vector machine algorithms and decision tree algorithms are widely used in power transformer fault diagnosis. Compared with other classification algorithms, the generalization performance of support vector machines is stronger, but the classification efficiency is lower. The decision tree algorithm has higher classification efficiency. A power transformer fault diagnosis model based on classification decision tree is proposed. The sample points close to the decision boundary are classified by the support vector machine, and the remaining samples are classified by the decision tree. The example proves that the method has high classification accuracy.
Keywords:
本文引用格式
孙志鹏, 孙志龙, 魏建.
SUN Zhipeng.
1 引言
2 分类决策树
分类决策树模型是一种描述对实例进行分类的树形结构。决策树由结点和有向边组成。结点又分为内部节点和叶子节点。内部节点表示一个特征或属性,叶子节点表示一个不能再分的类别。分类的时候,从根节点开始,对实例的某一个特征进行测试,根据测试结果,将实例分配到其子结点;此时,每一个子结点对应着该特征的一个取值。如此递归向下移动,直至达到叶结点,最后将实例分配到叶子结点的类中。
3 支持向量机理论
3.1 支持向量机
支持向量机是在统计学习的基础上发展起来的一种新的机器学习方法。其基本思想是,在线性可分的情况下,寻找最优分类超平面在原空间将两类样本完全分开,在非线性的情况下,采用核的方法将一个在低维空间非线性的问题转化成高维空间线性可分的问题来求解。设最优分类超平面的表达式为
式中,w为权重;b为偏差。
因此,原样本空间的两分类问题就可以表示为
式中,yi∈[-1,1],为输出类别。
鉴于有些样本可能分错,引入松弛变量$\varepsilon_{i}$和惩罚因子C,则超平面的约束条件变为
引入Lagrange乘子$\alpha_{i}$,将原问题转换为对偶问题,即
根据Kuhn-Tucker条件,αi必须满足
因此,$\alpha_{i}$对应的不为零样本即为支持向量。求解上述问题,得到最优分类函数
式中,$K(x,x_{i})=\varphi^{T}(x)\varphi(x_{i})$为核函数;m为支持向量的数目。
3.2 SVM中核函数及核函数选择
核函数的种类很多,如线性核函数、多项式核函数、径向基核函数等。对于核函数的选取,目前仍没有统一的定论,一般根据专家的先验知识预先选定核函数。本文选用的核函数是径向基核,其表达式为
式中,u,v表示数据集的两个样本,g用来设置核函数中的$\gamma$参数设置,即公式中的$\gamma$。
4 决策树支持向量机
原始的支持向量机只适用于二分类问题。用于多分类问题时必须对支持向量机加以改造。常见的方法有一对一、一对多模型等。决策树支持向量机也是一种常见的多分类模型,它结合支持向量机二分类的特点,将多类别分类的各个类别按照决策树多子类分类重新组合,能够较为准确地识别所有类别。对于k分类问题,该方法在训练时首先需要建立k(k-1)/2个分类决策面,但是在每个节点预测时排除了许多类别的可能性,因此用到的总分类面的个数为k-1个,分类效率有很大的提升。图1为该算法解决一个四分类问题的示意图。
图1
5 诊断过程
电力变压器故障识别对象最常见的有4种状态:高能放电、低能放电、局部放电和高温过热。基于支持向量机多分类模型的电力变压器故障识别过程,包括变压器故障状态的特征提取、数据的归一化、最优参数确定、模型建立与测试等步骤。
(1) 特征提取。
用于变压器故障诊断的油中溶解特征气体主要有:H2、CH4、C2H6、C2H4和C2H2 5种气体,它在一定程度上携带电力变压器的高温过热、高能放电、低能放电、局部放电和中低温过热5种故障信息,故可作为特征气体。
(2) 数据归一化。
为降低各种气体之间由于量值差异造成的影响,对DGA原始数据(包括训练集和测试集)都进行了归一化处理,具体公式为
式中, $x_{i}$为实际的气体含量;$x_{max}$为同一样本5种气体含量最大值;$x_{min}$为同一样本5种气体含量最小值;$x'_{i}$为归一化后的数据。
(3) 最优参数的确定。
(4) 将得到的优化参数代入到支持向量机电力变压器故障诊断模型中,得到相应的分类模型。
(5) 利用训练好的分类模型,对待测试的样本进行测试。
6 实例验证
表1 各支持向量机隶属度输出结果
序号 | ①V② | ②V③ | ③V④ | ①V④ |
---|---|---|---|---|
1 | 0.901 | -0.347 | -0.623 | 0.810 |
2 | 0.865 | -0.500 | 0.871 | -0.755 |
3 | -1.000 | 0.672 | 0.439 | -0.765 |
4 | -0.985 | 0.665 | -0.751 | -0.500 |
5 | -0.800 | 0.578 | 0.768 | -0.233 |
6 | 0.780 | -0.662 | 0.500 | -0.855 |
7 | 1.000 | 0.450 | -0.872 | 0.766 |
8 | 0.676 | -0.671 | -0.662 | -0.865 |
表2 决策树支持向量机分类结果
序号 | 故障1 | 故障2 | 故障3 | 故障4 | 结果 |
---|---|---|---|---|---|
1 | 2 | 0 | 1 | 1 | 高能放电 |
2 | 1 | 0 | 2 | 1 | 局部放电 |
3 | 0 | 2 | 1 | 1 | 低能放电 |
4 | 0 | 1 | 0 | 2 | 高温过热 |
5 | 0 | 2 | 1 | 1 | 低能放电 |
6 | 1 | 0 | 2 | 1 | 局部放电 |
7 | 2 | 1 | 0 | 1 | 高能放电 |
8 | 1 | 0 | 1 | 2 | 高温过热 |
表3 故障类型数据
编号 | H2 | CH4 | C2H6 | C2H4 | C2H2 | 实际故障 |
---|---|---|---|---|---|---|
1 | 100 | 94 | 22 | 304 | 118 | 高能放电 |
2 | 346 | 58 | 54 | 14 | 0 | 局部放电 |
3 | 46.7 | 8.2 | 1.8 | 5.1 | 4.1 | 低能放电 |
4 | 90 | 160 | 54 | 330 | 29 | 高温过热 |
5 | 49.1 | 12.2 | 0.3 | 3.9 | 4.8 | 低能放电 |
6 | 230 | 106 | 42 | 17 | 0 | 局部放电 |
7 | 250 | 63 | 2.8 | 66 | 120 | 高能放电 |
8 | 181 | 316 | 115 | 593 | 2 | 高温过热 |
7 结论
针对传统的电力变压器故障诊断存在的不足,本文提出了一种基于决策树支持向量机的电力变压器故障诊断模型。该模型充分结合了两种算法的优点,消除了分类重叠区和拒绝分类区,提高了分类效率,因而有更广的使用价值。
参考文献
应用多分类多核学习支持向量机的变压器故障诊断方法
[J].
A fault diagnosis method for power transformer based on multiclass multiple-kernel learning support vector machine
[J].
遗传支持向量机在电力变压器故障诊断中的应用
[J].
The application of genetic support vector machine in power transformer fault diagnosis
[J].
一种新颖的电力变压器故障诊断方法研究
[J].
Research of a new fault discrimination system for electric transformer test
[J].
决策树算法的容错性研究及其应用
[J].
Research on fault tolerance of decision tree algorithms and its application
[J].
高宁化,王姮,冯兴华. 基于动态模糊决策树的心电信号分类方法
[J/OL].
Gao Ninghua,Wang Heng,Feng Xinghua. Classification method of ECG signal based on dynamic fuzzy decision tree
[J/OL].
基于遗传算法优化的支持向量机在变压器故障诊断中应用
[J].
Application of the support vector machine in the fault diagnosis on the transformer based on the optimal genetic algorithm
[J].
变压器常见故障与诊断技术研究
[J].
Research on common faults and diagnosis technology of transformer
[J].
基于关联气体和遗传算法优化支持向量机的电力变压器故障检测
[J].
Power transformer fault detection based on associated gas and genetic algorithms to optimize support vector machine
[J].
综合遗传优化支持向量机的变压器故障诊断模型
[J].
Fault diagnosis model of power transformers based on GA optimization SVM
[J].
数据挖掘技术决策树分类算法(ID3算法)研究
[J].
Research on decision tree classification algorithms of data mining technology (ID3 algorithms)
[J].
决策树C4.5算法改进与应用
[J].
Improvement and application of decision tree C4.5 algorithm
[J].
基于最优二叉决策树分类模型的奶牛运动行为识别
[J].
Cow movement behavior classification based on optimal binary decision-tree classification model
[J].
/
〈 |
|
〉 |
