弓网滑动电接触失效的影响因素分析与研究*
Analysis and Research on Influencing Factors of Pantograph-catenary Sliding Electrical Contact Failure
通讯作者: 陈雪莲,女,1996年生,硕士研究生。主要研究方向为电机与电器。E-mail:2211563190@qq.com
收稿日期: 2022-01-26 修回日期: 2022-05-25
| 基金资助: |
|
Received: 2022-01-26 Revised: 2022-05-25
作者简介 About authors
回立川,男,1980年生,博士,副教授。主要研究方向为电机与电器。E-mail:
孟嗣博,男,1996年生,硕士研究生。主要研究方向为电机与电器。E-mail:
为了研究影响因素对弓网滑动电接触失效的影响程度问题,采用自制的滑动电接触试验机对试验数据进行测量。首先,使用斯皮尔曼等级相关系数分析各因素和电流稳定系数之间的相关性;其次,采用RF、LightGBM和XGBoost算法对影响弓网滑动电接触失效的因素进行重要性排序;最后,利用网格搜索和交叉验证方法对XGBoost模型的参数进行调优,为了解影响因素对GC-XGBoost模型预测结果的影响,引入SHAP归因理论对模型进行解释分析。结果表明,弓网滑动电接触失效的影响因素重要度从高到低依次为波动压力幅值、接触电流、滑动速度和波动频率;XGBoost模型的各评价指标值相较于其他模型最优,经优化后的GC-XGBoost模型的拟合度提高了5.72%,误差精度达到最低;SHAP模型从整体与局部揭示了影响因素对滑动电接触失效的影响规律,帮助研究人员更好地解决电气化铁路中弓网系统接触失效的问题。
关键词:
In order to study the influence degree of influencing elements on pantograph-catenary sliding electrical contact failure, the self-made sliding electrical contact experimental machine is used to measure the experimental data. Firstly, the correlation between each factor and current stability coefficient is analyzed by using the Spearman’s rank correlation coefficient. Secondly, the significance of the influencing elements of pantograph-catenary sliding electrical contact failure is ranked by the use of RF, LightGBM and XGBoost algorithms. Finally, the grid search and cross validation strategies are used to optimize the parameters of the XGBoost model. In order to understand the influence of influencing factors on the prediction results of GC-XGBoost model, SHAP attribution theory is added to explain and analyze the model. The results show that the order of importance of influencing factors of pantograph-catenary sliding electrical contact failure is fluctuating pressure amplitude, contact current, sliding speed and fluctuation frequency from high to low. Compared with other models, the evaluation index values of XGBoost model are the best, and the fitting degree of the optimized GC-XGBoost model is improved by 5.72%, and the error accuracy is the lowest. SHAP model reveals the influence law of influencing factors on sliding electrical contact failure from the whole and local aspects, and helps researchers better solve the contact failure problem of pantograph-catenary system of electrified railway.
Keywords:
本文引用格式
回立川, 陈雪莲, 孟嗣博.
HUI Lichuan, CHEN Xuelian, MENG Sibo.
1 引言
随着高速列车逐步提速,弓网接触的可靠性和受流稳定性等问题愈发突出,受电弓与接触网之间难以保持良好的接触导电性。滑动速度、接触电流、波动载荷压力等因素都会导致滑动电接触的接触区发生各种非常复杂的物理和化学接触现象,从而引起接触材料软化、腐蚀和温升等,进而改变电流稳定系数,造成弓网受流不稳定、接触不可靠,加剧受电弓滑板和接触网导线的磨损,造成噪声污染,长期不稳定的受流会直接损坏受电弓和接触网系统,这将严重影响高速铁路的安全可靠运行[1]。
目前,国内外都对电接触失效做了大量研究,张继华等[2]通过测量不同条件下的电流稳定系数,结合其失效判据,得出了不同条件下可靠接触的临界条件。陈忠华等[3]通过对弓网滑动电接触失效机理的研究,提出了相应的失效判据并建立失效概率模型,进而得出弓网接触在一定条件下的失效概率。李庆娅[4]从不同方面探索了电接触失效对时频域特征变化、调制信号传输、电磁辐射特性的影响以及环境应力作用下的可靠性预计。ZHANG等[5]研究了连接器的电接触失效机理,为了评估和量化电接触失效状态,建立了高频接触阻抗模型来表示微物理特性与电参数之间的关系。LI等[6]研究了微动对同轴连接器接触失效的影响,基于传输线理论和电接触理论建立了等效模型并进行了分析,为连接器在振动环境下的行为提供了理论依据。ZHANG等[7]借助扫描电子显微镜对银锡氧化物触点材料的动态焊接失效进行分析,发现材料的传递和分配是继电器接触焊接失效的根本原因。
弓网系统运行中,滑动速度、接触电流、波动载荷压力和波动频率综合作用导致受电弓滑板和接触网导线间的接触失效[8],但它们对接触失效的影响程度还缺乏相关的理论依据。因此,对影响弓网滑动电接触失效的因素进行深入研究是非常有意义的。
本文利用自行研制的滑动电接触试验机,测量不同试验参数下的电流稳定系数,通过电流稳定系数失效判据判断弓网是否出现接触失效;然后通过测量的数据建立以下四种模型,分别是支持向量回归(Support vector regression,SVR)、随机森林(Random forest,RF)、轻量级梯度提升机(Light gradient boosting machine,LightGBM)和极限梯度提升(eXtreme gradient boosting,XGBoost)模型,并计算平均绝对误差(Mean absolute error,MAE)、平方绝对百分误差(Mean absolute percentage error,MAPE)、方均根误差(Root mean squared error,RMSE)和决定系数(Coefficient of determination),对各模型的优劣展开评估,证明了XGBoost算法的预测精度高、拟合能力强;利用网格搜索和交叉验证方法对XGBoost模型进行参数调优,建立电流稳定系数预测模型;利用斯皮尔曼等级相关系数热力图分析滑动速度、接触电流、波动压力幅值、波动频率与电流稳定系数之间的相关性,同时通过RF、XGBoost和LightGBM的特征重要性排序比较分析,得出影响滑动电接触失效的四个主要因素的排序结果;最后建立SHAP(SHapley Additive exPlanation)模型将黑箱模型转化为容易理解的分析图,更清楚地展示出滑动速度、接触电流、波动压力幅值和波动频率是如何影响电流稳定系数使弓网出现接触失效的。
2 弓网滑动电接触失效分析
2.1 弓网滑动电接触失效判据
式中,ε为电流稳定系数;ξ为压力稳定系数;σ为接触压力的标准差;
2.2 数据概况
为了研究滑动速度、接触电流、波动压力幅值和波动频率对弓网滑动电接触失效的影响,采用浸金属碳滑板和纯铜导线进行载流稳定性试验,试验机如图1所示。试验机将标称截面积为120 mm2的纯铜导线镶嵌到转盘边缘的凹槽内,用来仿效弓网中的接触网导线,将浸金属碳滑板固定于横向滑台上用来仿效机车升降弓上的受电弓滑板,通过导线和滑板的相对滑动来模拟实际列车弓网间的“之”字形运动轨迹,利用LabVIEW建立上位机平台实时测量和保存接触电压、接触电流、滑动速度等参数,便于后期数据处理。根据文献[2]对高速列车的可靠性分析,研究影响弓网接触可靠性和稳定性的主要因素对电流稳定系数的影响程度,主要影响因素分别为滑动速度、接触电流、波动压力幅值和波动频率。参考课题组对弓网滑动电接触失效的研究,本次试验基准压力F0分别设定为60 N、70 N、80 N、90 N;压力波动幅值F分别为±10 N、±20 N、±30 N、±40 N;滑动速度v分别设定为40 km/h、80 km/h、120 km/h、160 km/h;接触电流I分别设定为100 A、150 A、200 A、250 A;波动频率f分别设定为1 Hz、2 Hz、3 Hz、4 Hz。每次的试验时间设置为7 min,以便数据采集卡能够收集到足够的试验数据,然后删除试验开端滑板与导线磨合期产生的不稳定数据,以便获得滑板与导线良好接触时的试验数据,最后计算每一个条件下的电流稳定系数,判断滑动电接触是否失效。
图1
2.3 数据测量结果分析
由图2可知,滑动速度为40~80 km/h时,电流稳定系数相差不大;大于80 km/h时,电流稳定系数随着滑动速度的加快逐渐升高,滑板摩擦振动和接触表面磨损加剧,磨损颗粒和氧化膜碎片积聚在表面,弓网间接触状态变差,弓网受流变得不稳定。
图2
图3
图4
图5
由图6可知,随着基准压力的增加,电流稳定系数急剧下降,弓网系统稳定性增加,基准压力过小时,弓网系统离线次数增加,产生高温电弧烧蚀,导致接触表面粗糙度增加,受电弓滑板与接触网导线间接触状态变差,受流质量下降。可见这四个影响因素都对滑动电接触失效产生了巨大的影响,但具体的影响程度还未可知,因此本文对其进行深入研究。
图6
3 模型构造
3.1 XGBoost模型
设X为影响滑动电接触失效的样本集合(包括滑动速度、接触电流、波动压力幅值等特征),Y为电流稳定系数,给定训练数据集为
(1) 采用K次迭代的结果作为输出结果,定义
(2) 电流稳定系数预测模型训练过程中的目标函数如式(3)所示
式中,l是误差函数,体现了模型拟合训练数据的程度;
(3) 结合式(3)和式(5)可得
(4) 将目标函数做二阶泰勒展开,并引入正则项,如式(7)所示
式中,
(5) 定义
目标函数
并计算出相应的目标函数最优值如式(10)所示
(6) 信息增益的计算方式如下
式中,
3.2 SHAP模型
基于XGBoost算法进行训练可得到精度较高的预测模型,但XGBoost属于黑箱模型,解释能力较弱。LUNDBERG等[15]于2017年提出SHAP归因理论,用以解释各种模型,其核心思想是计算特征对模型输出的边际贡献,再从全局与局部两个角度解释模型。因此,本文采用SHAP值对模型中影响滑动电接触失效的因素进行解释分析,用来增强模型的可解释性。
假设第i个样本的第j个特征为
式中,
3.3 模型评价指标
为了评价不同模型的预测精度和拟合效果,防止单一的评价指标带来误差,本文采用MAE、MAPE、RMSE和R2四个评价指标对模型性能进行比较,计算公式如式(14)~(17)所示。MAE、MAPE与RMSE的值越小,模型的预测值越接近真实值,预测精度越高;R2值越趋近于1,模型的拟合能力越好。
4 试验结果及讨论
4.1 各模型性能对比
本次选取103组数据进行试验,其中训练集样本数占样本总数的70%,其余的30%作为测试数据对模型进行检验。
本次试验主要从MAE、MAPE、RMSE和R2四方面分析各个模型的优劣,结果如表1所示。在模型误差方面,四个模型在MAE、MAPE和RMSE指标上的差距并不明显,而XGBoost模型的值均小于SVR、RF和LightGBM,因此其带来的误差最小;在拟合效果方面,XGBoost算法模型的R2值最高,可以达到0.888 2,而除了RF可以达到0.858 7以外,其余两个算法的R2值较小,说明XGBoost模型的拟合能力相对最好。综上所述,XGBoost算法在滑动电接触的电流稳定系数预测方面的能力显著优于SVR、RF和LightGBM算法,可以较好地反映电流稳定系数与影响因素之间的复杂关系。因此,本文选用XGBoost算法,并对其参数进行调优(见第 4.2节)。
表1 模型性能对比
| 模型 | MAE | MAPE | RMSE | |
|---|---|---|---|---|
| SVR | 0.064 0 | 0.135 4 | 0.004 1 | 0.758 1 |
| RF | 0.048 5 | 0.070 9 | 0.002 1 | 0.858 7 |
| LightGBM | 0.099 5 | 0.142 5 | 0.009 9 | 0.420 4 |
| XGBoost | 0.026 5 | 0.063 5 | 0.000 7 | 0.888 2 |
4.2 XGBoost模型参数调优
XGBoost超参数较多,不同的参数具有不同的功能,参数的合理设定直接影响模型的好坏。由于全部优化运行时间较长,对计算机配置要求较高,因此本文选取5个影响最大的超参数进行调优,以提高模型的性能。
表2 XGBoost参数调优结果
| 参数名 | 默认值 | 最优值 |
|---|---|---|
| colsample_bytree | 1 | 0.82 |
| subsample | 1 | 0.53 |
| n_estimators | 100 | 95 |
| learning_rate | 0.1 | 0.06 |
| max_depth | 3 | 4 |
表3 原模型与优化模型性能对比
| 模型 | MAE | MAPE | RMSE | |
|---|---|---|---|---|
| XGBoost | 0.020 0 | 0.063 5 | 0.026 5 | 0.888 2 |
| GC-XGBoost | 0.015 2 | 0.049 0 | 0.020 0 | 0.945 4 |
图7
4.3 斯皮尔曼等级相关系数
接触网正常运行是电气化铁路安全运营的前提[17]。电流稳定系数是判断滑动电接触是否失效的重要标准,电流稳定系数越小,弓网接触越可靠。为评估各影响因素与电流稳定系数之间的关系,采用斯皮尔曼等级相关系数[18]来衡量两者的相关程度。相关系数的绝对值越大,则影响因素与电流稳定系数之间的相关性越强。根据测得的数据可以得到各因素与电流稳定系数的相关性热力图,如图8所示。呈正相关的因素相关性越高,则图形颜色越浅,呈负相关的因素相关性越高,则图形颜色越深。根据热力图下边第一行可以看出,波动压力幅值、滑动速度与电流稳定系数之间呈正相关,接触电流、波动频率与电流稳定系数之间呈负相关,说明波动压力幅值或滑动速度的增加都会使电流稳定系数增大,更容易造成弓网滑动电接触失效,接触电流或波动频率的增加都会使电流稳定系数越减小,弓网接触可靠性增加。这与第2.3节的试验结果相同,证明了所采用的方法是可行的。从图8还可以得知,波动压力幅值与电流稳定系数之间的相关性最大,说明波动压力幅值是对电流稳定系数影响最大的因素。
图8
4.4 特征重要性排序结果
由图9~11可知,四个特征对电流稳定系数影响最大的是波动压力幅值,其次是接触电流和滑动速度,对电流稳定系数影响最小的是波动频率。可见波动压力幅值和接触电流这两个特征是影响滑动电接触是否发生接触失效最关键的因素。在斯皮尔曼等级相关系数分析结果中,这两个特征与电流稳定系数的相关性也较高,进一步证明了本文选用算法的可行性。RF、LightGBM和XGBoost三种算法基于不同的特征重要性排序原理得到相似的排序结果,证明了排序结果的可靠性。
图9
图10
图11
4.5 基于SHAP的模型解释分析
XGBoost模型的各项性能均优于其他模型,因此引入SHAP模型对GC-XGBoost模型进行解释分析。图12所示为SHAP特征分析概要图,y轴按照特征的重要性,从大到小排名分别是波动压力幅值、接触电流、滑动速度和波动频率。x轴表示特征对应的SHAP值,颜色越浅代表特征值越小,颜色越深代表特征值越大[19]。其中波动压力幅值和滑动速度对电流稳定系数造成正面影响,即这些特征值越高,SHAP值越大,电流稳定系数越大,弓网受流稳定性越弱,越容易造成接触失效;接触电流和波动频率对电流稳定系数造成负面影响,且随着特征值的增加,SHAP值减小,电流稳定系数减小,弓网受流稳定性和接触可靠增加,这与前文的研究结果相同,证明了试验结果的准确性。
图12
图13
在图14的每个子图中,横轴表示特征的值;左纵轴为该特征的SHAP值,描述相应特征对模型输出的贡献;右纵轴描述交互效应,用来说明与被研究的特征相互作用的另一个特征的值。
图14
由图14a可知,整体上随着波动压力幅值的增加,SHAP值变大,电流稳定系数正向变化的风险增大。同时也显示了SHAP模型自动选择的波动压力幅值和滑动速度之间的交互效应,波动压力幅值较小时,SHAP值为负,滑动速度越大对电流稳定系数的影响越大,振动加剧,离线率增加,导致附着在接触表面的氧化膜遭到了破坏且燃弧率增大,电弧侵蚀加剧,使表面粗糙度增加。然而,在波动压力幅值较大时,SHAP值为正,离线率升高,产生离线电弧概率增大,较小的滑动速度对电流稳定系数的影响高于较大的滑动速度,更容易造成弓网受流不稳定。由图14b可知,整体上随着波动频率的增加,SHAP值减小,电流稳定系数呈反向变化趋势。同时也显示了SHAP模型自动选择的波动频率和滑动速度之间的交互效应,波动频率大于2 Hz时,波动频率的SHAP值为负值,滑动速度越大,对电流稳定系数的影响越大,滑动速度越小,则波动频率的SHAP值越低,对电流稳定系数的负向作用越明显。当波动频率的值小于等于2 Hz时,SHAP值为正值,且波动频率越小,SHAP值越大,对电流稳定系数有增大效果,此时较小的滑动速度对电流稳定系数的影响高于较大的滑动速度,受电弓滑板和接触导线频繁接触,相互撞击次数增多,表面划痕增多,使得机械磨损、冲击磨损产生的磨屑增加,经过高温与氧化的作用,在表面形成磨粒,容易发生磨粒磨损。由图14c可知,整体上随着接触电流的增加,SHAP值减小,电流稳定系数呈反向变化的趋势。同时也显示了SHAP模型自动选择的接触电流和波动压力幅值之间的交互效应,接触电流较小时,SHAP值为正,波动压力幅值越大对电流稳定系数的影响越大,较大的机械冲击会破坏碳滑板表面润滑膜,机械磨损增加,导致表面粗糙度增加。然而,在接触电流较大时,SHAP值为负,较小的波动压力幅值对电流稳定系数的影响高于较大的波动压力幅值,波动压力幅值越大,接触电流的SHAP值越低,对电流稳定系数起负向作用。由图14d可知,整体上随着滑动速度的增加,SHAP值增大,电流稳定系数正向变化的风险增大。同时也显示了SHAP模型自动选择的滑动速度和接触电流之间的交互效应,但是滑动速度和接触电流的交互作用并不明显。当滑动速度大于等于120 km/h时,对应的SHAP值为正值,滑动速度越大,使得表面烧蚀坑数量增多、范围增大,导致接触表面凸凹不平,电流稳定系数增大,弓网接触状态恶化;当滑动速度小于120 km/h时,对应的SHAP值为负值,并且接触电流值较小,说明接触电流和滑动速度都较小时,对电流稳定系数起到负向作用。
5 结论
为了维持高速列车运行中稳定的滑动接触状态,延长滑板与导线的使用寿命,从影响滑动电接触失效的主要因素出发,研究其对滑动电接触失效的影响程度,得到如下结论。
(1) 通过比较SVR、RF、LightGBM和XGBoost模型的预测精度和拟合能力,选出性能最优的XGBoost模型,对其进行参数调优,调优后的GC-XGBoost模型误差更小,拟合能力更强,然后建立电流稳定系数预测模型,进一步证实了模型的优越性。
(2) 通过分析斯皮尔曼等级相关系数热力图可知,波动压力幅值和滑动速度与电流稳定系数之间呈正相关,接触电流和波动频率与电流稳定系数之间呈负相关,并且波动压力幅值与电流稳定系数的相关性最大。
(3) 通过RF、LightGBM和XGBoost三个算法对弓网滑动电接触失效的影响因素进行重要性排序,得出波动压力幅值是影响滑动电接触失效最关键的因素,其次是接触电流和滑动速度,波动频率影响最小。
(4) 引入SHAP可解释性分析框架,对GC-XGBoost模型中四个特征与电流稳定系数之间的关系进行解释分析,进一步阐明导致弓网滑动电接触失效的原因以及四个特征对滑动电接触失效的影响程度。
本文主要研究滑动速度、接触电流、波动压力幅值和波动频率对弓网间接触失效的影响程度,对于其他因素的影响程度有待于进一步研究。
参考文献
波动载荷作用下弓网滑动电接触接触失效研究
[J].
Study on contact failure of pantograph’s sliding electrical contact under fluctuant loading
[J].
波动载荷下弓网滑动电接触失效研究
[J].
Research on failure of pantograph-catenary sliding electrical contact under fluctuation load
[J].
An evaluation method for electrical contact failure based on high-frequency impedance model
[C]//
The effect of vibration induced fretting on contact failure in the coaxial connector
[C]//
Effect of electrical load on contact welding failure of silver tin oxide material used in DC electromechanical relays
[J].DOI:10.1109/Access.6287639 URL [本文引用: 1]
高速接触网的受流评价浅析
[J].
Evaluation of high speed catenary flows
[J].
弓网滑动电接触电流稳定性研究
[J].
Study on stability of sliding electric current in pantograph
[J].
波动载荷下弓网摩擦振动特性分析与建模
[J].
Analysis and modeling of pantograph catenary friction vibration under wave load
[J].
XGBoost:A scalable tree boosting system
[C]//
基于极限梯度提升树的输电线路缺陷风险预报
[J].
Prediction of transmission line defects risk based on extreme gradient boosting tree
[J].
面向任务携行航材品种确定和消耗预测的特征选择分析
[J].
Task-oriented feature selection and analysis of carried aircraft spare parts variety determination and consumption prediction
[J].
A unified approach to interpreting model predictions
[C]//
氧化铝蒸发浓度的自适应加权LSSVR预测
[J].
Alumina evaporation concentration prediction based on adaptive weighted LSSVR
[J].
基于ID3决策树算法接触网检修方案的研究
[J].
Research on catenary maintenance scheme based on ID3 decision tree algorithm
[J].
基于斯皮尔曼等级相关系数的新能源送出线路纵联保护
[J].
Pilot protection based on spearman rank correlation coefficient for transmission line connected to renewable energy source
[J].
改进的XGBoost杂散电流预测及可解释模型
[J].
Improved XGBoost stray current prediction and interpretable model
[J].
/
| 〈 |
|
〉 |
