基于支持向量机与改进高斯过程混合模型的车用电池容量预测方法*
Vehicle Battery Capacity Prediction Based on Hybrid Model of Support Vector Machine and Improved Gaussian Process
收稿日期: 2023-10-8 修回日期: 2023-11-28
基金资助: |
|
Received: 2023-10-8 Revised: 2023-11-28
作者简介 About authors
李雨佳,女,2000年生,硕士研究生。主要研究方向为电池管理系统。E-mail:
欧阳权,男,1991年生,博士,副教授,硕士研究生导师。主要研究方向为锂电池管理系统、新能源系统集成与控制。E-mail:
基于数据驱动的容量预测有助于锂电池健康管理以延长其使用寿命。然而,目前大多数相关方法基于实验室数据展开,无法反映实际复杂工况下车用电池老化特性。因此,本文利用电动汽车实车数据,设计了一种基于支持向量机与改进高斯过程的混合模型,实现了车用电池容量的精确预测。首先从汽车实时运行数据集中利用滑动窗口安时积分法提取其容量数据,设计了集合经验模态分解方法,将电池容量分为长期退化趋势和短期波动两部分,然后分别设计支持向量机与改进高斯过程对这两个分量进行建模,将结果融合得到最终的容量预测值。基于三辆实车数据集的试验结果表明,所提出的方法可以适用于实车数据的高精度容量预测。
关键词:
The data-driven-based capacity prediction is essential for lithium-ion battery health management to extend its lifetime. However, most of the state-of-the-art methods are based on laboratory data analysis, which can not reflect the aging characteristics of the actual vehicle battery under complex conditions. Therefore, a hybrid model based on support vector machine and improved Gaussian process is designed to accurately predict the capacity of electric vehicle battery by using real vehicle data. Firstly, the capacity data is extracted from the real-time operation data set of vehicles by using the sliding window ampere-hour integration method, and the ensemble empirical mode decomposition method is designed to divide the battery capacity into two parts: long-term degradation trend and short-term fluctuation. Then, the support vector machine and the improved Gaussian process are designed respectively to model the two components, and the results are fused to obtain the final capacity prediction value. Extensive experiment results on three vehicles validate the effectiveness of the proposed hybrid prediction model, with higher accuracy demonstrated than the commonly used methods.
Keywords:
本文引用格式
李雨佳, 欧阳权, 刘灏仪, 祝铭烨, 王志胜.
LI Yujia, OUYANG Quan, LIU Haoyi, ZHU Mingye, WANG Zhisheng.
1 引言
目前,电池容量估计的方法主要包括直接测量法、基于模型的方法和基于数据驱动的方法三类。直接测量法是在实验室条件下对电池的开路电压、充放电电流、内阻等指标进行离线测量,然后再通过相应的公式等计算电池的容量。这种方法计算简单且容易实现,但是需要将目标电池从电动汽车上取下来,难以用于计算工作状态下的动力电池的容量[3]。基于模型的方法依赖于寿命衰减模型、经验模型和等效电路模型,通过搭建空间状态模型表征电池内部电化学机理,然后利用非线性状态估计器或者自适应滤波等更新参数来进行电池容量的估计[4]。但是,现有的基于电化学模型方法在试验过程中需要特定的设备来获取锂离子电池的内部机构,检测时间过长,效率较低,无法满足容量预测的要求[5]。
基于数据驱动的方法不需要对电池内部复杂的电化学机理进行精确建模,也无需进行电池自身参数的辨识,而是通过对历史的电池电流、电压和温度等参数进行分析,提取与容量变化高度相关的特征,并将其作为训练数据构建估计模型,从而得到对于容量的预测结果[6]。文献[7]对从充电过程中电压、电流和温度分布模式中观察到的特征进行提取,然后通过人工神经网络进行每个周期的估计;文献[8]采用可变遗忘因子在线顺序极限学习机估计电池容量,并采用一种新的非线性衰落法、自适应权值法的高斯变分法对标准鲸鱼优化算法进行了改进,并将改进后的算法用于算法的优化。文献[9]利用紧支集正交小波分析对试验得到的电池额定容量数据进行去噪优化处理,然后利用蚁群算法对反向传播神经网络的初始权值和阈值进行优化,从而预测电池容量退化信息;文献[10]将经验模态分解方法和反向传播长短期记忆神经网络相结合,建立了容量预测模型,有效提高了预测精度。
然而,上述文献[6⇓⇓⇓⇓-11]中方法的数据来源于实验室,其有效性依赖于实验室数据的采样精度和计算精度,当数据质量较差时,这些方法的准确性将会下降。此外,这些方法的验证数据通常是在恒定电流、恒定温度的实验室环境中测量,但是在电动汽车实际运行过程中,电池的寿命受到很多其他因素的影响,如使用模式、驾驶特性等[12],这导致电动汽车电池在生命周期中表现出容量长期的衰减趋势和短期的波动现象。因此利用实际的数据进行容量预测的难度较大。此外,目前的研究对于容量退化轨迹的预测大多是以电池充放电循环次数作为自变量来描述电池容量衰减的过程,但是在运用到实际车辆时,使用行驶里程作为自变量能为驾驶员提供参考,更具有现实意义。
本文以实车行驶数据作为主要的研究对象,针对实车数据采集过程中SOC数据精度较低等问题,采用SOC插值和滑动窗口移动平均法,利用安时积分法计算容量,采用卡尔曼滤波算法拟合了容量和里程的曲线,并以输出值作为最终容量的真实值,针对电动汽车容量退化趋势中存在的短期波动的问题,首先通过集合经验模态分解(Ensemble empirical mode decomposition, EEMD)将容量分解为长期退化趋势和短期波动,并采用局部支持向量机(Support vector machine, SVM)和多输出混合高斯过程(Multi-output mixture of Gaussian process, MOMoGP)分别对EEMD分解后得到的长期趋势和短期波动进行建模预测,有效提高了容量预测精度。
2 实车电池容量提取
图1
与在实验室标准环境中得到的满充满放数据相比,电动汽车车主一般不会在电池电量过低时充电,这导致每个充电片段的起始和终止SOC都是不同的,因此首先需要选取一段固定的SOC范围进行分析,本文选取SOC位于50%~80%段的数据,因为首先大部分的充电片段都包括这个区间的数据,可用的充电片段较多,有利于预测模型的构建;其次,50%~80%段的数据包括了足够多的信息,有利于容量的提取;最后,这个区间段内电池电压电流变化相对来说比较稳定,且具有代表性。此外,电动汽车电池的放电数据采集于汽车运行阶段,干扰因素较多,而充电数据的采集都是在停车时进行的,具有比较稳定、不受干扰的特点。
因此,对清洗后的数据集进行片段划分,提取出充电段实车数据作为容量计算依据。
由于原始数据中没有直接给出容量数据,因此利用选取充电片段中的SOC数据、电流数据等进行求解。对每一个充电片段,使用安时积分法计算对应的电池容量值。其数学形式如式(1)所示
式中,k为充电开始时对应的数据点;s为充电结束时对应的数据点;ΔSOC=SOCk-SOCs;SOCk为充电片段起始SOC值;SOCs为充电片段终止SOC值;
对于每一个充电片段,为了减小由于采样时间跨度过大造成的误差,采用滑动窗口移动平均的方法来计算每个充电过程中的电动汽车电池容量大小[14]。从起点开始,以20个数据点为一个窗口,应用安时积分法计算该窗口的电池容量大小,然后依次滑动窗口至充电终点,最后计算所有窗口容量均值作为该充电过程电池容量。如式(2)所示
式中,C为充电片段的容量;
上述计算得到的容量值中,存在远离数据中心的离群点,这些离群点会影响后续模型的精度,因此需要剔除这部分异常数据。由于容量数据集中异常值具体信息未知且数据量较大,因此采用基于密度的聚类算法(Density-based spatial clustering of applications with noise, DBSCAN)来进行离群值的剔除[15]。
卡尔曼滤波是一种高效的自回归滤波器,它能在存在诸多不确定情况的组合信息中估计动态系统的状态,适用于在含有不确定因素的动态线性系统里找到系统当前状态的最优解[16]。为了减少过程噪声和测量噪声对容量计算结果的影响,进一步提高容量计算精度,设计如下卡尔曼滤波器
式中,Ck为k时刻容量的后验修正值;Kk为k时刻的卡尔曼增益;zk为k时刻的观察值;H为系统观测方程的系数矩阵;
3 模型构建
3.1 问题描述
随着电动汽车行驶里程的增加,电池容量会呈现衰减的趋势,但是由于在实际运行过程中行驶工况复杂、驾驶员驾驶行为不同等因素,导致容量的下降过程存在波动,而并不是一个光滑的曲线。因此,为了准确估计电池的未来容量,关键是考虑衰减趋势上的波动性,因此本文将容量C通过EEMD分解为
式中,L为容量C的长期退化趋势;F为短期波动。这两部分的数值特征是不同的,即长期趋势部分实际上是具有线性趋势的非平稳序列,而短期波动部分是具有周期波动特征的非平稳序列。本文通过结合局部支持向量机和MOMoGP来分别针对L和F进行建模,然后将L和F相加得到最终的容量预测结果,以提高模型的预测能力。图2展示了所提方法的总体框架。
图2
3.2 EEMD分解
EEMD具有处理非平稳数据序列的能力,在EMD分解中,得到的IMF可能存在着模态混叠的现象,影响分解效果,在文献[17]中提出了一种新的EEMD方法来解决这个问题,高斯白噪声具有频率均匀分布的统计特性,而EEMD利用该特性通过每次加入同等幅值的不同白噪声来改变信号的极值点特性,之后对多次EMD得到的相应IMF进行总体平均来抵消加入的白噪声,从而有效抑制模态混叠的产生。EEMD分解之后,L和F作为两个部分在下一步中用于单独的模型训练。
3.3 局部支持向量机
支持向量机模型以结构风险最小化为基础,利用回归方法来解决非线性问题[18],而电动汽车电池的容量受到很多因素的影响,如电流、放电深度和环境温度等,且这些影响因素与容量衰减之间并不是简单的线性关系,因此对于长期容量下降趋势,采用局部支持向量机模型来对其进行建模。
SVM的主要任务是找到一个函数
式中,
式中,
而局部ε-SVM通过相空间重构得到不同的向量,然后选择与输入向量最接近的向量用于训练模型,其建模过程如下所示。
步骤1:对于输入序列l(t),选择嵌入维度m和延迟时间τ,根据Takens嵌入定理重构相空间。对于用来预测下一个点的输入向量L(N),计算目标向量与预先形成的N-1个向量之间的距离为
步骤2:选择与向量L(N)最接近的p个向量,并求出对应的Dr值
步骤3:将
步骤4:将L(N)作为支持向量机的输入向量,得到预测值l(n+T)。
步骤5:重复步骤1~4,直到获得所有预测值。
3.4 MOMoGP
当给定一个观测值
式中,K是在GP中定义的协方差矩阵,对于MOMoGP中的节点S,后验推理为
当用于预测时,在给定下一个预测周期x的情况下,多模态后验预测分布可以通过从叶到根自下而上传播的一阶矩和二阶矩来近似。分割输出空间的乘积节点P执行来自其k个子节点的平均值(预测值)的串联和节点S对应于多元高斯分布的混合。
多元高斯分布的平均值为
预测值可以视为MOMoGP的后验分布平均值,因此,预测的未来短期波动现象
4 结果及分析
4.1 数据预处理结果
图3
图4
4.2 电池容量预测结果
为了分辨预测结果的好坏,本文采用均方根误差(Root mean square error, RMSE)、平均绝对误差(Mean absolute error, MAE)和平均绝对百分比误差(Mean absolute percentage error, MAPE)来判定模型与容量衰减曲线的拟合情况,其计算公式为
式中,n为预测次数;yi为第i次预测的真实值,
图5
图6
表1 不同方法预测结果对比
数据集 | 模型 | RMSE | MAE | MAPE(%) |
---|---|---|---|---|
实车1 | 混合模型 | 0.042 4 | 0.031 4 | 0.028 1 |
SVM | 0.147 8 | 0.116 0 | 0.104 4 | |
LSTM | 0.421 3 | 0.398 5 | 0.357 8 | |
BP | 0.076 7 | 0.066 4 | 0.064 5 | |
实车2 | 混合模型 | 0.048 4 | 0.032 3 | 0.031 0 |
SVM | 0.100 9 | 0.083 9 | 0.081 0 | |
LSTM | 0.198 9 | 0.161 0 | 0.155 5 | |
BP | 0.064 4 | 0.051 9 | 0.034 6 | |
实车3 | 混合模型 | 0.020 3 | 0.015 4 | 0.014 9 |
SVM | 0.075 7 | 0.056 9 | 0.055 2 | |
LSTM | 0.019 8 | 0.016 7 | 0.016 2 | |
BP | 0.098 5 | 0.072 0 | 0.057 3 |
图7
图8
为了进一步展示所提方法的优势,图9、10展示了三辆车多步预测的结果,从表2所提供的精度数据来看,本文提出的混合模型具有明显的优势,在大多数情况下预测效果都优于其他传统模型,即使在实车1和2的六步预测中,在RMSE参数上SVM击败了本文所提模型,但这两种方法之间的性能差异也非常小,可以忽略不计。而出现这种现象可能是由于均方根误差会对大误差进行平方,使大误差对整体误差的贡献更大,而平均绝对误差和平均绝对百分比误差只考虑误差本身,会导致大误差和小误差对整体的贡献度相同,而所提混合模型在进行六步预测时虽然正确度好,但是精密度稍差,所以导致RMSE参数上表现不如SVM好。此外,三步预测和六步预测的结果通常不如单步预测的结果准确,这是因为多步预测误差会随着步数的增加而累积,并且随着预测步数的增加,捕捉容量的变化趋势变得更加困难,导致预测难度变大,但是本文所提模型依然在大部分时候都优于其他模型,更加证明了其优越性能。
图9
图10
表2 不同方法多步预测结果对比
预测步长 | 方法 | 实车1 | 实车2 | 实车3 | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
RMSE | MAE | MAPE(%) | RMSE | MAE | MAPE(%) | RMSE | MAE | MAPE(%) | ||||
三步 | 融合方法 | 0.084 2 | 0.061 3 | 0.054 9 | 0.086 0 | 0.060 3 | 0.058 0 | 0.040 3 | 0.031 0 | 0.291 4 | ||
SVM | 0.169 8 | 0.133 9 | 0.120 5 | 0.124 9 | 0.100 1 | 0.096 7 | 0.103 7 | 0.076 7 | 0.335 7 | |||
LSTM | 0.390 7 | 0.313 7 | 0.280 0 | 0.337 5 | 0.288 7 | 0.278 6 | 0.071 1 | 0.059 4 | 0.057 6 | |||
BP | 0.128 5 | 0.113 7 | 0.119 1 | 0.164 2 | 0.136 3 | 0.105 3 | 0.130 5 | 0.104 0 | 0.096 2 | |||
六步 | 融合方法 | 0.148 5 | 0.094 6 | 0.084 7 | 0.181 4 | 0.117 2 | 0.115 2 | 0.076 2 | 0.055 6 | 0.053 9 | ||
SVM | 0.136 8 | 0.113 2 | 0.101 7 | 0.168 3 | 0.136 2 | 0.131 6 | 0.107 8 | 0.080 5 | 0.078 1 | |||
LSTM | 0.355 5 | 0.325 6 | 0.291 2 | 0.523 2 | 0.448 1 | 0.432 4 | 0.147 3 | 0.117 4 | 0.113 9 | |||
BP | 0.169 2 | 0.149 1 | 0.168 8 | 0.205 7 | 0.173 3 | 0.121 8 | 0.151 0 | 0.121 2 | 0.113 4 |
图11
表3 训练集为30%时不同方法预测结果对比
数据集 | 模型 | RMSE | MAE | MAPE(%) |
---|---|---|---|---|
实车1 | 混合模型 | 0.042 6 | 0.032 3 | 0.028 8 |
SVM | 1.097 1 | 0.055 8 | 0.768 9 | |
LSTM | 0.319 8 | 0.251 1 | 0.225 6 | |
BP | 0.105 6 | 0.085 8 | 0.065 1 | |
实车2 | 混合模型 | 0.050 5 | 0.033 0 | 0.085 8 |
SVM | 0.370 7 | 0.309 1 | 0.297 8 | |
LSTM | 0.613 2 | 0.583 5 | 0.559 0 | |
BP | 0.106 6 | 0.086 0 | 0.071 0 | |
实车3 | 混合模型 | 0.018 9 | 0.014 3 | 0.013 9 |
SVM | 0.088 1 | 0.074 3 | 0.072 1 | |
LSTM | 0.098 9 | 0.078 6 | 0.076 0 | |
BP | 0.161 0 | 0.117 9 | 0.114 3 |
5 结论
本文研究了基于支持向量机与改进高斯过程混合模型的车用电池容量预测方法。主要的工作和结论如下所述。
(1) 针对电动汽车实车数据,利用安时积分法计算电池的容量,其中针对数据精度低的情况,对SOC数据进行插值处理,然后利用EEMD分解对容量数据进行分解。
(2) 利用支持向量机对分解后的容量长期退化趋势进行建模预测,利用改进的高斯过程对分解后的短期波动部分进行建模预测,最后将两者相加得到最终的容量预测结果。
(3) 基于三辆实车数据集的试验结果表明,均方根误差(RMSE)和平均绝对误差(MAE)分别为0.042 4和0.031 4,表明本文提出的方法能够适用于实车数据的容量预测。
参考文献
A technique for estimating the state of health of lithium batteries through a dual-sliding-mode observer
[J].DOI:10.1109/TPEL.2009.2034966 URL [本文引用: 1]
蓄电池SOH估算方法研究综述
[J].
Review of SOH estimation method for battery
[J].
Online estimation of battery model parameters and state of health in electric and hybrid aircraft application
[J].DOI:10.1016/j.energy.2021.120699 URL [本文引用: 1]
State-of-health estimation for LiFePO4 battery system on real-world electric vehicles considering aging stage
[J].DOI:10.1109/TTE.2021.3129497 URL [本文引用: 1]
基于日常片段充电数据的锂电池健康状态实时评估方法研究
[J].
Real-time SOH estimation algorithm for lithium-ion batteries based on daily segment charging data
[J].
Feature-based lithium-ion battery state of health estimation with artificial neural networks
[J].
Battery SOH estimation and RUL prediction framework based on variable forgetting factor online sequential extreme learning machine and particle filter
[J].
基于ACO-BP神经网络的锂离子电池容量衰退预测
[J].
DOI:10.19799/j.cnki.2095-4239.2019.0190
[本文引用: 2]
准确预测电池的容量衰退趋势对加强电池系统的管理和维护具有重要意义。本工作选择以锂离子电池为研究对象,根据NASA实验室公开的源数据集分析、预测锂离子电池的容量衰退趋势。在室温、恒流工况下对锂离子电池进行满充满放的循环充放电试验,得到各循环周期下电池的实际额定容量值,采用紧支集正交小波分析对获得的电池监测数据进行去噪优化处理,得到更加平稳规律的电池容量衰退过程,然后利用蚁群算法(Ant colony optimization,ACO)优化BP神经网络的初始权值和阈值,基于ACO-BP神经网络模型完成对锂离子电池容量衰退的预测,并与单独使用BP神经网络进行对比。结果表明,采用ACO-BP神经网络比单独使用BP神经网络具有更好的预测效果,且随着训练样本的增加,包含更多的电池容量退化信息,预测精度明显提高,当以前80个循环充放电周期作为训练样本时,预测的平均误差为1.46%,若继续扩大训练样本,预测效果将会更好。本研究有助于加强电池系统的健康管理,为高效预测锂离子电池的劣化轨迹提供技术参考。
Lithium-ion battery capacity decline prediction based on ant colony optimization BP neural network algorithm
[J].
DOI:10.19799/j.cnki.2095-4239.2019.0190
[本文引用: 2]
Accurately predicting the declining trend with respect to the capacity of a battery is important for strengthening the management and maintenance of the battery system. Lithium-ion batteries are the research object; the battery capacity decline trend is predicted based on a source data set analysis published by NASA Laboratories. The data for a full-cycle charge-discharge test of a battery, obtained at room temperature and constant current, are denoised and optimized by a compact set orthogonal wavelet analysis to obtain a more stable and regular battery capacity decay process. The ant colony optimization (ACO) algorithm is subsequently used to optimize the initial weight of the BP neural network. And threshold, based on the ACO-BP neural network model to predict the capacity decline of lithium-ion batteries, and compared with BP neural network alone. The results denote that the ACO-BP neural network generates better prediction results when compared with that generated by the BP neural network alone; with more training samples, it contains more information on battery capacity degradation, and the prediction accuracy is significantly improved. The predicted average error is 1.46% when 80 charge and discharge cycles are used as training samples. If the training samples are further expanded, the prediction effect will improve. This study helps to strengthen the management of the battery systems and provides a technical reference for efficiently predicting the degradation trajectory of the lithium-ion batteries.
Remaining useful life and state of health prediction for lithium batteries based on empirical mode decomposition and a long and short memory neural network
[J].
SOH and RUL prediction of lithium-ion batteries based on Gaussian process regression with indirect health indicators
[J].
锂离子电池充放电倍率对容量衰减影响研究
[J].
Research on the effect of charge and discharge rates on capacity fading of lithium-ion batteries
[J].
数据清洗在新能源功率预测中的研究综述和展望
[J].
Review and prospect of data cleaning in renewable energy power prediction
[J].
基于实车数据的电动汽车电池剩余使用寿命预测
[J].
Predicting remaining useful life of electric vehicle battery based on real vehicle data
[J].
风电机组功率异常数据剔除方法研究
[J/OL].
Methods for elimination of abnormal power data of wind turbine
[J/OL].
Kalman filter and its application
[C]// 2015 8th International Conference on Intelligent Networks and Intelligent Systems (ICINIS),Tianjin,China,2015:
Ensemble empirical mode decomposition:A noise-assisted data analysis method
[J].
DOI:10.1142/S1793536909000047
URL
[本文引用: 1]
A new Ensemble Empirical Mode Decomposition (EEMD) is presented. This new approach consists of sifting an ensemble of white noise-added signal (data) and treats the mean as the final true result. Finite, not infinitesimal, amplitude white noise is necessary to force the ensemble to exhaust all possible solutions in the sifting process, thus making the different scale signals to collate in the proper intrinsic mode functions (IMF) dictated by the dyadic filter banks. As EEMD is a time–space analysis method, the added white noise is averaged out with sufficient number of trials; the only persistent part that survives the averaging process is the component of the signal (original data), which is then treated as the true and more physical meaningful answer. The effect of the added white noise is to provide a uniform reference frame in the time–frequency space; therefore, the added noise collates the portion of the signal of comparable scale in one IMF. With this ensemble mean, one can separate scales naturally without any a priori subjective criterion selection as in the intermittence test for the original EMD algorithm. This new approach utilizes the full advantage of the statistical characteristics of white noise to perturb the signal in its true solution neighborhood, and to cancel itself out after serving its purpose; therefore, it represents a substantial improvement over the original EMD and is a truly noise-assisted data analysis (NADA) method.
Application of supervised machine learning paradigms in the prediction of petroleum reservoir properties:Comparative analysis of ANN and SVM models
[J].
Remaining useful life prediction for lithium-ion batteries based on Gaussian processes mixture
[J].DOI:10.1371/journal.pone.0163004 URL [本文引用: 1]
Remaining useful life prediction of lithium-ion batteries:A hybrid approach of grey-Markov chain model and improved Gaussian process
[J].DOI:10.1109/JESTPE.2021.3098378 URL [本文引用: 1]
/
〈 |
|
〉 |
