基于Bagging-组合核函数相关向量机的短期负荷预测模型研究*
Research on Short-term Load Forecasting Model Based on Bagging-combined Kernel Function Relevance Vector Machine
通讯作者: 张智晟,男,1975年生,博士,教授。主要研究方向为电力系统短期负荷预测和经济调度。E-mail:slnzzs@126.com
收稿日期: 2021-08-10 修回日期: 2022-05-20
| 基金资助: |
|
Received: 2021-08-10 Revised: 2022-05-20
作者简介 About authors
邱山,男,1998年生,硕士研究生。主要研究方向为电力系统负荷预测。E-mail:
龚文杰,男,1974年生,硕士,高级工程师。主要研究方向为电力系统运行与管理。E-mail:
为充分发挥组合核函数在相关向量机预测模型中的优势,有效提高负荷预测的精度,提出基于Bagging-组合核函数相关向量机的短期负荷预测模型。首先构造了高斯核函数与Morlet小波核函数加权组合的组合核函数相关向量机的预测模型,然后采用粒子群算法对两个核函数的最优权值进行优选。为提高模型的泛化能力,采用Bagging算法对原始数据多次抽样构造训练样本集。通过实际算例仿真,与多种相关向量机预测模型对比分析,验证了该模型具有较好的预测精度。
关键词:
In order to give full play to the advantages of the combined kernel function in the relevance vector machine forecasting model and effectively improve the accuracy of load forecasting, a short-term load forecasting model based on the Bagging-combined kernel function correlation vector machine is proposed. Firstly, the forecasting model of combined kernel function relevance vector machine is constructed by weighted combination of Gaussian kernel function and Morlet wavelet kernel function, and then the particle swarm optimization algorithm is used to optimize the optimal weights of the two kernel functions. In order to improve the generalization ability of the model, the Bagging algorithm is used to sample the original data multiple times to construct a training sample set. Through the simulation of actual example, compared with a variety of relevance vector machine forecasting models, it is verified that the proposed model has good prediction accuracy.
Keywords:
本文引用格式
邱山, 龚文杰, 张智晟.
QIU Shan, GONG Wenjie, ZHANG Zhisheng.
1 引言
高精度的短期负荷预测是电力系统调度控制的基础,是电网安全稳定运行的前提[1]。目前学者们已将多种智能方法应用于负荷预测中,包括人工神经网络、支持向量机、相关向量机[2⇓-4]等。支持向量机通过核方法进行非线性分类,是一个具有稀疏性和稳健性的分类器,其分类预测结果由支持向量决定,因此支持向量机能抓住关键样本并“剔除”大量冗余样本,在短期负荷预测中取得了不错的效果。如文献[5]通过运用支持向量机,结合结构风险最小化原则对短期负荷进行预测,降低了对预测经验的依赖。但是支持向量机要求核函数构成的矩阵必须是正定的,并且在训练中会出现支持向量增多,导致过拟合和计算速度下降的问题。相关向量机(Relevance vector machine,RVM)仅需要对核参数进行设置,需要调节的参数少,计算量相对较小[6],可有效克服支持向量机的不足,因此相关向量机在短期负荷预测领域已得到了较好的应用。文献[7]首先寻找与待测日有相似特征的数据,然后利用相关向量机进行预测得到预测结果,不仅预测结果优于支持向量机,还能得到支持向量机无法得到的概率值。
但常规相关向量机通常采用单一核函数,无法体现数据全部特性,导致预测精度有时不满足要求,所以有学者提出构建组合核函数的方法来弥补单一核函数的不足。如文献[8]构建高斯核函数和二次多项式核函数组成的组合核函数RVM,并与高斯核函数和张量积线性样条函数组成的组合核函数RVM以及高斯核RVM、多项式核RVM、样条核RVM等单一核函数RVM模型进行对比,验证得出不同类型组合核函数比单一核函数预测精度更高,其中高斯核与多项式核的组合核函数RVM效果最好。但常规组合核函数RVM对变化较为剧烈的大样本高维数据预测效果不理想。小波分析理论在处理非平稳信号问题时有不错的效果,拥有较好的局部化分析能力,因此将小波函数构造成为向量机的核函数,在突变点信号分析与预测上都有良好表现。同时由于小波核函数的稀疏性,也可以降低计算量,提高训练速度。如文献[9]中将小波核函数应用到支持向量机的构造中,提升了模型的计算速度和精度。
本文构建了基于Bagging-组合核函数相关向量机的短期负荷预测模型。首先构建高斯核函数和小波核函数加权组合的组合核函数RVM预测模型,将高斯核函数与小波核函数组合,共同对数据进行处理,可使每个核函数充分发挥各自特点。针对电力系统负荷波动的特点,通过粒子群算法优化组合权重。Bagging算法作为一种集成算法通过对数据集进行多次抽取,可有效降低结果的方差,提升模型的预测准确率[10],已被广泛应用于预测领域。本文采用Bagging算法对原始数据多次抽样构造训练样本集,结合实际算例仿真,通过与多种相关向量机预测模型对比得出,本文所提模型具有较好的预测精度。
2 组合核函数相关向量机短期负荷预测模型
2.1 相关向量机
相关向量机基于贝叶斯理论,通过选择合适的核函数,将原本低维空间中的非线性问题转化为高维空间中的线性问题,利用最大化后验概率和最大似然方法得到相关向量和相应权值,多用于解决分类回归预测的问题[11]。设输入值为
式中,
首先可以合理假设
式中,
求解式(3)可以利用最大似然估计的思想,但可能会造成类似于支持向量机中支持向量过多的问题,所以为
可以得到
式(5)可以用贝氏定理拆开,变成定积分形式,经过替换后得到
然后就可以用超参数替代求近似解,并得出定积分结果
现在只需要求出两个超参数的解就可以得到结果,通过对两个超参数求偏微分等于零的解得到迭代公式
式中,
2.2 高斯核函数与小波核函数加权组合的组合核函数相关向量机模型
核函数的选择与构建对最终预测结果有很大影响,核函数选用与构建得当能很好地提高模型预测精度[14]。
式中,
通过平移不变定理,构造适用于向量机的Morlet小波核函数[19],其公式为
式中,
因此本文构造了高斯核函数与Morlet小波核函数加权组合的组合核函数相关向量机预测模型。由小波核函数与高斯核函数构造的组合核函数如式(15)所示
式中,
图1
组合核函数权重的取值决定了组合模型的预测精度,本文采取粒子群算法对组合权重进行优选,其中目标函数选取为平均绝对误差,得到令目标函数最小的权重系数。
将高斯核函数与小波核函数线性组合,能很好地发挥双核优势,取长补短,有效提高了模型预测精度。
3 基于Bagging-组合核函数相关向量机预测模型
Bagging算法是一种集成算法,它的思想是在训练集取样时,随时有放回地抽取多个训练集,形成若干个弱学习器,每个弱学习器独立训练进行预测,最后将每个弱学习器组合形成一个强学习器,得到最终预测结果[20]。
为提高模型的泛化能力,本文采用Bagging算法对原始数据多次抽样构造训练样本集。通过对训练集多次重复采样,构造多个弱学习器,将每个训练集单独放入组合核函数RVM模型中进行训练和预测,能有效提高整个预测过程中的稳定性,对某些误差较大的点有很好的改进,提高了整个模型的泛化能力。
综上,本文首先利用Bagging算法抽样构造样本集,将历史负荷数据以及天气条件等影响因素作为输入数据,构建组合核相关向量机预测模型进行短期负荷预测。具体预测模型如图2 所示。
图2
4 算例分析
4.1 模型建立及数据预处理
为了验证本文所提模型的预测效果,选取某地区电网实际负荷数据进行算例仿真。负荷数据采样周期为15 min,即每日采样96个负荷数据。其他影响因素还包含日最高气温、最低气温、工作日类型、降水概率、平均气温。在进行预测之前,首先要对数据进行归一化处理[21⇓-23]。选取预测日前两周的历史负荷数据以及天气条件等影响因素构成训练集。Bagging算法抽样时随机抽取10天的数据,共抽取五组数据构成5个弱学习器。在进行负荷预测时,当前预测点为t时刻,则选取前一日t、t+1、t-1时刻历史负荷数据(共3维),以及当日最高气温、日最低气温、工作日类型(工作日为1,休息日为0)、天气因素(雨雪等恶劣天气影响因子为0,阴天多云影响因子为0.5,晴天影响因子为1)、平均气温、降水概率(共6维)形成输入矩阵(共9维),t时刻的预测值为输出值(共1维)。本文预测模型中高斯核函数核宽为2,小波核函数中伸缩因子为0.4。在使用粒子群算法时,设置初始粒子数为50,迭代次数为300次,粒子速度最大值为0.4,最小值为-0.4,惯性权重的最大值为0.95,最小值为0.4。
本文选取了高斯核RVM预测模型(模型1)、小波核RVM预测模型(模型2)、高斯核与小波核组合核函数RVM预测模型(模型3)、高斯核与多项式核组合核函数RVM预测模型(模型4)和基于Bagging-高斯核与小波核组合核函数RVM预测模型(模型5)进行对比。模型1、模型2、模型3和模型4用于对比不同组合核函数RVM与单一核函数RVM模型预测精度的差异;模型3与模型5用于验证采用Bagging算法对模型预测精度的影响。
4.2 算例结果分析
为验证本文提出模型的有效性,分别用5种模型进行负荷预测,预测结果如图3所示。
图3
表1 工作日5种模型预测误差分析
| 预测模型 | EMAPE(%) | Emax(%) | RMSE/MW |
|---|---|---|---|
| 模型1 | 1.52 | 4.27 | 55.440 5 |
| 模型2 | 1.67 | 7.48 | 59.368 0 |
| 模型3 | 1.18 | 3.96 | 34.293 1 |
| 模型4 | 1.41 | 4.45 | 38.190 7 |
| 模型5 | 1.01 | 3.52 | 32.089 1 |
通过表1可以得出,与模型1和模型2对比,在平均绝对误差上模型3降低了0.34%和0.49%,模型4降低了0.11%和0.25%,意味着组合核函数RVM预测模型体现出了组合核函数的优势,不同核函数各自发挥作用,平均绝对误差相较于单一核函数RVM预测模型都有所下降。同时模型3与模型4在方均根误差上也有明显缩小。模型3相比于模型4平均绝对误差下降了0.23%,最大误差也下降了0.49%,方均根误差也下降了4 MW,可见由于在核函数中加入小波核函数,能有效改善预测误差较大点的预测结果,从而高斯核与小波核的组合核函数预测效果是优于高斯核与多项式核的组合核函数的。模型5与其他模型相比,平均绝对误差分别下降0.51%、0.66%、0.17%和0.40%,最大误差分别下降0.75%、3.96%、0.44%和0.93%,方均根误差也是5种模型中最小的,约32 MW。由此可以得出基于Bagging-组合核函数RVM预测模型预测精度最高。同时与模型3相比,可以看出Bagging算法的引入进一步降低了组合核函数RVM模型预测结果的误差。
为继续验证基于Bagging-组合核函数RVM预测模型是否能够连续多天保持较高的预测精度,用5种模型分别预测春季连续七天的负荷情况,其中工作日与周末分别选取日类型相同的历史负荷作为输入数据进行预测,误差分析如表2所示。
表2 春季一周内5种模型预测误差分析
| 时间 | 模型1 | 模型2 | 模型3 | 模型4 | 模型5 | |||||
|---|---|---|---|---|---|---|---|---|---|---|
| EMAPE(%) | Emax(%) | EMAPE(%) | Emax(%) | EMAPE(%) | Emax(%) | EMAPE(%) | Emax(%) | EMAPE(%) | Emax(%) | |
| 周一 | 3.19 | 7.76 | 2.32 | 6.80 | 2.12 | 7.52 | 2.24 | 5.00 | 2.07 | 6.15 |
| 周二 | 2.84 | 5.16 | 2.89 | 7.71 | 2.36 | 7.16 | 2.51 | 4.45 | 1.92 | 3.55 |
| 周三 | 1.49 | 5.15 | 2.69 | 6.51 | 2.01 | 7.08 | 2.61 | 6.51 | 1.68 | 6.12 |
| 周四 | 1.52 | 4.27 | 1.67 | 7.48 | 1.18 | 3.96 | 1.45 | 4.89 | 1.01 | 3.52 |
| 周五 | 1.65 | 4.06 | 3.82 | 7.19 | 1.10 | 3.92 | 2.08 | 4.22 | 1.00 | 3.89 |
| 周六 | 2.73 | 7.56 | 3.62 | 8.15 | 2.73 | 7.79 | 2.32 | 5.90 | 1.98 | 6.87 |
| 周日 | 2.97 | 8.59 | 3.05 | 8.20 | 2.71 | 7.88 | 2.87 | 6.45 | 2.50 | 5.75 |
| 平均值 | 2.34 | 6.07 | 2.86 | 7.42 | 2.03 | 6.47 | 2.29 | 5.34 | 1.73 | 5.12 |
对比表2各项数据可以看出,模型3与模型4连续一周预测结果误差的平均值仍低于模型1与模型2,模型3相较模型1和模型2误差下降了0.29%和0.81%,模型4下降了0.07%和0.59%,可见采用组合核函数RVM预测模型效果仍是优于单一核函数RVM预测模型。模型3的误差平均值相较于模型4也下降了0.22%。模型5在连续一周的预测中精度最高,且误差波动不大,一周误差的平均值比另外四种模型分别下降了0.64%、1.16%、0.35%和0.57%,最大误差也下降了1.02%、2.28%、1.36%和0.22%,由此可见采用Bagging算法对模型预测的精度和稳定性都有提升。
表3 夏季连续一周预测误差表
| 时间 | 模型5 | ||
|---|---|---|---|
| EMAPE(%) | Emax(%) | RMSE/MW | |
| 周一 | 2.17 | 4.22 | 63.815 9 |
| 周二 | 2.89 | 5.39 | 75.512 2 |
| 周三 | 2.44 | 5.95 | 63.000 1 |
| 周四 | 2.47 | 4.37 | 65.576 4 |
| 周五 | 2.56 | 5.37 | 59.214 2 |
| 周六 | 2.89 | 6.69 | 71.786 1 |
| 周日 | 2.76 | 6.87 | 70.422 7 |
| 平均值 | 2.59 | 5.55 | 67.046 5 |
表4 秋季连续一周预测误差表
| 时间 | 模型5 | ||
|---|---|---|---|
| EMAPE(%) | Emax(%) | RMSE/MW | |
| 周一 | 1.34 | 5.89 | 47.625 6 |
| 周二 | 1.63 | 5.33 | 47.779 1 |
| 周三 | 1.79 | 4.93 | 52.546 1 |
| 周四 | 1.45 | 5.17 | 41.663 8 |
| 周五 | 1.83 | 4.24 | 50.637 6 |
| 周六 | 1.89 | 6.48 | 52.998 0 |
| 周日 | 2.22 | 6.87 | 55.945 1 |
| 平均值 | 1.73 | 5.54 | 49.885 0 |
通过对夏季和秋季一周的负荷预测可以看出,在其他季节,本文提出的短期负荷预测模型仍能保持较高预测精度和稳定性。
5 结论
本文提出了一种基于Bagging-组合核函数RVM模型,能较好地对电力负荷进行预测。高斯核函数与小波核函数加权组合的组合核函数形式能有效降低计算量,提高模型计算速度和泛化能力,充分发挥小波核函数具有多尺度和较高稀疏性的特点。同时为了提高模型稳定性,采用Bagging算法对原始数据多次抽取构造训练集。通过实际算例仿真,验证了该模型与多种相关向量机预测模型相比具有更好的精度与稳定性。负荷预测关键在于预测的准确性,未来可以将本文所提模型与精度更高的算法相结合,进一步提高负荷预测精度。
参考文献
Short-term power load forecasting based on clustering and XGBoost method
[C]//
基于约束并行LSTM分位数回归的短期电力负荷概率预测方法
[J].
Short time power load probabilistic forecasting based on constrained parallel-LSTM neural network quantile regression mode
[J].
Decompositional rule extraction from support vector machines by active learning
[J].DOI:10.1109/TKDE.69 URL [本文引用: 1]
短期负荷预测的支持向量机方法研究
[J].
Study of support vector machines for short-term load forecasting
[J].
Comparison of the support vector machine and relevant vector machine in regression and classification problems
[C]//
一种面向运行可靠性的短期负荷预测方法研究
[J].
A short-term load forecasting method oriented for operational reliability
[J].
优化组合核函数相关向量机电力负荷预测模型
[J].
Relevance vector machine based on particle swarm optimization of compounding kernels in electricity load forecasting
[J].
基于小波支持向量机模型的矿区生态安全评价方法研究
[J].
Ecological security evaluation of mining area based on WSVM
[J].
Asymmetric bagging and random subspace for support vector machines-based relevance feedback in image retrieval
[J].Relevance feedback schemes based on support vector machines (SVM) have been widely used in content-based image retrieval (CBIR). However, the performance of SVM-based relevance feedback is often poor when the number of labeled positive feedback samples is small. This is mainly due to three reasons: 1) an SVM classifier is unstable on a small-sized training set, 2) SVM's optimal hyperplane may be biased when the positive feedback samples are much less than the negative feedback samples, and 3) overfitting happens because the number of feature dimensions is much higher than the size of the training set. In this paper, we develop a mechanism to overcome these problems. To address the first two problems, we propose an asymmetric bagging-based SVM (AB-SVM). For the third problem, we combine the random subspace method and SVM for relevance feedback, which is named random subspace SVM (RS-SVM). Finally, by integrating AB-SVM and RS-SVM, an asymmetric bagging and random subspace SVM (ABRS-SVM) is built to solve these three problems and further improve the relevance feedback performance.
基于相关向量机的机器学习算法研究与应用
[J].
Research and application of machine learning algorithm based on relevance vector machine
[J].
Hyperspectral image classification using relevance vector machines
[J].DOI:10.1109/LGRS.2007.903069 URL [本文引用: 1]
基于非负矩阵分解的相关向量机短期负荷预测模型
[J].
A short-term load forecasting model based on relevance vector machine with nonnegative matrix factorization
[J].
单核和多核相关向量机的比较研究
[J].
DOI:10.3969/j.issn.1000-3428.2010.12.067
[本文引用: 1]
针对相关向量机中的核函数选择问题进行研究,对高斯核函数进行改进,提出修正的高斯核函数方法,并比较改进的高斯核函数与普通高斯核函数的特性,证明提出的核函数的优良特性。在对单一核函数改进的基础上,进行多核相关向量机核函数的研究,结合局部性高斯核函数和全局性多项式核函数形成混合核函数,并运用于相关向量机。在不同大小的数据集上对几种核函数进行对比实验,验证修正的高斯核函数及混合核函数的性能。
Comparison research of single kernel and multi-kernel relevance vector machine
[J].
DOI:10.3969/j.issn.1000-3428.2010.12.067
[本文引用: 1]
This paper researches the selection problem of kernel function for Relevance Vector Machine(RVM). Improved Gauss kernel function is proposed. The characteristic of improved Gauss kernel function and normal Gauss kernel function are compared. The improving performance of proposed kernel function is validated. Besides the improving of single kernel function, multi-kernel RVM is researched, by combining local Gaussian kernel and global polynomial kernel, form multi-kernel function, and use it in RVM. Comparison experiments of kinds of kernel functions run on different datasets, and the performance of improved Gauss kernel function and mixture kernel function are validated.
一种基于多核相关向量机的模拟电路故障预测方法
[J].
Analog circuit fault prognostic approach based on MKRVM
[J].
自适应多核组合相关向量机预测方法及其在机械设备剩余寿命预测中的应用
[J].
DOI:10.3901/JME.2016.01.087
[本文引用: 1]
针对支持向量机(Support vector machine, SVM)的惩罚系数难以确定、核函数必须满足Mercer定理等问题,相关向量机(Relevance vector machine, RVM)应运而生以解决上述问题,并在趋势预测等领域得到一定的应用。核函数是决定RVM预测精度的关键因素之一,目前的研究通常是人为选择单一核函数,因此增加了对参数的依赖性并降低了RVM预测的鲁棒性。为了解决以上问题,提出一种新的自适应多核组合RVM预测方法。该方法首先选择多个核函数,利用粒子滤波产生核函数权重,建立多核组合RVM集,然后经过不断地迭代预测、权值更新和重采样,自适应获取最优多核组合RVM,从而自适应融合多个核函数的特性,克服基于单一核函数RVM的局限,提高预测精度和鲁棒性。利用仿真对提出方法进行了验证,并将其应用于机械设备的剩余寿命预测,取得了比基于单一核函数RVM更好的预测效果。
A relevance vector machine prediction method based on adaptive multi-kernel combination and its application to remaining useful life prediction of machinery
[J].
DOI:10.3901/JME.2016.01.087
[本文引用: 1]
In view of some shortcomings of support vector machine, for instance, it is difficult to select the regularization parameter and the kernel function must satisfy Mercer’s condition, relevance vector machine (RVM) is developed and applied to the field of trend prediction. The performance of RVM, to a large extent, depends on the kernel function. However, a single kernel function is generally selected artificially and subjectively in current studies on RVM, which increases its dependency of the RVM to parameters and decreases the robustness in prediction process. To solve the problem, a new adaptive multi-kernel RVM is proposed for prediction. In the method, multiple kernel functions are selected originally and their weights are generated by the particle filter (PF) algorithm to construct multi-kernel RVM models. Then the optimal multi-kernel RVM model is obtained by iterative processes, i.e., predicting, weights updating and resampling. The effectiveness of the proposed method is validated by a simulation study and a case study of remaining useful life prediction of machinery. The results demonstrate that the proposed method obtains higher prediction accuracies compared with the single kernel RVM models.
Gaussian小波SVM及其混沌时间序列预测
[J].
Gaussian wavelet SVM and its application to chaotic time series forecasting
[J].
WSVM with morlet wavelet kernel for image compression
[C]//
一种基于Morlet小波核的约简支持向量机
[J].
Novel reduced support vector machine on Morlet wavelet kernel function
[J].
基于模糊Bagging-GBDT的短期负荷预测模型研究
[J].
Study on short-term load forecasting model based on fuzzy Bagging-GBDT
[J].
基于深度信念网络的短期负荷预测方法
[J].
Short-term load forecasting based on deep belief network
[J].
基于经验模态分解与特征相关分析的短期负荷预测方法
[J].
Short-term load forecasting method based on empirical mode decomposition and feature correlation analysis
[J].
/
| 〈 |
|
〉 |
