电气工程学报, 2023, 18(2): 192-200 doi: 10.11985/2023.02.019

电力系统

基于DDPG算法的发电企业报价策略研究

马丽莹,, 魏云冰,

上海工程技术大学电子电气工程学院 上海 201620

Research on Bidding Strategy of Power Generation Enterprise Based on DDPG Algorithm

MA Liying,, WEI Yunbing,

School of Electronic and Electrical Engineering, Shanghai University of Engineering Science, Shanghai 201620

收稿日期: 2022-08-31   修回日期: 2022-11-19  

Received: 2022-08-31   Revised: 2022-11-19  

作者简介 About authors

马丽莹,女,1995年生,硕士研究生。主要研究方向为电力市场中长期交易,电力系统自动化。E-mail:848296323@qq.com

魏云冰,男,1970年生,博士,教授。主要研究方向为电力市场中长期交易,电力系统自动化。E-mail:wei.yunbing@sues.edu.cn

摘要

随着智能代理算法在解决发电企业代理报价策略问题中的优势不断凸显,国内外相关研究层出不穷。由于我国电力市场发展成熟度不够高,目前多数研究采用的是国外电力市场的交易模式,这不符合我国电力市场交易的实际情况,因此提出一种针对国内电力市场中长期集中竞价交易的报价模型。该报价模型建立在深度确定性策略梯度算法(Deep deterministic policy gradient,DDPG)的基础上,提出兼顾社会总效用最大化和发电企业自身收益的报价策略,建立了以市场环境和发电企业自身情况为参考的状态空间,同时还建立了按照统一边际价格出清的市场出清模型。通过仿真算例验证了该模型的可行性,并与Q-Learning算法的结果进行对比,同时也展现了发电企业自身情况对报价模型的市场出清结果和企业收益的影响。

关键词: 电力市场; 报价策略; 强化学习; DDPG算法

Abstract

With the advantages of intelligent agent algorithm in solving the problem of agent quotation strategy in power generation enterprises, there are many relevant researches at domestic and abroad. Due to the immaturity of China’s power market, most of the researches are based on the foreign power market transaction mode, which does not accord with the actual situation of China’s power market transaction, so a medium-long term centralized bidding quotation model is put forward for domestic power market. This quotation model is based on deep deterministic policy gradient(DDPG) algorithm, a quotation strategy is proposed considering the maximization of total social utility and the income of power generation enterprises. The state space is established with the market environment and the situation of the power generation enterprise as the reference, and the market clearing model is established according to the unified marginal price. The feasibility of the model is verified by simulation examples, and the results are compared with those of Q-Learning algorithm. At the same time, the influence of the power generation enterprise’s own situation on the market clearing results of the quotation model and the enterprise income is also shown.

Keywords: Electricity market; quotation strategy; reinforcement learning; DDPG algorithm

PDF (377KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

马丽莹, 魏云冰. 基于DDPG算法的发电企业报价策略研究[J]. 电气工程学报, 2023, 18(2): 192-200 doi:10.11985/2023.02.019

MA Liying, WEI Yunbing. Research on Bidding Strategy of Power Generation Enterprise Based on DDPG Algorithm[J]. Chinese Journal of Electrical Engineering, 2023, 18(2): 192-200 doi:10.11985/2023.02.019

1 引言

随着新一轮电力体制改革的启动,电力市场的建设工作已成为电力市场改革的重点[1]。发电企业的竞价行为也成为了重要的研究内容之一,在电力市场的长期交易中,采取科学的竞价交易策略,使得市场主体收益最大化对发电企业以及电力市场的发展具有重要的意义[2]。随着智能代理算法的进一步发展,其在电力系统各类优化问题中的优势也逐渐显现出来。现如今,国内外学者在发电企业报价策略方面关注颇多,并取得了显著的研究成果[3]

文献[4]主要阐述了智能代理算法在电力市场仿真方面的应用,总结了众多学者应用智能代理算法解决电力市场问题的实例,由此可以看出在对电力市场方向进行研究时,智能代理技术的应用较为广泛。文献[5]在研究发电企业报价问题时,以英国电力市场情况为例,提出了概念化的模型并结合动态规划方法进行解决。文献[6]提出的发电企业竞价博弈模型建立在对发电企业自身收益考虑的基础上,兼顾了市场上多个主体参与博弈的情况,最终通过强化学习算法多代理技术对相关模型进行求解。文献[7]建立了基于模糊Q学习算法的发电企业报价策略模型,将模糊推理的相关知识与强化学习算法巧妙结合,提出了含有混沌因子的模糊Q学习算法。文献[8]运用Q学习算法解决了日前市场的报价策略问题,通过建立智能的报价方法克服了传统报价策略的缺点,但Q学习算法只适用于低维、离散的状态和动作空间,因此对较为复杂的竞价情况难以适用。文献[9]开发出了基于联邦能源管理委员会批发电力市场规则的电力市场代理仿真系统,并建立强化学习VRE(Value reword environment)算法框架来求解电力市场的竞价博弈行为,但其在报价方法的针对性方面稍显不足,这是由于没有考虑到发电企业所处的状态所导致的。文献[10]将可变学习速率和策略爬山算法相结合,构成多智能体强化学习方法,进而求解针对电力现货市场不同定价机制下建立的发电企业报价双层优化模型,由此进一步验证了强化学习算法在报价决策中的适用性。文献[11]采用多代理仿真方法,建立日前市场出清模型,对发电企业采用单组报价和多组报价时的市场力进行研究,并且定量分析了其对市场主体参与市场的利润影响,对中长期电力市场多代理仿真方法的设计有一定的指导意义。

常见的发电企业报价策略的研究方法大多都需要对市场和竞争对手的报价信息有充足的了解,但实际中这些信息都较难以获取,这将会使得发电企业给出的报价策略不够优化且缺乏有效的应对机制。

鉴于此,本文采用的报价策略模拟多市场的电力交易过程,将发电企业难以获取的外界信息(例如竞争对手的报价、成本以及策略等信息)当作该发电企业所处的外部环境,发电企业在所处的环境中通过策略梯度给出可行的动作,并利用在以往竞价活动中获取的报价经验来指导自身形成一个最优的策略。

本文构建了基于DDPG(Deep deterministic policy gradient,DDPG)算法的发电企业中长期交易模型,以社会总效用最大化为目标,将电力市场环境情况和发电企业自身发电能力等作为算法的状态空间,把发电企业申报的售电价和售电量的系数作为动作空间,按照统一边际出清价格的出清方式建立了中长期电量交易市场集中竞价交易的模型,并采用强化学习DDPG算法进行求解。DDPG算法将Nature DQN(Nature deep Q-learning)、演员-评论家算法(Actor-critic,AC)和确定性策略梯度算法(Deterministic policy gradient,DPG)三种算法结合起来,促进了神经网络更有效地学习,使得DDPG算法的收敛速度大幅加快。

2 电力市场结构

2.1 电力市场交易流程

我国电力市场中长期集中撮合交易过程主要是由电力调度交易机构组织买卖双方进行报价,经过高低匹配配对成功后,将匹配结果交由电力调度交易机构进行安全校核,只有当匹配结果经校核通过后才可以正式签订交易合同[12]。大致分为如下五个步骤。

(1) 组织报价:电力交易机构发布交易公告和市场信息给买卖双方。

(2) 报价决策:买卖双方根据制定好的报价策略提交各自的申报电价和电量。

(3) 报价排序:在不同的交易时段,组织机构将所有卖家的申报电价由低到高排序,买家的排序正好相反,按照申报的电价由高到低的顺序进行排序。

(4) 交易匹配:集中竞价交易的原理是“高低匹配,梯级排队”。

(5) 市场出清:按照统一边际价格出清的机制给出最终的出清价格。

电力市场集中竞价交易的流程如图1所示。

图1

图1   电力市场交易流程图


2.2 电力市场出清规则

集中撮合交易采用“高低匹配,梯级排队”的方式进行配对,即将卖方的报价由低到高进行排序,买方的报价则由高到低排序,然后优先撮合卖方最低报价的发电企业和买方最高报价的购电方,其次是撮合卖方报价次低的发电企业和买方报价次高的购电方,以此类推进行购售电双方的交易匹配,最后一组实现供给与需求双方平衡时的价格,就是边际成交价格,即市场出清价格,所有匹配成交的购售电双方都将按照边际成交价格进行出清。交易匹配原理如图2所示。

图2

图2   市场交易匹配原理图


采用“高低匹配,梯级排队”的原理体现了电力市场的激励相容机制[13]。将购电报价最高的买方和售电报价最低的卖方优先成交,其次是将购电报价次高的买方和售电报价次低的卖方进行撮合。当发电企业自身的发电效率更高时,其相应的边际成本更低,给出的报价就可以更低,此时反而更容易匹配到购电报价较高的买方,反之,效率更高的购电方由于自身效益更好,给出的购电报价可以更高,则更容易匹配售电报价更低的卖方,这个机制在无形中激励着发电公司自我改革,提高发电效率,降低发电成本,以此来获得更大的利润空间,也激励着用电企业提高自身生产效率,以期在报价时可以压缩购电成本。这就使得在社会资源一定的情况下,发电方可以产生更多的电能,而这些电能优先供给社会效益更大的企业,以此实现社会总效用的最大化。

在经济学中,效用最大化是指在可支配资源有限的条件下,使得用户的需求得到最大限度满足的情况[14]。在本文中,社会总效用最大化就是在社会发电资源一定的情况下,使得更有效率的发电企业和购电企业优先获得发电和购电的权利,通过市场机制实现资源的最优化配置。

3 DDPG算法

DDPG是一种基于确定性策略梯度的无模型的行为评判算法,可以在连续状态和动作空间中运行[15]。其所采用的AC框架由两个神经网络组成,一个表示策略函数,另一个表示行动-价值函数。策略函数产生行动并与环境交互,行动-价值函数对行动者的表现进行评价,并指导行动者的后续行动[16]。DDPG算法同时也体现了DQN算法的思想,每种神经网络都细分为两个。Actor和Critic均有目标网络和现实网络。

在DDPG算法中,s表示t时刻时智能体agent所处的状态;s表示t+1时刻时智能体agent所处的状态;a代表t时刻时智能体agent采取的动作;r表示智能体在状态s下采取动作a后获得的奖励值;γ为衰变系数,取值为[0,1]的一个小数。

DDPG算法没有采用基于概率分布选择动作的随机策略,而是进行了简化,采用确定性策略μ进行动作选取,选取到最大概率的动作a=μ(s|θμ),其中θμ代表策略网络的参数,其目标函数J(θμ)可以定义为[17]

J(θμ)=Eθμ[r1+γr2+γ2r3+]

确定性策略μ选取动作后获得奖励的期望值可以用Q函数来表示

Qμ(s,a)=E[r+γQμ(s,μ(s))]

Q网络的参数用θQ来定义,当使用策略μs状态下选择动作时获得期望的回报值可以用Qμ(s,μ(s))来表示,对该期望进行求解时,可以采用积分的方式,这是因为动作空间是连续的,因此评判策略μ的好坏时可以用式(5)来表示[18]

Jβ(μ)=Sρβ(s)Qμ(s,μ(s))ds=ESρβ[Qμ(s,μ(s))]

SILVER等[19]在确定性策略梯度算法中证明了目标函数采用μ策略的梯度与Q函数采用μ策略的期望梯度是等价的,则有

J(θμ)θμ=ESQ(s,a|θQ)θμ

Actor网络采用确定性策略a=μ(s|θμ),其梯度为

J(θμ)θμ=ESQ(s,a|θQ)aπ(s|θQ)θμ
θJβ(μθ)=Sρβ(s)θμθ(s)Qμ(s,a)|a=μθds=ESρβ[θμθ(s)Qμ(s,a)|a=μθ]

Critic网络上的价值梯度为

L(θQ)θQ=Es,a,r,sDTargetQQ(s,a|θQ)Q(s,a|θQ)θQ
TargetQ=r+γQ(s,π(s|θμ)|θQ)

损失函数采取均方误差损失(Mean squared error,MSE),网络Q的损耗为

L(θQ)=E[(Q(s,a)y)2]
y=r+γQ(s,a)

得到两个网络的梯度后,就可以采用梯度下降法进行网络更新。由于采用了DQN的思想,因此在现实网络的基础上增加了一个目标网络,网络结构图如图3所示。

图3

图3   DDPG算法网络结构图


4 发电企业报价模型

4.1 发电企业报价的状态空间

强化学习算法有一个较突出的优势就是动作可以和环境交互,以此来获得更好的学习效果。因此,在建立发电企业报价模型的时候需要考虑发电企业所处的市场环境以及自身的发电能力来判断自身在当月市场交易中的市场份额等情况,以便分析当月的报价情况。

在组织月度集中竞价交易之前,电力交易中心会先将当月市场需求电量和发电企业的剩余发电能力等进行信息公开。这使得各个发电企业可以根据公示的信息分析电力市场的环境情况,例如电力市场供需情况等,也可以对自身的市场力和市场份额有一个较为清晰的认知。这两者对于发电企业制定自身的报价策略有着重要影响,因此将发电企业所处的市场环境状态和自身的市场份额两个因素作为发电企业报价策略的状态空间[20]

发电企业所处的市场环境状态用市场供需比RSD来表示,即为当月各个发电企业全部市场化电量的总和与市场总需求电量的比值。

RSD=i=1nqmiqD

式中,qD表示月度市场电量需求。

发电企业的市场份额用某发电企业的月度全部市场化电量和当月市场全部供给电量的比值来表示。发电企业的市场份额SM表示如下

SM=qmii=1nqmi

因此,可将状态空间表示为一个二维向量s=[RSD,SM],并将其作为策略网络Actor和评价网络Critic的输入。

4.2 发电企业报价的策略空间

在发电企业经济模型的基础上研究发电企业的报价策略,这就需要了解发电企业的发电成本等情况。假设市场内有n家发电企业S1,S2,,Sn,第i家发电企业申报的售电价和售电量分别为pSiqSi

如今参与集中竞价交易的发电企业主要为火力发电企业,火力发电成本模型一般情况下可用发电出力P的二次函数来表示[21]

C=a×P2+b×P+c

式中,C为发电企业的总发电成本;abc分别为发电成本二次函数的二次项系数、一次项系数和常数项系数。

一般情况下,发电企业按边际成本报价容易获得更多的收益。因此,本文在进行发电企业报价参考成本的选取时考虑用发电企业的边际发电成本来替代,发电企业边际发电成本C

C=2a×P+b
P=PE×cosφ

式中,cosφ为功率因数,取值0.8;PE为额定功率。

本文中,通过改变发电企业申报的售电价来变换不同的报价策略,给发电企业的边际成本乘上一个系数因子α,当α高于1时,发电企业报价高于自身边际成本,可以提高发电企业自身收益。由于电力商品是关系国计民生的重要资源,为防止发电企业利用自身市场力谋取暴利,需要对α的取值进行限制,因此将α的取值范围设为[1,1.2]。策略申报电价pSi

pSi=α×C

在电力市场集中竞价交易活动中,影响发电企业收益的因素不仅有发电企业申报的售电电价,还包括发电企业申报的售电量。通常情况下,发电企业将把月度全部电量扣除月度全部非市场化电量后剩余的全部市场化电量作为申报的售电量。在现行的市场出清机制下,发电企业可通过适当减少申报的售电量来抬高出清电价,以此获得更高的收益。因此,也可以通过改变发电企业申报的发电量来变换不同的报价策略,给发电企业当月全部市场化电量乘以一个系数因子β就可以得到发电企业申报的售电价qSi

qSi=β×qmi

式中,qmi表示第i家发电企业当月全部市场化电量,β的取值范围为[0,1]。

由此,报价模型中策略网络Actor的输出即为策略的动作空间,可表示为一个二维向量a=[α,β]

4.3 发电企业报价策略的奖励

发电企业采取报价策略的目的是使得自身获得更高的收益,这就需要在进行报价策略的选取时给出相应的奖励,激励策略的选取朝着发电企业自身收益增多的方向进行[22]。本文以发电企业的收益作为奖励,发电企业的收益由发电企业的交易收入和发电成本的差值构成。交易收入即为发电企业在当月交易中的成交电量和当月市场出清电价的乘积。可由式(18)来表示

I=qBi×pmc

式中,I代表发电企业在当月集中竞价交易中的收入;qBi表示第i家发电企业在当月交易中的成交电量;pmc表示当月市场出清电价。

因此,发电企业在当月集中竞价交易中的收益Re可由式(18)和式(13)之差求得

Re=IC

由此,报价模型中评价网络Critic的输出即为发电企业在当月集中竞价交易中的收益,即r=Re

4.4 发电企业报价的市场出清模型

在进行市场出清时,按照“高低匹配,梯级排队”的原理进行配对后,还需要对出清结果进行安全校核,安全校核由电力调度机构进行,只有通过安全校核的出清结果才能作为最终的市场出清结果,若安全校核未能通过则需要削减电量后再进行安全校核,直到安全校核通过后方可出清[23]。市场出清的原理如图4所示。

图4

图4   市场出清原理图


由我国目前电力市场中长期交易现状可知,暂无安全校核未通过的情况出现,因此,本文的市场出清模型中暂不考虑电力网络的物理约束,将市场主体效用最大化作为目标函数。将发电企业申报的售电价由低到高排序,得到交易的供给曲线,将购电方申报的购电价由高到低排序得到需求曲线,这两条曲线的交点即为市场出清电价。

市场出清后,市场主体的社会总效用W为购电方电价pD与发电企业申报的售电价pS之差与当月交易成交电量qB的乘积

W=(pDpS)×qB

因此,发电企业报价策略的市场出清模型可定义为

maxi=1nW=(pDpSi)×qBi
s.t.i=1nqBiqSii=1,2,,n
qBi0i=1,2,,n

5 电力市场算例仿真

假设某一区域电网内有十家发电企业,相关的技术参数如表1所示。

表1   发电企业技术参数表

发电企业
序号
额定容量PE/MWa/(×106)b/(×103)c
G13000.0883051 150
G25000.0572851 280
G35500.0542811 340
G45500.0582791 300
G56000.0522741 420
G66000.0482721 400
G76500.0502671 480
G87000.0462641 550
G98500.0452601 650
G101 0000.0362521 800

新窗口打开| 下载CSV


该区域某年12个月的月度交易市场电量需求如表2所示。

表2   1—12月月度市场电量需求表

月份1月2月3月4月5月6月
电量需求/
(万kWh)
70 79465 06885 46978 05972 76485 502
月份7月8月9月10月11月12月
电量需求/
(万kWh)
56 40764 98271 04579 00482 44376 760

新窗口打开| 下载CSV


把当月集中竞价交易中的电力需求曲线假设为指数是4的幂函数,对市场需求拟合得到需求函数如式(24)所示

pD=0.360.05×qBQ4
qB=i=1nqBi

式中,qB为某月所有发电企业总成交电量;Q为月度市场电量需求。

当发电企业不采用本文所给的报价策略时,其报价方式是将全部市场化电量都按照边际成本价格进行申报。该区域这十个发电企业一年内各个月份全部市场化电量如表3所示。

表3   十个发电企业的月度市场化电量统计表 104kWh

发电
企业
1月2月3月4月5月6月7月8月9月10月11月12月
15 1704 4385 1704 9205 1704 9205 1702 0064 9205 1704 9205 170
28 8581 8821 3858 5078 8588 5078 8588 8588 5078 8588 5078 858
39 9638 6202 5439 5069 9639 5069 9639 9639 5069 9639 5069 963
48 0916 8838 0911 9798 0917 6788 0918 0917 6788 0917 6788 091
56 6225 5496 6226 2546 6226 2546 6226 6226 2546 6223996 622
68 8947 5778 8948 4448 8948 4444 8858 8944 5448 8948 4448 894
710 0818 58310 0819 56910 0819 56910 08110 0819 56910 0819 5693 711
811 2559 79211 25510 7583 01610 75811 2554 74210 75811 25510 75811 255
915 74013 67215 74015 03815 74015 03815 74015 74015 0382 86815 03815 740
106 30810 28512 27611 59312 2765 81612 27612 27611 59312 27611 59312 276

新窗口打开| 下载CSV


由发电企业的相关技术参数可求得发电企业的边际成本,如表4所示。

表4   十个发电企业边际成本统计表 元/(kWh)

发电企业12345
边际成本0.347 20.330 60.328 50.330.323 9
发电企业678910
边际成本0.318 10.3190.315 50.321 20.309 6

新窗口打开| 下载CSV


5.1 未采取报价策略的情景

本文在Python中利用PyTorch建立DDPG算法的应用框架,同时也建立发电企业市场出清的仿真模型。在未采取文中的报价策略时,发电企业按照上述的申报电量和申报电价情况进行市场出清仿真,得到的收益情况如表5所示。

表5   发电企业不采取策略时年度总收益情况表 万元

发电企业12345
年度总收益021.78613.44200.03615.19
发电企业678910
年度总收益1 542.821 772.812 298.162 908.353 386.92

新窗口打开| 下载CSV


5.2 采取Q-Learning算法的情景

当采用Q-Learning算法进行竞价行为模拟时,发电企业收益迭代过程如图5所示。

图5

图5   Q-Learning算法下十个发电企业的收益曲线


5.3 采取DDPG报价策略的情景

采取基于DDPG算法的报价策略进行仿真试验时的参数设置如下:发电企业总数n=10;衰减率γ=0.9;Actor网络学习率为0.000 1;Critic网络学习率为0.001;仿真次数N=1 000。分别将每一个发电企业作为Agent采用上述的报价策略进行报价。

十个发电企业的报价行为进行1 000次仿真试验后,发电企业的仿真试验迭代过程如图6所示。

图6

图6   十个发电企业总收益曲线图


图5图6的对比可以看出,该模型实现了发电企业竞价行为的模拟和仿真,并且相较于Q-Learning算法较快收敛到最终结果,相较于未采取DDPG报价策略时一些发电企业的收益有明显的增加,但发电企业的收益增幅不同,这与发电企业的自身发电条件有关。

发电企业总收益收敛过程的报价策略可以通过动作空间的系数曲线迭代图来表示,以发电企业2为例,发电企业2作为唯一Agent时的报价策略图如图7图8所示。

图7

图7   发电企业2的α系数曲线迭代图


图8

图8   发电企业2的β系数曲线迭代图


6 结论

本文建立了基于DDPG算法的发电企业报价模型和电力市场出清模型来模拟发电企业的市场出清行为,模型把发电企业在月度交易中申报的售电量和售电报价作为动作空间,将社会效用的最大化作为目标函数,以发电企业的自身收益为奖励,促使发电企业在实现社会效用最大化的同时自身也能获得更多的收益。对发电企业竞争行为的仿真结果进行分析可以得到以下结果。

(1) 仿真结果验证了本文建立的基于DDPG算法的发电企业报价模型和统一边际市场出清模型的可行性,与Q-Learning算法相比,收敛速度更快,且发电企业的收益也有所增加。

(2) 由仿真结果的对比可以看出,当发电企业的实际成本过高时或者过低时,采取报价策略对发电企业的市场出清情况不会造成很大的影响,当发电企业的成本处于市场边际情况时,采取一定的报价策略将对最终收益产生较大的影响。这是因为当发电企业的发电成本过高时,本身就不具备竞价的优势,无论采取何种报价策略都无法使其获得市场收益,例如发电企业1;当发电企业的发电成本较低时,在竞价行为中本身就占有优势,采取一定的报价策略面临的风险较大,采取常规的报价方式较为稳定,例如发电企业10;当发电企业的发电成本处于市场边际情况下,发电企业可通过适度减少申报电量来获取更多的成交机会,以增加自身收益,例如发电企业2。

(3) 本文的仿真算例没有考虑电网的实际约束和输电通道出现阻塞时的情况,这将作为后续的研究方向。

参考文献

张紫鹤, 卢继平.

国外电力市场建设对我国新时期电力市场化改革的启示与建议

[J]. 甘肃科技, 2021, 37(6):8-15.

[本文引用: 4]

ZHANG Zihe, LU Jiping.

Power market construction in foreign countries:Inspiration and suggestions for China’s power market reform in the new era

[J]. Gansu Science and Technology, 2021, 37(6):8-15.

[本文引用: 4]

曾嘉志, 赵雄飞, 李静, .

用电侧市场放开下的电力市场多主体博弈

[J]. 电力系统自动化, 2017, 41(24):129-136.

[本文引用: 1]

ZENG Jiazhi, ZHAO Xiongfei, LI Jing, et al.

Game among multiple entities in electricity market with liberalization of power demand side market

[J]. Automation of Electric Power Systems, 2017, 41(24):129-136.

[本文引用: 1]

陈慧, 杨勇, 张颖.

基于agent的电力市场仿真中决策模块的实现

[J]. 自动化学报, 2008, 32(2):22-26.

[本文引用: 1]

CHEN Hui, YANG Yong, ZHANG Ying.

Realization of decision-making module in agent-based simulation of power markets

[J]. Acta Automatica Sinica, 2008, 32(2):22-26.

[本文引用: 1]

刘梅招, 杨莉, 甘德强.

基于agent的电力市场仿真研究综述

[J]. 电网技术, 2005, 9(4):76-80.

[本文引用: 1]

LIU Meizhao, YANG Li, GAN Deqiang.

A review of power market simulation based on agent

[J]. Power System Technology, 2005, 9(4):76-80.

[本文引用: 1]

DAVID A K.

Competitive bidding in electricity supply

[J]. IEEE Proceeding GT & D, 1993, 140(5):421-426.

[本文引用: 1]

马天男, 杜英, 苟全峰, .

基于Berge-NS均衡的电力市场多主体非合作博弈竞争模型

[J]. 电力自动化设备, 2019, 39(6):192-204.

[本文引用: 1]

MA Tiannan, DU Ying, GOU Quanfeng, et al.

Multi agent non-cooperative game competition model of power market based on Berge-NS equilibrium

[J]. Electric Power Automation Equipment, 2019, 39(6):192-204.

[本文引用: 1]

张森林, 卢智.

关于全国统一电力市场框架体系的思考

[J]. 中国电力企业管理, 2021, 622(1):49-52.

[本文引用: 1]

ZHANG Senlin, LU Zhi.

Thinking on the framework system of national unified electricity market

[J]. China Electric Power Enterprise Management, 2021, 622(1):49-52.

[本文引用: 1]

董莎.

基于智能代理算法的发电商报价策略研究

[A]. 江西省电机工程学会, 2018.

[本文引用: 1]

DONG Sha.

Research on pricing strategy of power supplier based on intelligent agent algorithm

[A]. Jiangxi Institute of Electrical Engineering, 2018.

[本文引用: 1]

SUN Junjie, TESFATSION L.

Dynamic testing of wholesale power market designs:An open-source agent-based framework

[J]. Computational Economics, 2007, 30(3):291-327.

DOI:10.1007/s10614-007-9095-1      URL     [本文引用: 1]

唐成鹏, 张粒子, 刘方, .

基于多智能体强化学习的电力现货市场定价机制研究(一):不同定价机制下发电商报价双层优化模型

[J]. 中国电机工程学报, 2021, 41(2):536-553.

[本文引用: 1]

TANG Chengpeng, ZHANG Lizi, LIU Fang, et al.

Research on power spot market pricing mechanism based on multi-agent reinforcement learning(I):Two-tier optimization model of power supplier quotation under different pricing mechanisms

[J]. Proceedings of the CSEE, 2021, 41(2):536-553.

[本文引用: 1]

江婕, 荆朝霞, 朱继松.

基于多代理仿真的日前市场发电侧报价方式研究

[A]. 中国电机工程学会电力市场专业委员会, 2019:7.

[本文引用: 1]

JIANG Jie, JING Zhaoxia, ZHU Jisong.

Research on generation side quotation method of day-ahead market based on multi-agent simulation

[A]. Electric Power Market Committee of Chinese Society of Electrical Engineering, 2019:7.

[本文引用: 1]

刘妍, 谭建成.

南方区域大用户参与电力市场交易的现状及展望

[J]. 南方电网技术, 2017, 11(11):68-74.

[本文引用: 1]

LIU Yan, TAN Jiancheng.

Current situation and prospect of large users’ participation in power market transaction in southern region

[J]. China Southern Power Grid Technology, 2017, 11(11):68-74.

[本文引用: 1]

张军. 基于复杂自适应系统架构的发电商竞价仿真研究[D]. 北京: 华北电力大学, 2020.

[本文引用: 1]

ZHANG Jun. Research on bidding simulation of generator based on complex adaptive system architecture[D]. Beijing: North China Electric Power University, 2020.

[本文引用: 1]

罗歆尧.

消费者在日常活动中的效用最大化

[J]. 财讯, 2017, 19:155.

[本文引用: 1]

LUO Xinyao.

Consumer utility maximization in daily activities

[J]. Financial News, 2017, 19:155.

[本文引用: 1]

LILLICRAP T P, HUNT J, PRITZEL A, et al.

Continuous control with deep reinforcement learning

[C]// The International Conference on Learning Representations,San Juan,Puerto Rico, 2016.

[本文引用: 1]

HOU Yuenan, LIU Lifeng, WEI Qing, et al.

A novel DDPG method with prioritized experience replay

[C]// IEEE International Conference on Systems IEEE, 2017.

[本文引用: 1]

JIN Liqiang, TIAN Duanyang, ZHANG Qixiang, et al.

Optimal torque distribution control of multi-axle electric vehicles with in-wheel motors based on DDPG algorithm

[J]. Energies, 2020, 13(6):1-19.

DOI:10.3390/en13010001      URL     [本文引用: 1]

Renewable energy ship was regarded as one of the ship energy technologies with a good prospect. In order to study the application of solar and wind energy on ships in the marine environment and the impact of ship rolling on the system, the feasibility of applying solar energy and wind energy to ships was analyzed, and the structural composition of ship power system incorporating renewable energy source was studied. The model of the ship power system integrated with renewable energy was built in PSCAD/EMTDC simulation software. The layout of wind power generation system and photovoltaic power generation system was given for the actual ship, and the ship parameters and specific parameters of each simulation module were determined. It can be seen that the rolling of ship will cause fluctuations in the grid-connected power of the photovoltaic power generation system and the wind power generation system from the comparison of the simulation curves. Finally, a simulation experiment is provided to prove the access of the battery can well suppress the grid-connected power fluctuation caused by the rolling of the ship, which has an important impact on the stability of the ship power system with renewable energy.

王成亮, 李澄, 葛永高.

基于多智能体的配电台区智能决策系统研究

[J]. 信息技术, 2020, 44(10):49-55.

[本文引用: 1]

WANG Chengliang, LI Cheng, GE Yonggao.

Research on intelligent decision system of distribution platform area based on multi-agent

[J]. Information Technology, 2020, 44(10):49-55.

[本文引用: 1]

SILVER D, LEVER G, HEESS N, et al.

Deterministic policy gradient algorithms

[J]. Journal of Machine Learning, 2014, 31:387-395.

[本文引用: 1]

荆朝霞, 朱继松.

月度电量集中竞价市场规则的仿真实验分析

[J]. 电力系统自动化, 2017, 41(24):42-48.

[本文引用: 1]

JING Zhaoxia, ZHU Jisong.

Simulation experiment analysis of the rules of monthly electricity concentration bidding market

[J]. Automation of Electric Power Systems, 2017, 41(24):42-48.

[本文引用: 1]

何建华, 何祖威, 胡效雷.

基于成本分析的火电厂日前市场竞价上网报价

[J]. 重庆大学学报, 2008, 31(3):276-279.

[本文引用: 1]

HE Jianhua, HE Zuwei, HU Xiaolei.

Pricing of power plants based on cost analysis

[J]. Journal of Chongqing University, 2008, 31(3):276-279.

[本文引用: 1]

丁亮. 竞争性电力市场的发电商报价策略研究[D]. 杭州: 杭州电子科技大学, 2019.

[本文引用: 1]

DING Liang. Research on bidding strategy of generator in competitive power market[D]. Hangzhou: Hangzhou Dianzi University, 2019.

[本文引用: 1]

范晨凯. 南方区域跨区跨省中长期电力市场开发策略[D]. 北京: 华北电力大学, 2020.

[本文引用: 1]

FAN Chenkai. Development strategy of medium and long-term power market in southern region[D]. Beijing: North China Electric Power University, 2020.

[本文引用: 1]

/