变电站安全运维装置技术方案 *
Technical Scheme of Substation Safety Operation and Maintenance Device
通讯作者: 李恒,男,1977年生,高级软件开发工程师。主要研究方向为电力系统智能技术。E-mail:harrile77@hotmail.com
收稿日期: 2020-02-21 修回日期: 2020-06-4 网络出版日期: 2020-12-25
基金资助: |
|
Received: 2020-02-21 Revised: 2020-06-4 Online: 2020-12-25
作者简介 About authors
李金,男,1979年生,硕士,教授级高工。主要研究方向为电力系统自动化技术及管理。E-mail:
张喜铭,男,1980年生,硕士,教授级高工。主要研究方向为电力系统调度自动化相关技术及管理。E-mail:
谢型浪,男,1990年生,硕士,工程师。主要研究方向为电力信息化系统建设管理。E-mail:
当前在变电站内无论是生产设备运维还是生产系统运维,都需要外部计算机或U盘的介入,这给变电站运维带来极大的不安全性及管理难度,为此提出一种安全运维解决方案,使用一台移动计算机设备满足变电站内所有的运维工作。变电站内的运维场景多种多样,从应用层完全覆盖较为困难,针对这一问题,技术偏向更为底层的虚拟化技术,结合一整套管理方法,对变电站运维的基础设施进行管理,有效分割各个运维环境,并且在运维当中优化操作流程,减少运维人员对底层技术的关注。虚拟机的管理对使用人员相对透明,使得变电站内运维更加安全、易用、可控和高效,并通过一个试点项目,验证了运维装置可行且易用。
关键词:
Now in the substation whether it is production equipment operation or production system operation, the intervention of external PC or USB are needed, which brings great insecurity and management difficulty, a safety operation and maintenance solution is proposed, the program obtains the use of a mobile PC equipment to meet all the operation and maintenance work in the substation. To deal with the complex operation and maintenance environment, the scheme adopts virtualization technology and proposes a set of management methods, which can manage the changes of multiple virtual machines and various states, effectively divide the various operations environment, and simplify the operation process in the operation and maintenance, reduce the focus of the operation and maintenance personnel on the underlying technology, the management of virtual machines is relatively transparent to users, making the internal operation of the substation more safer, easy to use, controllable and efficient, and a pilot project proves that the operation and operation device is feasible and easy to use.
Keywords:
本文引用格式
李金, 张喜铭, 谢型浪, 李恒.
LI Jin, ZHANG Ximing, XIE Xinglang, LI Heng.
1 引言
基于上述事实,本文基于电网安全、运维复杂度方面进行相关技术研究,给出使用一台移动计算机设备完成变电站内相关系统运维工作的技术解决方案。
2 变电站安全运维技术方案
国家电网和南方电网公司对电网中运行的软件及硬件进行入网检测,检测过的软件和硬件都可以在电网内进行部署。目前变电站内软硬件的部署都依赖电力系统提供商进行支持,并通过自身携带的计算机和U盘等外设进行部署,带来安全隐患:① 部署的软硬件和入网检测版本不一致,带来不可控性;② 计算机和U盘可能携带病毒。
电力系统提供商按照电网公司要求进行入网检测,对于完成入网检测的软硬件来说,其软件版本已经进入系统内,就不再需要电力系统提供商部署自身携带的软硬件。本方案在变电站内提供一台移动计算机作为安全运维装置,当进行运维时,入网软件推送到该装置,运维人员即可在变电站内使用该运维装置进行所有的运维工作,这就要求安全运维装置具有便携性、运维安全性和易用性。
安全运维装置必须是可移动的,方便携带,在变电站内不同的位置进行运维操作。本方案使用一台移动计算机即可,同时安全运维装置采用必要的物理隔离手段,关闭或拆除软盘驱动、光驱驱动、USB接口、串行口等,达到运维装置的物理安全。
易用性上,本方案采用在安全运维装置上运行一套运维软件,设计运维流程,实现所有的运维操作。运维流程包括运维人员安全登录、运维资源下载和上传、运维资源安全运行等主要功能。由于运维资源的复杂性,运维装置上仅提供虚拟机来进行运维的操作,不做更高层管理。
本方案已经应用到南方电网的试点项目上,下文论述提供的实例描述为该试点项目上应用的运维软件。
2.1 人脸识别技术应用
人脸识别技术应用到运维人员登录和运维过程中。运维装置配置有摄像头,运维软件在运维人员登录以及运维过程中会捕获用户的人脸信息,并进行人脸鉴别。
2.1.1 用户登录人脸识别
运维人员登录时,除了密钥鉴别以外,还进行人脸鉴别。如图1所示,窗口可实时显示人脸并捕获,然后发送到地级主站进行人脸鉴别。
图1
人脸识别技术采用开源的dlib程序库,调用其接口实现图像内人脸捕获、特征提取及特征值比较。
(1) 程序加载白名单内运维人员人脸信息,计算特征值。
(2) 程序抓取摄像头图片。
(3) 程序从图片中捕获人脸。
(4) 计算人脸特征值。
(5) 和白名单特征值比较,获取一致性大于60%,且一致性最大值的白名单运维人员ID。
(6) 获取的运维人员ID与用户登录框内用户ID一致,人脸识别成功,否则失败。
2.1.2 运维过程人脸识别
运维过程中,运维软件定时对当前运维人员进行人脸信息捕获并识别,识别为非运维人员时,调动锁屏模块,禁止人员操作,待运维人员进行人脸识别通过后,取消锁屏,可继续操作。
2.2 运维单设计
运维人员登录后进入运维操作准备阶段,该阶段包括:① 运维软件和运维对象配置信息的下载;② 运维环境包括虚拟机及网络设施的选择和设置。
运维操作准备采用一键式自动化方式,保证运维易用性。为此,提出了运维单的概念,运维单在地级主站进行定义,包括以下信息。
(1) 运维单号。
(2) 运维时间设置:预计开始时间、预计结束时间等。
(3) 运维人员信息,包括且不少于人员ID、姓名、人脸信息。运维人员可以是多个。
(4) 运维软件,包括软件名称、版本、软件URL等信息。
(5) 运维对象配置文件(可选项)一般表现为一个压缩包,为某次运维过后备份的配置信息。
(6) 虚拟机信息,主要为运维软件可运行的操作系统信息,具体信息参考第2.3节虚拟化管理。
运维单开具后,运维人员在厂站端的运维装置上登录,随后可以按运维单定义自动化处理。运维时序图如图2所示。
图2
(1) 运维人员登录后,其参与的运维单自动下载到运维装置。
(2) 运维单对应的软件、配置文件一一列出,可供下载。
(3) 运维单对应的虚拟机自动开启。
(4) 运维软件和配置文件下载后直接映射到虚拟机中。
(5) 虚拟机的显示嵌入到运维软件当中,运维人员不用考虑虚拟机的细节,即可直接在该虚拟机上操作,进行运维。
(6) 完成运维后及时备份数据,并关闭虚拟机。
(7) 由于运维的复杂性和多任务性,虚拟机可以开启多个,各自的运维任务互不影响。
图3
点击【运维过程记录】可弹出新界面,如图3所示,运维人员可以将本次运维操作过程记录下来,也可以将一些重要的或需要注意的事项记录下来,以备下次查看。
点击“虚拟机”选项卡,如图4所示,可以看到启动中的虚拟机。当虚拟机启动完成后,运维人员可以在当前虚拟机中通过从调度主站下载的升级包、工具及文件等,对变电站内的装置进行安全运维、升级。
图4
2.3 虚拟化技术
(1) 运维装置上预先创建几个基础的、不同种类的虚拟机镜像,例如:Windows虚拟机、Linux虚拟机等。本方案定义为“基础镜像”。
(2) 运维人员需要运维环境时,可以从基础镜像克隆一个以供使用,本方案定义为“应用镜像”。
(3) 当现场运维需要一个不同的运维环境时,能够创建一个新的基础镜像,并由这个基础虚拟机克隆出应用镜像,再由应用镜像运行为虚拟机。
(4) 资源紧张时,可以删除虚拟机。
(5) 可以配置虚拟机的CPU、内存、网络以及磁盘。
(6) 实现虚拟机的自动运行、暂停、关闭功能。
(7) 虚拟机和宿主机进行目录映射,以达到虚拟机和宿主机文件共享。
(8) 建立镜像仓库,以达到全网复用,而不是每个变电站都创建相同的虚拟机。
(9) 虚拟机嵌入运维窗口中,达到虚拟机对运维人员透明。
图5是虚拟机运行状态图。
图5
现有的虚拟化技术包括:基于内核的虚拟机(Kernel-based virtual machine,KVM)、Xen、VirtualBox、VMware等,其中,VirtualBox和VMware是桌面软件,无法满足虚拟机嵌入运维窗口的需求,而Xen不支持Windows虚拟机也被排除。因此本方案采用KVM[16]技术进行虚拟机管理,调用其内核接口,方便地进行运维装置上的虚拟化管理。
(1) 虚拟机创建与迁移。
虚拟机的创建一般需要操作系统的iso文件,通过qemu-img[17]工具创建虚拟机文件,然后通过virt-install工具指定iso文件,并在虚拟机窗口进行安装。窗口一般通过VNC协议来连接虚拟机,需要先安装VNC服务,再用vnc-viwer显示窗口。
使用KVM创建Windows虚拟机,首先需要安装virtio驱动,此驱动是必需的,否则就会找不到硬盘。在virt-install命令中指定参数--os-type=windows, --os-variant=win2k12, bus=virtio.
虚拟机安装需要通过参数--network bridge:eth1指定桥接网卡,宿主机修改桥接网卡IP设置,虚拟机获得内部网卡用以和外部通信。
也可以通过迁移的方式利用来创建虚拟机。本方案只需要考虑静态迁移,不需要保留工作负载。静态迁移需要关闭或者暂停虚拟机,然后进行镜像文件的复制[18]。
(2) 虚拟机克隆。
克隆和保存虚拟机需要在系统内打标签,进入统一管理。标签实际是改变了镜像名称,并建立和标签的映射关系,当需要按标签查找时,能找到对应的镜像。
克隆虚拟机时序如图6所示。
图6
① 用户给虚拟机管理引擎下达克隆任务。
② 虚拟机管理引擎调用virt-clone工具执行克隆任务。
③ 在虚拟机管理引擎里给新虚拟机创建标签。
(3) 保存应用镜像到基础镜像。
只需要将虚拟机的镜像的标签添加“base”即可,“base”是基础镜像的专用标签名。时序图如图7所示。
图7
(4) 虚拟机的运行。
调用接口可以运行、暂停和关闭对应的虚拟机。
(5) 宿主机与虚拟机共享目录。
虚拟机在运行时可以设置宿主机与虚拟机直接共享目录,这使得用户不用再关心虚拟机及宿主机之间的情况,可以完全把虚拟机当作在宿主机的一个窗口进程使用。
(6) 通过界面访问虚拟机。
KVM虚拟机支持虚拟网络控制台(Virtual network console,VNC)访问,本方案采用Qt代码库实现了VNC客户端,把虚拟机显示到运维窗口 中[21]。
3 试点项目实际应用
此安全运维系统被应用到了南方电网的试点项目上,实现了在网级主站提交软件、地级主站下载软件、管理运维单的功能,而运维装置则实现了上述技术方案,并且应用到了两个场景上:扩建站远动配置和变电站监控版本升级。
用户在运维装置上运行运维软件,登录后界面如图3所示。
运维软件中左侧是运维任务列表,右侧为实际的运维任务窗口,包含了运维任务的具体内容及虚拟机窗口,虚拟机嵌入在运维窗口中,运维人员可直接在虚拟机窗口上进行运维操作,而无需考虑如何管理虚拟机。
虚拟机的管理和运维任务关联,在定义运维任务时就定义了要使用的虚拟机。随着运维任务的开启、暂停和关闭,虚拟机的状态也随之变化。另外,虚拟机网络和文件目录按照运维任务统一关联进行映射。对虚拟机来说,也不用关心运维时的网络设置和文件操作。
利用虚拟化技术在运维装置上进行虚拟机管理,不同的电力系统提供商、不同的运维对象进行运维任务时开启不同的虚拟机。利用虚拟机既有效隔离了运维环境,又使得运维能独占运维装置资源。本方案的优点是不用考虑虚拟机和宿主机的文件系统和网络系统,给用户以透明使用。
3.1 扩建站远动配置
运维人员到达厂站,获取运维装置后按以下步骤进行远动机调试。如图8所示。
图8
① 运维终端获取认证权限。
② 认证通过,获取工程备份。
③ 对自动化设备进行配置、调试。
④ 下传配置到远动机。
⑤ 远动对点,验收后新工程备份。
⑥ 工程备份同步到运维服务器。
具体到运维软件来说,就是用户登录后获取对应的运维单,如图3所示,图右侧为运维单详细信息,包含待下载软件列表。
软件下载后,可以使用此运维装置连接二次设备,然后在虚拟机里进行运维操作。如图4所示。
3.2 变电站监控版本升级
运维人员到达厂站,获取运维装置后按以下步骤进行监控主机升级。如图9所示。
① 运维终端获取认证权限。
② 认证通过,获取监控补丁。
③ 运维终端下发升级补丁程序到监控主机。
④ 监控主机与运维终端对程序版本进行校验。
⑤ 升级后监控系统运行正常。
在运维单里下载程序补丁版本,使用运维装置连接监控主机,对监控程序进行补丁升级。
图9
4 结论
通过实际的试点项目,验证了整个方案的可行,得出如下结论。
(1) 运维装置安全可控,利用一台运维装置,也就是移动计算机,可以进行变电站内的大部分运维操作,避免了之前运维过程当中外部设备带来的安全隐患。
(2) 运维软件安全可控,运维所需的软件及版本来自入网测试版本,避免了之前运维过程中运维厂家使用非入网版本带来的安全隐患。
(3) 运维过程安全、易用、可控,运维过程当中,运维人员、运维数据及操作过程全部被记录下来,可被追踪。同时运维流程化处理,带来了简单易用的运维过程,避免了个人操作的随意性带来的安全隐患。
当然,在实际试点应用中也暴露了一些不足,例如,整个运维流程还不够优化,中心化的虚拟机镜像仓库没有实现,但是并不影响试点项目的运行,将来随着试点的推广,适时实现的镜像仓库,将对全网复用会起到积极的作用。
整套运维管理体系结构清楚、流程完备,为将来电力系统智能运维提供了有效解决方案。
参考文献
变电运维一体化作业风险管控
[J].
Risk control of integrated operation of variable power operation
[J].
智能电网二次设备运维新技术研讨
[J].
New technology research on secondary equipment operation maintenance for smart grid
[J].
具有验电与接地一体化的智能挂接地线装置
[J].
DOI:10.11985/2019.01.012
URL
[本文引用: 1]
接触网日常停电检修挂接地线是保障安全作业的关键环节。在传统操作中,必须先使用验电杆验电无误后再挂接地线。检修人员需携带多种绝缘工器具,在检修过程中频繁更换作业工具,不仅需要占用较长的本就有限的夜间施工时间,还会造成误拿工器具的重大安全隐患。针对该问题,分析了传统接触网验电放电接地模式存在的安全隐患和不足,设计了具有验电与接地一体化的智能挂接地线装置,较好地解决了传统验电放电和人工挂接地线过程中存在的问题,在保障接地操作安全的同时有效缩短了作业准备时间,提高了检修作业效率。
Intelligent hanging grounding line device with integrated electroscope and grounding
[J].
直流功率调制对黑龙江电网功角稳定性的作用分析
[J].
Study of rotor angle stability of Heilongjiang power grid by HVDC power modulation
[J].
变电运维安全隐患及其解决方案探讨
[J].
Discussion on safety hidden trouble and its solution of substation operations
[J].
KVM虚拟化技术:实战与原理解析
[M].
KVM:Principles and practices
[M].
电力二次系统安全风险评估研究综述
[J].为降低电力二次系统安全风险整体水平,实现智能电网条件下电力系统高效运行,对电力二次系统安全风险评估研究进行了综述。分别从二次设备、信息系统和人为因素3方面论述二次系统风险因素的来源,综述各风险因素的作用形式和对一次系统的影响。从二次设备、信息安全和人为风险3个领域总结并评述了国内外电力二次系统风险评估的研究现状,从模型方法、数据来源和风险指标等方面比较了已有研究成果的优点和不足。分析了在智能电网条件下,电力二次系统安全风险评估面临的系统复杂性、风险因素来源综合多样和风险基础数据缺乏等问题与挑战,并指出未来二次系统风险评估的研究方向为风险因素、数据获取、评估模型和风险应用4个方面。
A survey of research on security risk assessment of secondary system
[J].To reduce overall security risk level of secondary system and implement efficient operation of power system in the environment of smart grid, the research on security risk assessment of secondary system is summarized. The sources of security risk in secondary system are expounded in three aspects, i.e., the secondary devices, information system and human factors, and the ways, by which these risk factors play roles, as well as the affections of these risk factors on primary system are summed up. In the fields of secondary devices, information security and human risks, present state of the research on risk assessment of secondary system home and abroad is summarized and reviewed, and the advantages and disadvantages of existing research results are compared in modeling methods, data sources and risk indices. Such problems and challenges as system complexity, diversity of data sources and lacking in fundamental data of the risk, which the security risk assessment of secondary system has to be faced with under the condition of smart grid, are analyzed, and it is pointed out that the attention of the research on security risk assessment of secondary system in the future should be paid to following four aspects risk factors, risk data acquisition, risk assessment models and application of risk assessment results.
电力系统信息安全研究综述
[J].DOI:10.7667/j.issn.1674-3415.2011.10.026 URL [本文引用: 1]
Survey of cyber security research in power system
[J].
云计算背景下电力信息系统安全技术探析
[J].
Analysis of the security technology of power information system under the background of cloud computing
[J].
关于电力变电站接地若干问题的讨论
[J].
DOI:10.11985/2019.01.016
URL
[本文引用: 1]
详细介绍了变电站内接地网的相关内容,通过分析站内、站外接地阻抗以及电流分布情况,确定经接地网入地的最大接地短路电流,介绍了站内保护接地网、等电位接地网和相应接地电阻评价标准,以及站内直流地、交流地问题与站内同一个接地网的对应关系,相关内容能够为变电检修人员以及变电站设计人员提供参考。
Discussion about several issues on substation grounding
[J].
智能变电站IEC 61850 Ed 2.0工程配置应用方案
[J].
Engineering configuration scheme based on IEC 61850 Ed 2.0 in smart substation
[J].
基于虚拟同步机的光伏并网系统控制研究
[J].
Research on grid-connected photovoltaic system control based on virtual synchronous generator
[J].
基于电力4G专网的继电保护智能移动运维平台的应用
[J].
Application of intelligent mobile operation and maintenance platform for relay protection based on power 4G special network
[J].
云计算虚拟化技术的发展与趋势
[J].
集成Docker容器的OpenStack云平台性能研究
[J].
DOI:10.3969/j.issn.1000-3428.2017.08.005
URL
[本文引用: 1]
针对OpenStack云平台虚拟机未能较好利用宿主物理机资源的问题,结合基于组件工作的OpenStack在云平台管理中的高效性和Docker容器虚拟化的快速部署优势,搭建基于Docker容器技术的OpenStack云平台。对云平台管理的Docker容器中实际运行的客户机操作系统进行计算、调度、内存访问、文件读写等基础性能测试,做出相关性能的评估与分析,并在多实例运行状态下将其与OpenStack传统虚拟机进行性能比较。分析结果表明,该云平台能够利用Docker容器的轻量级虚拟化优势,优化云计算管理系统的计算性能和文件读写性能。
Performace research of OpenStack cloud platform integrated with Docker container
[J].
CMI:An online multi-objective genetic autoscaler for scientific and engineering workflows in cloud infrastructures with unreliable virtual machines
[J/OL].
基于Libvirt库的虚拟机状态监控工具设计与实现
[C]//
Design and implementation of virtual machine state monitoring tools based on Libvirt library
[C]//
基于利用率提升的服务器虚拟化技术应用探讨
[J].
Discussion based on the utilization of technology to enhance server virtualization
[J].
/
〈 |
|
〉 |
