![](/uploads/image/0901.jpg)
Vol. 17 No. 3Mar. 2021
第17卷第3期2021年3月
中国安全生产科学技术
Journal of Safety Sciencc and Tcchnolooy
doi : 10. 11731/j. issn. 1673-193x. 2021. 03. 019
*收稿日期:2020 - 12 -08
*基金项目:国家D!科学基金项目(61763049 );云南省应用基础研究重点课题项目% 2018FA032 &
作者简介:曾俊娣,硕士研究生,主要研究方向为智能电网攻击检测、电力大数据处理$
通信作者:,博士,副教授,主要研究方向为智能电网运行和控制、电力信息物理融合系统$
曾俊11,2,李 鹏1,2,高 莲1,2,沈 鑫3
河源论坛
% 1•云南大学 信息学院,云南昆明650500 ; 2•云南省高校物联网技术及应用重点实验室,云南昆明650500 ;
3•云南电网有限责任公司电力科学研究院,云南昆明650511)
摘 要:为实现智能电网中虚假数据注入攻击的实时检测,提高电力系统运行的安全性,采用1种基于时序近邻保持嵌入的方 法,对正常状态下采集到的电网历史量测数据建立离线模型,得到统计限,将实时数据通过模型获得的6统计量与离线模型 的统计限进行对比,若超过统计限,则说明存在虚假数据注入攻击。该方法在提取局部空间结构特征的基础上,可同时获得与时 间相关的动态特征$在IAEE30节点测试系统上进行仿真实验,并与ICA , PCA , NPE 方法进行比较。结果表明:所提方法有高达
100K 的检测率,且有较低的误报率,能够有效应用在虚假数据注入攻击的检测中$关键词:电力系统;状态估计;时序近邻保持嵌入;攻击检测
中图分类号:X934
文献标志码:A 文章编号:1673 - 193X (2021) -03 -0124 -06
Detection of false data injection attacks in smart grins based on time neighbor
preserving embedding (TNPE )
ZENG Junrao 1'2 , LI Peng 1'2 , GAO Lian 1'2 ,SHEN Xin 3
(1. School of Information , Yunnan University , Kunming Yunnan 650500 , China ;
2. Internet of Thinge Tcchnolooy and Application Key Laboratoe of Universitiee in Yunnan , Kunming Yunnan 650500, China ;
3. Yunnan PoweeGeid Co. 'Lid. 'Kunmin$ Yunnan 650511 'China )
Abstract : In order to rexliza tha rexl-tima detaction of false data injection attacks in tha smart grids and improve tha safety of
power system operation , a method based on tha time neighbor preserving embedding ( TNPE ) was adopted , and an odina
model was established for the historiccl measurement data of the power grid callacted under normal canditions to obtain 6 sta-
tisticcl limit. Tha 6 statistics obtained through tha model by tha rexl-tima data was campared with tha 6 statistical limit of tha offline model , and iC tha statistical limit was excaeded , it indicated that there was a false data injection attack. On the basis
oe4xieaaiin$ih4ioaaispaiiaisieuaiue4eaiue4s 'ihism4ihod aouid simuiian4ousiyobiain ih4iim4-e4iaid dynamiaeaiue4s. Tha simulation experiment was ccrried out on the IAEE30 node test system and campared with the ICA ,PCA,and NPE meth
ods. Tha resuOs showed that tha method proposed in this paper had a detection rata of up to 100% and a low false alarm rata , which ccn ba effectively applied in tha detaction of false data injection attacks.
Key words : power system ; state estimation ; time neighbor preserving embedding ; attack detaction
0引言
随着传感器、计算机和通信网络的飞速发展,现代电 力系统已成为复杂的信息物理融合系统(Cyber-Physical
Systems, CPS )[ W 虽然先进的网络通信技术使得电力
系统运行更加高效,但同时带来不可忽视的网络安全问十渡旅游攻略
题_5)$例如在2015年,乌克兰电网遭受到网络攻击, 220万居民受影响无法正常用电,导致巨大经济损
失[6]。保证电网安全可靠运作的1个重要条件是不良
数据检测,通过比较测量残差二范数与残差阈值来检测
数据是否正常。虚假数据注入攻击% False Data Injection Attacks , FDIAs )作为电网中1种新型的网络攻击方式,
3中国安全生产科学技术-125-
2009年由Liu等⑺提出,国内外学者开始对其进行研究$FDIAs通过改变状态变量,影响状态估计的准确性,从而使系统采集到错误的量测值。该攻击能够绕过不良数据检测模块,对电网造成极大威胁$为保证电力系统安全稳定运行,有效检测虚假数据注入攻击至今是1个值得研究的课题$
为抵御FDIAs对电网的危害,学者分别从保护方法和检测策略2方面进行研究$在保护方法上,Bobba 等
8通过保护基本量测点抵御FDIAs,但此方法要求基本量测点数量与电力系统母线数量相等,当电网规模较大时,保护成本过高;Deny等[9]为使防御策略的成本达到最低,将保护测量选择问题定义为混合整数非线性问题;Kim等(10)采用贪婪方法选择相角策略单元(Phase Mexsurement Unit,PMU&,对于抵御FDIA s的完美攻击具有一定的效果$在检测策略方面,Valenzuela等[11)使用主成分分析算法从潮流历史数据中生成规则子空间和不规则子空间,将当前的测量数据投影到不规则子空间中,对其进行分析,判断电力系统数据是否遭到破坏;Liu等[12]提出核规范最小化法和低秩矩阵分解法来检测电网中的FDIAs,并且对攻击数据进行恢复;石家宇等(131在拉普特征映射对历史量测数据降维的基础上,使用神经网络训19模型检测FDIAs;Hao等[14]基于鲁棒主成分分析方法设计检测方法,通过深度置信网络提取输入数据特征,然后训练模型去检测虚假数据注入攻击;Ozay等(15)将SVM,K-NN和感知机这3种机器学习方法用于FDIAs检测。
现有的FDIAs检测使用的机器学习算法在训练数据时需要正常数据和攻击数据,当缺少攻击数据时无法对其训练,且训练和攻击数据比例不同时,测试精度会发生改变$同时上述提到的主成分分析、鲁棒主成分分析没有考虑数据的局部特征,而电网攻击数据更多的表现为1种局部特征,数据具有时间相关性$
针对以上问题,本文提出1种新的FDIAs检测模型,该模型可同时提取空间和时间结构的信息,并且降维之后的数据保留了原有的局部流行结构$在电力系统实际运行过程中很难采集到足够多的攻击数据,
而使用本文模型训练数据时只需采集电力系统正常运行下的历史量测数据,建模后可对实时的量测数据进行分析,及时检测数据是否受到攻击。实验结果表明,本文所提出的方法具有较高检测率,能够有效应用到电网FDIA检当中$
1问题描述
1.状态估计
电力系统状态估计就是根据量测数据估计系统的状态,从实际应用情况来看,其主要功能包括提高量测数据的精度、简单的不良数据检测与辨识$在1个具有G条母线的电力系统中,系统的状态取为b&% (「久,…,(”)6,b D表示相位角,由于节点1为参考节点,故系统状态表示为b&%b丄3…,b”)6,将从控制中心获取到的”个量测值表示为)&%),),…点”)6,在直流功率模型中,直流潮流方程如式%1)所示:
)&Hb+e%1)式中:)为量测值;b为待估计状态向量的集合;H 为1个”xg的雅可比矩阵;e为量测误差$
加权最小二乘法的状态估计如式%2)所示:
b&%H R-H)-1H R-)%2)式中:b为状态估计值;r-为权重矩阵$
1.2虚假数据注入攻击原理
武汉木兰天池值得去吗
当完全了解电网拓扑结构信息时,攻击者便可对电网进行FDIAs$此时,受攻击后的量测数据如式%3)所示:
)&)+a% 3)式中:)为受到FDIAs后的量测值;a为”x1的FDIA)量$
状态估计量如式%4)所示:
0&%H R-1H)-1H R-1)&b+c%4)
式中:b”为受到FDIAs后的状态估计值;c为状态量中的差量$
当a&Hc% c&%-1,c2,…,c”))时,测量残差的二范数如式%5)所示:
II Z h-Hb JI&llz+a-H%b+c)II&%5)%5) ||z-Hb+a-Hc||&||Z-Hb||
由式%5)可知,受攻击前后的残差一致,故可成功绕过不良数据检测模块,导致FDIAs不易被检测到$
2TNPE算法概述
2.邻域保持嵌入算法
2005年,领域保持嵌入算法%Neighborhood Preser-viny Embedding,NPE)被首次提出,该算法是将LLE算法通过线性近似处理得到的[16]$NPE是1种流行学习算法,其基本思想是寻数据中的低维流形信息,并且保持原有数据与邻域数据之间的线性重构关系,最终使得降维后的数据仍能保留原样本空间中的局部流行构$
NPE算对行构,假设练数据集为X%.1,…,.”),”为样本点的总个数,采用取欧式距离最小的方法出每个样本点的最近的8个数据点,构成领域点集$在足够小的领域内认为数据是线性相
•126-中国安全生产科学技术第17卷
关的,因此每个样本点可利用这8个领域点进行重构,重构系数矩阵可通过最小化函数获得,函数如式%6)所示:
-%W)&$||.D-$/E.||2%6)
D&1J&1
式中:-为求解重构系数矩阵的函数;.d为数据集中的第,个样本点;.为与样本点.最近的8个样本点中的第J个样本点;/为重构系数矩阵;W”为/的第i 行第J列$
约束条件如式%7)所示:
$W i,=1,j=1,2,3,…8%7)
E&1
训练数据样本通过映射矩阵投影到低维空间,投影矩阵可通过求解极小值问题得到,如式%8)所示:
””
沈阳必去的三大景点冬天0&arg”min($||几-$W弭『)&
D&1J&1
arg”min%y%/-W)T%/-W)y)&"8)
arg”min%a T X%/-W) T%/-W)X T a)
式中:0为投影矩阵;a为0中的一组投影向量;y 和1为低维空间的投影数据;2为单位矩阵$
求投影矩阵0的问题可进一步通过拉格朗日乘子法将其转化为广义求特征值的问题,转化方式如式% 9)所示:
X%2-W)T%2-W)X T a&*XX T a%9)式中:*为特$
设降维后的维度为@,则前@个小的特征值所对应的特量为矩阵0$
2.2时序近邻保持嵌入算法
NPE算法通过提取局部特征从而获得整个数据集的空间特征,但对于时序相关的数据,不能提取时间的动态特征$为获取到更多的数据集信息,文献:17:在NPE的基础上提出1种基于时序扩展的邻域保持嵌入算法%Time Neighbor Preserving Embedding,TNPE),该算法同时考虑数据的空间以及时间变化特征,对于动态时间数据能够较好地保留更多关键信息。
在动态系统中,第”时刻采样的数据与”-1,”-2,”-3,…的有限时刻的值有关,第”+1,”+2,”+ 3,…时刻的值也与现在以及过去的数据相关。本文选取8个空间近邻点、28个时序邻近点,对其进行线性重构,如式%10)所示:
’-%W s)&$||.-$W宀『
<7;%10)
.-%w p)&$1|.D-$W”E『
D&1J&1
式中:W s为空间权重系数矩阵;W p为时间权重系数矩阵;W s d为W s的第i行第J列;W P,为W P的第i行第丿列$
TNPE的目标是将样本映射到低维空间之后,依然可以保留数据局部近邻特征$对.d在低维空间所对应的1进行重构,因此建立TNPE的目标函数,如式%11)所示:
S&min%)—(y)S)+min%%1-))—(y)P)%11)
式中:S为TNPE算法的目标函数;y为数据.的低 维投影向量;)为空间特征在空间与时间总特征信息中的权重,0)))1$
由于y=0T.,—(y)S和—(y)"可进一步转化,如式%12)所示:
j—(y)s&a T X(2-W s)T(2-W s)X T a
—%y)P&a F X%2-W P)F%2-W P)X F a
根据式%12),式%11)的问题可以转化为求投影矩阵0的问题$S化简后如式%13)所示:
S&min%)—(y)s)+
.
.T T%13)
min%%1-))—%y)P)&min a X3X a
%12)
约束条件为yy&a XX a&2$
运用拉格朗日乘子法求解上式,取前@个小的特征所对应的特量$
3基于TNPE的FDIAs检测模型
本文提出1种基于TNPE的FDIAs检测模型,采集电力系统正常运行时多条历史量测数据去训练模型,通过TNPE算法使数据降到@维$
该模型采用统计限6”来检测被攻击的量测数据$统计限6”通过训练数据产生,每条测试数据会得到1个新的6统计量,该统计量的计算公式如式%14)-%15)所示:
6&y6)@(”-;)T%d,”-d;a)%14)
”一@
&:4t4/(”-1)广%15)式中:4为低维数据点的集合;为4的样本协方差矩阵;T% d,”-d;')为显著水平为'、自由度为d 和”-d的T分布$
基于TNPE的智能电网FDIAs方法可分为2个阶段,即训练模型和在线检测$
训练模型的具体步骤如下:
1)将采集到的正常历史量测数据通过TNPE算法来提取数据的和时特$
2&根据提取的特征计算系统正常运行时的6统计限6m$
在线监测的具体步骤如下:
1)将采集到的实际量测数据.”“通过TNPE算法
3中国安全生产科学技术・127・
提取数据新的特征$
2)根据新的特征计算在线数据的统计量6如$
基于TNPE的FDIAs检测的伪代码如下:
I)采集正常运行下的量测数据作为训练数据集
2)设定数据降维维度@=25,点数8=10
3)练数据通过TNPE算法建立检测模型,并
用得出的矩阵计算统计限6m
4)输入受的数据实行在线监测
5)For.二1,2,3…
6)9.n,D投影到低维空间后计算出统计量6,
7)A6&6
8)数据受FDIAs
9)Eise
10)数据未受到FDIAs
II)End if
12)End for
本文提出的基于TNPE的智能电网FDIAs检测流程如图1所示$
图1基于TNPE的智能电网FDIAs检测流程
Fig.1FDIAs detection procedure of smart grins
basedonTNPE
4仿真实例及分析
本文使用IAEE30节点系统,如图2所示,在MATLAB上进行仿真分析,验证模型的检测效果$IEEE30节点系统中,每条量测数据包括112条测量值。测量值包含总线有功和无功功率以及各支路的有功和无功功率,待估状态变量包括除节点外的29电压相角$ Matpowcr工具箱(18:模拟负荷曲线产生具有时间相关性的量测数据。实验将TNPE算法与NPE,PCA,ICA进行对比$
算法参数设置如下:在TNPE模型中,近邻数设为10,数设为25;对比实验中,NPE模型的数与维数设
置与TNPE相同;PCA算法通过主元贡献度为80%的标准选出24个主元个数;ICA通过迭代求取主元;4个模型的6置信度都设为99%$
4・.构造FDIAs
以IEEE30节点系统生成的1组量测数据证明成功构造FDIAs$在生成的量测数据中加为0、方差为1的噪声数据更具真$根据FDIAs原理给正常数据注量,系统攻击前后的量测数据分布状况如图3所示,状量变化情况如图4所示$
15
10
-10
5
易0
150******** 100120
112个量测点
—攻击前
攻击后
图3系统攻击前后量测数据分布状况
Fig.3Distrinution of measerement data before and
after system attack
由图3可知,受攻击后量测值发生改变,而图4中的部分状态变量移,其分布与前的一致,通过MATLAB计算得出,攻击前的残差为10.7674,攻击后的残差为10.4218,几乎相等,与FDIAs原理相符$多验前后的残差均相差不大,说明攻击能够成功绕过不良数据检测,实现FDIAs i,
破坏
・128・中国安全生产科学技术第17卷
300r
01002003004005006007008009001000
测试数据
.(a)ICA实验结果
01002003004005006007008009001000
测试数据
(b)PCA实验结果
01002003004005006007008009001000
测试数据
(c)NPE实验结果
图4系统攻击前后状态量变化情况
Fig.4SUU s changes before and after system attack01002003004005006007008009001000
测试数据
(d)TNPE实验结果
电力系统的稳定运行。
4・2离线模型训练实验
模型训练实验数据建模,正常数据测试$分别选取2000,4000条数据进行2次实验,每次实验中一半数据用来训练,一半数据用来测试,实验数据分配情况见表1$
图5实验1检测结果Fig.5Detection results of tess1
表1实验数据分配情况
Table1DisUibuUon of experimental data
验练数据试数据1111000100112000 2112000200114000
0200400600800100012001400160018002000
测试数据
(a)ICA实验结果
50r
諛L ll\Il L Illi II II|.j
0200400600800100012001400160018002000
以误报率作为评价模型好坏的指标,离线模型的误报率越低,模型越好。实验得出的检测数据误报率见表2$验2数据的增加,相应的率有所增加,通过比较可知,TNPE的误报率相对较低$
表2检测数据误报率
测试数据
(b)PCA实验结果0200400600800100012001400160018002000 50
测试数据
(c)NPE实验结果
hit TnjiiiizjJdiir一応芷
0200400600800100012001400160018002000
测试数据古埃及
(d)TNPE实验结果
Table2False alarm rates of detection data%验
模型
ACA PCA NPE TNPE 17.2 4.4 2.7 1.3 28.69.25 3.5 1.6
图6实验2检测结果Fig.6Detection results of tess2
实验1和实验2的检测结果分别如图5〜6所示$图5〜6中虚线为通练数据的统计限,为检测数据的实时
统计量,实时计量计限,则说明出现误报情况。由实验结果可知,ICA和PCA出现多次误报,NPE结果相对要好,TNPE结果最好,表明由TNPE算法训练得来的模型更加适用于FDIAs的检测。
4.3FDIAs检测实验
为验证文中提出的TNPE方法检测FDIAs的I 性,对包含攻击数据的3000条样本数据进行检测。其中,前1500条正常数据用于训练模型,后1500条数据用于测试$对于测试数据,前500条为正常数据,后800条为FDIAs的数据,将实验结果与PCA,KPCA,NPE算法的检测结果进行对比,FDIAs检测结果对比如图7所示,数据检率见表3$
实验结果表明,当受到FDIAs攻击时,4种模型均能检测到攻击的发生,但基于TNPE的FDIAs检测方法检测效果更好,检测率明显高于其他3个模型,且误报率较低,可见本文提出的TNPE模型适用于电网FDIAs 检
$
>越南芽庄旅游视频