1、收稿日期:2 0 2 3-0 5-1 9作者简介:李富强(1 9 9 5),男,硕士生,主要研究方向为聚类分析,E-m a i l:8 2 1 2 0 5 6 3 2 q q.c o m指导教师:朱晨烜(1 9 8 4),女,副教授,博士,主要研究方向为聚类分析,E-m a i l:z h u c x s d j u.e d u.c n文章编号 2 0 9 5-0 0 2 0(2 0 2 3)0 5-0 2 9 3-0 6基于改进F CM聚类分析方法的电力负荷特性研究李富强,朱晨烜,骆利勤(上海电机学院 电气学院,上海 2 0 1 3 0 6)摘 要 针对模糊C-均值(F C M)的聚类结果受
2、初始隶属度矩阵和聚类中心的选择影响,容易遇到局部极值等问题,提出了一种改进的F C M聚类分析方法。首先,考虑到电力负荷曲线的规律性与时序性特点,结合欧氏距离与皮尔逊相关系数,对局部密度进行了优化。然后,利用F C M聚类分析方法对聚类质心更新迭代,以获得更高精度的聚类质心,从而实现了电力负荷曲线的精确聚类。最后,以电网实际负荷数据作为仿真实验样本,通过与K-m e a n s和传统F C M方法进行比较,验证了改进的F C M聚类分析方法对电力负荷曲线聚类分析的有效性和优越性。关键词 聚类分析方法;电力负荷;聚类质心中图分类号 TM 7 1 5文献标志码 AR e s e a r c h o
3、 n p o w e r l o a d c h a r a c t e r i s t i c s b a s e d o ni m p r o v e d F C M c l u s t e r i n g a n a l y s i s m e t h o dL I F u q i a n g,Z HU C h e n x u a n,L U O L i q i n(S c h o o l o f E l e c t r i c a l E n g i n e e r i n g,S h a n g h a i D i a n j i U n i v e r s i t y,S h a
4、n g h a i 2 0 1 3 0 6,C h i n a)A b s t r a c t T o s o l v e t h e p r o b l e m t h a t t h e c l u s t e r i n g r e s u l t s o f f u z z y C-m e a n s(F C M)a r e a f f e c t e d b y t h e s e l e c t i o n o f t h e i n i t i a l m e m b e r s h i p m a t r i x a n d c l u s t e r c e n t e r,
5、a n d e a s i l y t r a p i n t o l o c a l e x t r e m u m,e t c.,a n i m p r o v e d F C M c l u s t e r i n g m e t h o d i s p r o p o s e d.F i r s t,c o n s i d e r i n g t h e r e g u l a r i t y a n d t i m i n g c h a r a c t e r i s t i c s o f t h e p o w e r l o a d c u r v e,t h e l o c
6、 a l d e n s i t y i s o p t i m i z e d b y c o m b i n i n g t h e E u c l i d e a n d i s t a n c e a n d P e a r s o n c o r r e l a t i o n c o e f f i c i e n t.T h e n,t h e F C M c l u s t e r a n a l y s i s m e t h o d i s u t i l i z e d t o i t e r a t i v e l y u p d a t e t h e c l u s
7、 t e r c e n t r o i d s t o a c h i e v e h i g h e r a c c u r a t e c l u s t e r c e n t r o i d s,t h u s a c h i e v i n g a c c u r a t e c l u s t e r i n g o f p o w e r l o a d c u r v e s.F i n a l l y,t h e r e a l l o a d d a t a o f t h e p o w e r g r i d i s u s e d a s a s i m u l a
8、 t i o n e x p e r i m e n t s a m p l e,a n d K-m e a n s a n d t r a d i t i o n a l F C M m e t h o d s a r e c o m p a r e d t o v e r i f y t h e e f f e c t i v e n e s s a n d s u p e r i o r i t y o f t h e i m p r o v e d F C M c l u s t e r a n a l y s i s m e t h o d f o r c l u s t e r i
9、 n g a n a l y s i s o f p o w e r l o a d c u r v e s.K e y w o r d s c l u s t e r i n g m e t h o d;e l e c t r i c l o a d;c l u s t e r i n g c e n t r o i d 第2 6卷 第5期2 0 2 3年上 海 电 机 学 院 学 报J O U R N A L O F S HA N G HA I D I A N J I U N I V E R S I T YV o l.2 6 N o.5 2 0 2 3 随着人工智能领域的技术进步,一系列智
10、能算法如专家系统、支持向量机和神经网络等已被广泛应用于电力负荷行业。但是,对于高维数据集,传统的智能算法计算过程过于复杂和耗时,不能保证对形状多样性的数据集的计算准确性1。近几年,聚类分析方法已广泛应用于电力负荷预测领域,根据电力负荷的特性,许多更精确的聚类分析方法被提出2-3,这在学术界产生了影响。在一些研究中,如文献4 提出了结合K-均值(K-m e a n s)和反向传播神经网络的聚类分析方法,降低了负荷预测的误差。文献5 提出了一种可能性C-均值(P o s s i b i l i s t i c C-M e a n s,P C M)算法,但P C M聚类分析方法的聚类结果同样容易受到
11、初始聚类质心选取的影响,导致聚类一致性问题。为弥补P C M聚类分析方法的缺陷,文献6-7 将P C M与模糊C-均值(F u z z y-C M e a n s,F C M)相结合,提出了一种可能性模糊C-均值算法。文献8 提出了密度峰值聚类算法,能将任意形状的类簇进行聚类且具有很强的鲁棒性。文献9 提出了一种在语义分割基础上,结合K-m e a n s和随机森林的聚类分析算法,提高了模型的准确性。文献1 0 提出了改进K-m e a n s聚类分析方法,该方法减小了迭代次数,提高了聚类效率。文献1 1 设计了一种基于最近邻与局部密度的自适应K-m e a n s聚类分析方法,通过结合近邻矩
12、阵和局部密度以获取初始聚类质心,提高了传统K-m e a n s算法聚类效果。文献1 2 基于中心指标和密度提出了C a n o p y二进制K-m e a n s聚类分析方法,使得聚类结果更精确,同时算法运行速度更稳定。文献1 3 为解决传统模糊均值聚类算法中初始聚类中心选取不准确的问题,引入双尺度度量以提高聚类效果。综上所述,上述算法仍有一些缺陷和局限性。例如,随机选择初始聚类质心可能会导致聚类结果陷入局部最优解,从而降低了聚类的准确性。因此,本文引入皮尔逊相关系数对欧氏距离进行改进,以获取初始聚类质心,然后使用F C M聚类分析方法对聚类质心进行迭代更新,以获得更高精度的聚类质心。实验结
13、果表明,改进的模糊聚类分析算法比传统的聚类分析算法更稳定、准确,可以有效地应用于负荷调度计划的制定,具有实际应用价值。1 原始负荷数据预处理及特征指标权重赋值1.1 畸变负荷曲线的剔除畸变负荷曲线是指偏离聚类质心曲线的样本曲线。它们的存在可能会导致特征指标权重计算出现误差,并且还会影响聚类结果的准确性。而拉依达准则1 4在测量次数足够大时有很好的准确性,故本文采用该准则识别畸变数据。假设1组检测数据值含有随机误差,先计算出A的列平均值A j s和剩余误差Ej s,然后计算标准差。当|Ej s|3,则此A j s被认定为畸变数据应剔除。剔除畸变数据之后得到矩阵记为B。列平均值、剩余误差及标准差的
14、具体表达式如下:A j s=1mmj=1A j s(1)Ej s=A j s-A j s(2)=1m-1mj=1E2j s(3)式中:m为样本数。1.2 负荷数据归一化及特征指标提取归一化的目的是将不同量纲的数据转换为统一的标准,以更好地进行比较、分析。均值方差归一化的公式为xs c a l e=x-s(4)式中:x为原数据集;为样本均值;s为样本的标准差。通过减去均值对数据进行中心化处理,即改变平均值使得数据的平均值为零。这一操作不会改变数据分布中各个点之间的距离。标准差可被视为每个点距离平均值的平均距离,因此将数据除以标准差可以将数据中每个特征的距离量纲统一为标准差的倒数,从而保持数据点之
15、间的距离不变。最终,数据被转换为具有零均值和单位方差的正态分布。将经过归一化之后得到的数据集记为矩阵C。每小时采集一次原始数据,导致数据量大且维度高。直接使用所有数据聚类时间成本高,为了提高效率和降低维度,采用特征提取,提取关键指标如日负荷率、峰期负载率等,并对其进行优化处理。这样可以精确描述负载曲线的特性,提高效率并保492上 海 电 机 学 院 学 报 2 0 2 3年第5期留重要特性。在此基础上再进行负荷曲线的聚类,将矩阵C通过特征指标提取过后的数据矩阵记为矩阵D。2 改进的F C M聚类分析方法为了解决F C M聚类分析方法中聚类质心容易被划分到样本点密集区域的问题,对F C M聚类分
16、析方法进行了优化。然而,对于具有时序性和规律性的电力负荷曲线,如果两条负荷曲线之间的相似度仅依赖于欧氏距离,则得到的聚类效果不能反映电力负荷曲线的时序性和规律性特征。本文针对电力负荷曲线的聚类,将皮尔逊相关系数与欧式距离相结合得到改进的F C M聚类分析方法。具体如下:(1)改进的F C M聚类分析方法的局部密度i=XjNk(Xi)e x p(-d2(i,j)XjNk(Xi)XvNk(Xj)e x p(-d2(j,v)(5)其中,改进后的欧氏距离为d(i,j)=di je x p(Xi,Xj)-1)(6)皮尔逊相关系数(Xi,Xj)=nns=1xi sxj s-ns=1xi sns=1xj s
17、nns=1(xi s)2-ns=1xi s 2nns=1(xj s)2-ns=1xj s 2(7)(2)相对距离vi=m a xjid(i,j),i最大m i nj:jid(i,j),i不是最大(8)(3)决策值gi=ivi(9)(4)聚类质心C+1i=mj=1(ui j)Xjmj=1(ui j),i=1,2,c(1 0)式中:di j为样本向量Xi到样本向量Xj的欧式距离;Nk(Xi)为数据点Xi的K个最近临近点;xi s、xj s为样本向量Xi、Xj的第s维元素;n为样本向量的维度;为迭代次数;为模糊指数;ui j为第j个样本向量属于第i类的隶属度。改进的F C M集成聚类分析方法流程如图
18、1所示。图1 改进F C M聚类分析方法流程3 经典聚类评价指数本文以C H和X B聚类评价指数1 5目标函数为聚类评价指数。C H聚类评价指数是根据计算类中样本向量到类质心向量的距离平方和来衡量类内相似度,其值越小代表相似性越高。通过计算C H数据集样本质心向量与各类质心向量间的距离平方和来衡量类间差异度,其值越大差异性越大。因此,当目标函数JC H越大时,说明聚类精度越高。X B聚类评价指数是根据各样本中向量与质心向量间的距离平方之和以及类质心向量距离平方来衡量的,向量与质心向量间的距离平方之和的值越小代表类内相似性越高;而质心向量距离平方的值越大代表类间差异性越大。因此,目标函数JX B
19、越小,说明聚类精度越高。4 实际电力负荷数据实验分析为了验证本文算法的有效性和优越性,选取2 0 2 2年某电网的实际负荷数据进行仿真。对负荷数据预处理,包括去除畸变负荷向量、降维处理、归592 2 0 2 3年第5期李富强,等:基于改进F C M聚类分析方法的电力负荷特性研究 一化处理、权重分配,然后提取最优的聚类曲线并分析聚类结果,最后比较算法。4.1 负荷数据处理4.1.1 负荷数据预处理结果分析 用于实例仿真的电力负荷数据一共包含全年的实测数据,每天每间隔一小时采集一次负荷值,共形成一个3 6 6 2 4的矩阵,构成3 6 6条电力负荷曲线,其原始电力负荷曲线如图2所示。图2 原始电力
20、负荷曲线4.1.2 畸变负荷曲线的剔除 根据式(1)式(3)将原始电力负荷数据集中的畸变负荷样本剔除,分析输出的畸变负荷样本向量,这些畸变负荷样本向量分别出现在2月1日到2月6日,该时间段正好是春节,6条负荷曲线相对于附近的负荷曲线,呈现出无规律性;4月3日至5日以及1 0月1日至7日分别是清明节和国庆节节假日,在此期间,大部分工厂、写字楼、学校的用电量明显下降;6月8日至6月1 0日温度骤升,后又恢复到8日前的温度,此期间,人们用空调比较频繁,电量明显上升。将剔除1 9个畸变负荷样本之后的矩阵记为B,剩下的负荷样本形成的电力负荷曲线如图3所示。图3 剔除畸变负荷曲线后电力负荷曲线对比图2、图
21、3可知,图2中无规律和杂乱的负荷曲线已被剔除,剩下的负荷曲线都呈现出很强的规律性和时序性特点。剔除畸变负荷曲线后得到矩阵B,根据式(4)对矩阵进行归一化处理,所得矩阵记为矩阵C。从归一化后的矩阵C中提取特征指标进行降维处理,得到3 4 77的矩阵,记为矩阵D。4.2 改进F C M聚类结果分析改进F C M聚类分析方法是先通过改进聚类分析方法获取初始聚类质心,避免在F C M聚类分析方法中由于随机选择初始聚类质心而引起聚类结果陷入局部最优解的问题。导入预处理之后的矩阵D,在改进F C M聚类分析方法中输入参数近邻数k=5;模糊指数=2,=0.0 0 00 1,最大迭代次数m a x=2 0 0
22、,其聚类结果如图4所示。由图4可知,不同季节和场景下的负荷曲线呈现出不同的特点。在国庆节假日期间,第1类负荷曲线在1 1 0 0 1 8 0 0期间出现高峰,而在1 9 0 0 2 4 0 0之间,负荷变化相对平稳,这是由于服务业用电量急剧增加所致。第2类负荷曲线出现在冬季,两个峰值时段主要在人们用餐时间段,相对于其他负荷曲线,此类曲线在1 9 0 0左右的负荷处于全天最高峰,因为此时段是人们集中洗漱的时间,对热水的需求量特别大。第3类负荷曲线出现在夏季,尽管受制冷设备影响,但是由于生活用热水需求量较少,热水器能够利用太阳能,因此负荷较低。此类负荷曲线没有特别明显的峰期时段,主要由于风扇、空调
23、等制冷设备的不间断运行所致。第4类负荷曲线更能反映人们的日常生活规律,分别在1 1 0 0和1 9 0 0左右出现两个主要峰值,此时间段为用餐时段,人们日常家用负荷较大;此外,2 0 0 0 2 2 0 0为夜生活用电时间,负荷相对较高,很明显此类负荷曲线变化规律受温度的影响较小,更贴近于人们的日常生活规律。4.3 聚类结果比较聚类效果的评估主要取决于能否合理分配所有负荷曲线,而负荷曲线的合理分配主要考虑同类负荷曲线的相似性和不同类负荷曲线之间的差异。C H聚类评价指数和X B聚类评价指数都是基于692上 海 电 机 学 院 学 报 2 0 2 3年第5期 图4 改进F C M的聚类结果这两个
24、方面进行考虑。表1给出了不同聚类分析方法下C H聚类评价指数和X B聚类评价指数的比较结果,表2给出了不同聚类分析方法在聚类过程中的迭代次数和程序运行时间。表1 不同算法下的聚类效果比较聚类分析方法C H评价指数X B评价指数K-m e a n s1 5 2 5.7 52.3 7 5 8F C M2 8 3 2.4 31.8 9 2 4改进F C M3 4 8 9.9 41.2 1 6 5表2 不同聚类分析方法的迭代次数和运行时间比较聚类分析方法迭代次数运行时间/sK-m e a n s6 21.0 6 4 5F C M8 81.3 4 9 1改进F C M4 20.9 0 5 4 由表1、表
25、2可知,单一聚类分析方法所得到的C H聚类评价指数明显低于改进的F C M聚类分析方法所得到的值,而得到的X B聚类评价指数则相对较高。这表明,单一聚类分析方法得到的聚类效果相对较差,而改进的F C M聚类分析方法则获得了更好的聚类效果。因此,利用改进的划分聚类分析方法来获得精确的初始质心,能够显著提高聚类的准确性。在迭代次数以及运行时间方面,改进的F C M聚类分析方法明显优于K-m e a n s和传统F C M聚类分析方法,表明利用改进的F C M来获取精准的初始聚类质心能够提高聚类精度,并且能提升工作效率。5 结 论本文提出的改进F C M聚类分析方法,在传统F C M聚类分析方法的基
26、础上,将皮尔逊相关系数与欧式距离相结合得到改进后的欧氏距离表达式并进行聚类分析;对原始负荷数据进行预处理,包括剔除畸变负荷曲线、对剔除畸变负荷曲线后的负荷数据进行归一化处理,并从归一化后的数据中提取特征指标进行降维,提高了聚类分析的效率且保留了负荷重要特性。通过将本文方法与K-m e a n s、传统F C M聚类分析方法做仿真对比,验证了改进F C M聚类分析方法对电力负荷曲线聚类分析的有效性和优越性。本文方法在实例中获得了预期的792 2 0 2 3年第5期李富强,等:基于改进F C M聚类分析方法的电力负荷特性研究 聚类结果,但是对于日趋复杂多变的负荷数据,仍然有一些地方需要优化和改进,
27、如对于不同来源的实际电力负荷数据,可对特征指标进行优化,加入一些必要的影响负荷变化的因素,例如温度和天气等。参 考 文 献1 毛伟中.受天气因素影响的电力系统短期负荷预测综述J.人民珠江,2 0 0 6(1):5 3-5 5.2 李晨,尹常永,李奇洁.电力系统负荷预测研究综述J.电子世界,2 0 2 1(1 6):8 1-8 2.3 方勤健.综合能源系统多元负荷短期预测与应用D.大连:大连理工大学,2 0 2 1.4 刘倩颖,阮应君,时翔,等.基于k m e a n s聚类与B P神经网络算法的办公建筑逐时电负荷预测J.热能动力工程,2 0 1 8,3 3(3):1 3 8-1 4 4.5 C
28、 E L I K Y I L MA Z A,B U R HA N T I.E n h a n c e d f u z z y s y s t e m m o d e l s w i t h i m p r o v e d f u z z y c l u s t e r i n g a l g o-r i t h mJ.I E E E T r a n s a c t i o n s o n F u z z y S y s t e m,2 0 0 8,1 6(3):7 7 9-7 9 4.6 K R I N I D I S S,C H A T Z I S V.A r o b u s t f u z
29、 z y l o c a l i n f o r-m a t i o n C-m e a n s c l u s t e r i n g a l g o r i t h mJ.I E E E T r a n s-a c t i o n s o n I m a g e P r o c e s s i n g,2 0 1 0,1 9(5):1 3 2 8-1 3 3 7.7 B A R N I M,C A P P E L L I N I V,M E C O C C I A.C o m-m e n t s o n“a p o s s i b i l i s t i c a p p r o a c h
30、 t o c l u s t e r i n g”J.I E E E T r a n s a c t i o n s F u z z y S y s t e m s,1 9 9 6,4(3):3 9 3-3 9 6.8 R O D R I G U E Z A,L A I O A.C l u s t e r i n g b y f a s t s e a r c h a n d f i n d o f d e n s i t y p e a k sJ.S c i e n c e,2 0 1 4,3 4 4(6 1 9 1):1 4 9 2.9 李翠玲,李余康,谭昊然,等.基于K-m e a n
31、s聚类和R F算法的葡萄霜霉病检测分级方法J.农业机械学报,2 0 2 2,5 3(5):2 2 5-2 3 6,3 2 4.1 0 黄鹤,李文龙,杨澜,等.D H S S A优化的K均值互补迭代车型信息数据聚类J.汽车工程,2 0 2 2,4 4(5):6 9 1-7 0 0,7 2 9.1 1 艾力米努尔库尔班,谢娟英,姚若侠.融合最近邻矩阵与局部密度的自适应K-m e a n s聚类算法J.计算机科学与探索,2 0 2 3,1 7(2):3 5 5-3 6 6.1 2 沈郭鑫,蒋中云.基于密度和中心指标的C a n o p y二分K-均值算法优化J.计算机工程与科学,2 0 2 2,4
32、4(2):3 7 2-3 8 0.1 3 陈甜甜,高亚静,卢占会.基于双尺度度量的改进模糊均值曲线聚类方法研究J.综合智慧能源,2 0 2 2,4 4(4):1-1 1.1 4 徐琛辉,马明辉.基于拉依达准则的交通数据粗大误差处理优化方法J.上海工程技术大学学报,2 0 1 8,3 2(1):6 4-6 7.1 5 耿嘉艺,钱雪忠,周世兵.紧邻类与小类数据集下的模糊聚类有效性指标J.计算机应用研究,2 0 2 0,3 7(9):2 6 5 1-2 6 5 5.(上接第2 9 2页)8 杨东升,孔亮,胡博,等.基于多特征序列融合的负荷辨识方法J.电力系统自动化,2 0 1 7,4 1(2 2):
33、6 6-7 3.9 祁兵,刘利亚,韩璐,等.基于系统模型的家电负荷辨识算法J.电测与仪表,2 0 1 8,5 5(7):2 3-3 0.1 0 Y A N C L,X U E W,WE I Y.N o n-i n t r u s i v e l o a d m o-n i t o r i n g b y v o l t a g e-c u r r e n t t r a j e c t o r y e n a b l e d t r a n s-f e r l e a r n i n g J.I E E E T r a n s a c t i o n s o n S m a r t G r i
34、 d,2 0 1 9,1 0(5):5 6 0 9-5 6 1 9.1 1 陈红,余志斌.基于深度迁移学习的家用电器识别研究J.传感器与微系统,2 0 2 0,3 9(6):4 8-5 0,5 4.1 2 D U L,H E D W,HA R L Y,e t a l.E l e c t r i c l o a d c l a s s i-f i c a t i o n b y b i n a r y v o l t a g e-c u r r e n t t r a j e c t o r y m a p p i n gJ.I E E E T r a n s a c t i o n s o n
35、 S m a r t G r i d,2 0 1 6,7(1):3 5 8-3 6 5.1 3 G A O J K,K A R A E C,G I R I S,e t a l.A f e a s i b i l i t y s t u d y o f a u t o m a t e d p l u g-l o a d i d e n t i f i c a t i o n f r o m h i g h-f r e q u e n c y m e a s u r e m e n t sC 2 0 1 5 I E E E G l o b-a l C o n f e r e n c e o n S
36、 i g n a l a n d I n f o r m a t i o n P r o c e s s i n g(G l o b a l S I P).O r l a n d o,U S A:I E E E,2 0 1 5:1 4-1 6.1 4 汪颖,杨维,肖先勇,等.基于U-I轨迹曲线精细化识别的非侵入式居民负荷监测方法J.电网技术,2 0 2 1,4 5(1 0):4 1 0 4-4 1 1 3.1 5 王彬,王丹妮,江巧永,等.基于多目标的竞争粒子群优化算法的研究J.西安理工大学学报,2 0 2 2,3 8(1):7 5-8 2.1 6 杨博雯,钱伟懿.多惯性权重的自适应粒子群优化算法J.渤海大学学报(自然科学版),2 0 2 1,4 2(1):4 1-4 8,9 0.892上 海 电 机 学 院 学 报 2 0 2 3年第5期