全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211000583.9 (22)申请日 2022.08.17 (71)申请人 国网天津市电力公司 地址 300010 天津市河北区五经路39号 申请人 国家电网有限公司 (72)发明人 王庆彪 雷光远 尹鹏 张涛  高志伟 唐永聪 吕根 尹海丞  王明昊 舒可心 梁海深 梁特  张樱譞 李云双 张凯 李云秀  葛磊蛟 尚继伟 于惟坤 穆九鹏  (74)专利代理 机构 天津盛理知识产权代理有限 公司 12209 专利代理师 陈娟 (51)Int.Cl. G06Q 30/02(2012.01)G06F 16/906(2019.01) G06F 16/2458(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06Q 50/06(2012.01) (54)发明名称 基于自编码和分布式聚类相结合的用户用 电特性分析方法 (57)摘要 本发明涉及一种基于自编码和分布式聚类 相结合的用户用电特性分析方法, 首先利用自编 码对用电数据进行预处理, 提取高维数据的核心 数据, 然后利用自适应k ‑means聚类算法对分布 在各区域的用电数据进行局部聚类 分析, 提取各 局部数据的典型负荷曲线, 构建局部模型; 然后 利用传统聚类算法对获取的局部模型进行二次 聚类分析, 获取全局的典型负荷曲线, 构建全局 模型; 最后向局部数据中心反馈全局聚类结果, 实现全局聚类分析。 解决用户用电数据体量大、 分布广的问题, 达到快速、 全面提取特征数据的 目的。 权利要求书2页 说明书5页 附图2页 CN 115439142 A 2022.12.06 CN 115439142 A 1.一种用户用电特性分析 方法, 包括以下步骤: 步骤1、 将所有数据划分为 N个区域, 每 个区域的数据标记为局部数据; 步骤2、 对各局部数据的每一条原 始日负荷曲线 进行校验和归一 化处理; 步骤3、 对数据进行自编码, 获得高维数据的核心数据; 步骤4、 对各局部数据开展自适应k ‑means聚类, 所有的聚类中心构成该局部数据的局 部模型, 并传送至全局数据中心; 步骤5、 全局数据中心接收所有N个局部数据中心得到的局部模型, 然后对其进行二次 聚类, 形成M个聚类中心; 步骤6、 根据所述局部模型和全局聚类之间的聚类归属关系, 向各局部数据中心反馈最 终聚类标号。 2.根据权利要求1所述的用户用电特性分析方法, 其特征在于, 步骤2按照下式对每一 条无空缺值负荷采集 点的原始日负荷曲线 进行标幺化处 理: 式中: xt, xmin, xmax, x't分别为一条原始日负荷曲线中的t时刻负荷值、 最小负荷、 最大负 荷和标幺化后的t时刻负荷值, 其中1≤t≤T, T为每日总时段。 3.根据权利要求1所述的用户用电特性分析方法, 其特征在于, 步骤3自编码为无监督 学习算法, 它由三层网络组成, 其中输入层与输出层神经元数量相等, 隐藏层神经元数量少 于输入输出层, 自编码机将输入的特 征经过非线性变化到隐藏层上。 4.根据权利要求3所述的用户用电特性分析方法, 其特征在于, 步骤3自编码机的训练 分为编码和解码两个步骤.其中编码部 分, 数据x在输入层通过激活函数映射到隐藏层h, 激 活函数下所示: 式中, ω1为编码部分的权值, b1为偏置单 元; 解码部分为隐藏层h还原输入数据, 还原得到的数据用y表示, 解码公式如下 所示: 式中, ω2为解码部分的权值, b2为偏置单 元.自编码机的目标函数如下 所示: 式中, n为输入的样本个数。 5.根据权利要求1所述的用户用电特性分析方法, 其特征在于, 步骤4对局部数据自适 应k‑means聚类分析的步骤如下: 步骤4.1: 对该局部数据中心经过处理及自编码得到数据曲线进行k取值为ki,min的k‑ means聚类分析, 得到ki,min个聚类, 并将该ki,min个聚类标记为未检验聚类, 其中下标i表示 第i条归一 化电力数据曲线; 步骤4.2: 对该局部数据中心的未检验聚类进行检验, 判断其是否满足所述聚类误差指权 利 要 求 书 1/2 页 2 CN 115439142 A 2标B, 其中, 判断步骤4.1得到的第j个聚类是否满足所述聚类误差指标B, 即判断该第j个聚 类是否满足以下 条件的约束, 即 式中: j为正整数且1≤j≤kmin; Ej为第j个聚类的总代表误差; Nj为属于第j个聚类的归 一化日负荷曲线的数量; 为第j个聚类的聚类中心的第t 个负荷值; 为属于第j个聚类的 第i条归一 化日负荷曲线的t时刻负荷值; 步骤4.3: 当步骤4.2中对一个未检验聚类进行检验 的判断结果为是时, 将满足所述聚 类误差指标B的未检验聚类标记 为已检验聚类; 当步骤4.2中对一个未检验聚类进 行检验的 判断结果为否时, 对 该不满足所述聚类误差指标B的未检验聚类进行k取值为2的k ‑means聚 类分析, 使 得该不满足所述聚类误差指标B的未检验聚类再次聚类划分为两个新的聚类, 并 将这两个新的聚类标记为未检验聚类; 步骤4.4: 重 复步骤4.2和步骤4.3, 直至该局部数据中心的所有未检验聚类均已标记为 已检验聚类或者该局部数据中心的包含未检验聚类和已检验聚类的聚类总数量达到最大 聚类数量ki,max, 并将此时该局部数据中心的所有聚类均标记为该局部数据中心的局部聚 类, 将局部聚类的聚类中心标记为局部典型曲线。 6.根据权利要求1所述的用户用电特性分析方法, 其特征在于, 步骤1对所有数据的划 分是将数据物理存 储区较近的区域划分在一 起, 每个局部数据的数据量相近似。权 利 要 求 书 2/2 页 3 CN 115439142 A 3

.PDF文档 专利 基于自编码和分布式聚类相结合的用户用电特性分析方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于自编码和分布式聚类相结合的用户用电特性分析方法 第 1 页 专利 基于自编码和分布式聚类相结合的用户用电特性分析方法 第 2 页 专利 基于自编码和分布式聚类相结合的用户用电特性分析方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:32:05上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。