全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210528746.4 (22)申请日 2022.05.16 (71)申请人 中国农业银行股份有限公司 地址 100005 北京市东城区建国门内大街 69号 (72)发明人 光毓  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 秦晓君 (51)Int.Cl. G06Q 40/02(2012.01) G06K 9/62(2022.01) G06F 17/16(2006.01) (54)发明名称 数据降维方法及装置 (57)摘要 本发明提供一种数据降维方法及装置, 包 括: 获取各个需要进行数据降维的数据信息; 基 于各个数据信息, 构建非局部相似性度量矩阵、 局部相似性度量矩阵以及高维度数据矩阵; 根据 高维度数据矩阵、 非局部相似性度量矩阵和局部 相似性度量矩阵, 构建降维目标函数, 求解降维 目标函数, 得到投影矩阵; 将每个数据信息和投 影矩阵代入 预先设置的降维公式中, 得到该数据 信息进行降维后的降维数据信息。 应用该方法, 先将数据映射到高维空间再进行维度约简, 使 得 降维后数据达到方差最大化的同时最大限度地 保持数据在原始样本空间的局部和非局部特性, 基于降维后数据构建的分类模型对数据进行分 类, 能够有效提高数据分类的正确率, 保障银行 的数据安全。 权利要求书2页 说明书9页 附图2页 CN 114897600 A 2022.08.12 CN 114897600 A 1.一种数据降维方法, 其特 征在于, 包括: 获取各个需要 进行数据降维的数据信息; 基于各个所述数据信息, 构建非局部相似性度量矩阵、 局部相似性度量矩阵以及高维 度数据矩阵; 根据所述高维度数据矩阵、 所述非局部相似性度量矩阵和所述局部相似性度量矩阵, 构建降维目标函数, 求 解所述降维目标函数, 得到投影矩阵; 将每个所述数据信 息和所述投影矩阵代入预先设置的降维公式中, 得到该数据信 息进 行降维后的降维数据信息 。 2.根据权利要求1所述的方法, 其特征在于, 所述基于各个所述数据信息, 构建高维度 数据矩阵, 包括: 基于各个所述数据信息, 构建各个核函数 元素; 将每个所述核函数元素对应的各个数据信 息代入预设的径向基核函数中, 计算得到该 核函数元素对应的高维度数据, 各个所述高维度数据组成高维度数据矩阵。 3.根据权利要求1所述的方法, 其特征在于, 所述基于各个所述数据信息, 构建非局部 相似性度量矩阵和 局部相似性度量矩阵, 包括: 基于各个所述数据信息, 构建各个相似性度量元 素; 确定每个所述相似度量元素对应的各个数据信 息的标签信 息和位置信 息, 并根据 该相 似度量元素对应的各个数据信息的标签信息和位置信息, 确定该相似度量元素的局部相似 性度量值和非局部相似性度量 值; 各个所述局部相似性度量值组成局部相似性度量矩阵, 各个所述非局部相似性度量值 组成非局部相似性度量矩阵。 4.根据权利要求3所述的方法, 其特征在于, 所述相似度量元素对应的各个数据信 息包 括第一数据信息和 第二数据信息, 所述根据该相似度量元素对应的各个数据信息的标签信 息和位置信息, 确定该相似度量元 素的局部相似性度量 值和非局部相似性度量 值, 包括: 若所述相似度量元素对应的第一数据信息的标签信息和第二数据信息的标签信息不 相同, 并且该第一数据信息的位置信息和该第二数据信息的位置信息满足预设的位置条 件, 则该相似度量元素的非局部相似性度量值为 1, 否则该相似度量元素的非局部相似性度 量值为0; 若所述相似度量元素对应的第一数据信息的标签信息和第二数据信息的标签信息相 同, 并且该第一数据信息的位置信息和该第二数据信息的位置信息不满足所述位置条件, 则该相似度量元素 的局部相似性度量值为1, 否则该相似度量元素 的局部相似性度量值为 0。 5.根据权利要求1所述的方法, 其特 征在于, 还 包括: 确定预设的网络模型为训练模型, 基于各个所述降维数据信息, 对所述网络模型进行 训练, 得到已训模型; 若所述已训模型未满足预设的停止迭代条件, 则将所述已训模型作为训练模型, 并基 于各个所述降维数据信息, 重新对所述训练模型进行训练, 直至得到的 已训模型满足所述 停止迭代条件, 则确定所述已训模型为分类模型。 6.一种数据降维装置, 其特 征在于, 包括:权 利 要 求 书 1/2 页 2 CN 114897600 A 2获取单元, 用于获取 各个需要 进行数据降维的数据信息; 构建单元, 用于基于各个所述数据信 息, 构建非局部相似性度量矩阵、 局部相似性度量 矩阵以及高维度数据矩阵; 求解单元, 用于根据所述高维度数据矩阵、 所述非局部相似性度量矩阵和所述局部相 似性度量矩阵, 构建降维目标函数, 求 解所述降维目标函数, 得到投影矩阵; 降维单元, 用于将每个所述数据信息和所述投影矩阵代入预先设置的降维公式中, 得 到该数据信息进行降维后的降维数据信息 。 7.根据权利要求6所述的装置, 其特 征在于, 所述构建单 元, 包括: 第一构建子单 元, 用于基于各个所述数据信息, 构建各个核函数 元素; 第一组成子单元, 用于将每个所述核函数元素对应的各个数据信 息代入预设的径向基 核函数中, 计算得到该核函数元素对应的高维度数据, 各个所述高维度数据组成高维度数 据矩阵。 8.根据权利要求6所述的装置, 其特 征在于, 所述构建单 元, 包括: 第二构建子单 元, 用于基于各个所述数据信息, 构建各个相似性度量元 素; 确定子单元, 用于确定每个所述相似度量元素对应的各个数据信 息的标签信 息和位置 信息, 并根据该相似度量元素对应的各个数据信息的标签信息和 位置信息, 确定该相似度 量元素的局部相似性度量 值和非局部相似性度量 值; 第二组成子单元, 用于各个所述局部相似性度量值组成局部相似性度量矩阵, 各个所 述非局部相似性度量 值组成非局部相似性度量矩阵。 9.根据权利要求8所述的装置, 其特征在于, 所述相似度量元素对应的各个数据信 息包 括第一数据信息和第二数据信息, 所述确定 子单元, 具体用于: 若所述相似度量元素对应的第一数据信息的标签信息和第二数据信息的标签信息不 相同, 并且该第一数据信息的位置信息和该第二数据信息的位置信息满足预设的位置条 件, 则该相似度量元素的非局部相似性度量值为 1, 否则该相似度量元素的非局部相似性度 量值为0; 若所述相似度量元素对应的第一数据信息的标签信息和第二数据信息的标签信息相 同, 并且该第一数据信息的位置信息和该第二数据信息的位置信息不满足所述位置条件, 则该相似度量元素 的局部相似性度量值为1, 否则该相似度量元素 的局部相似性度量值为 0。 10.根据权利要求6所述的装置, 其特 征在于, 还 包括: 模型训练单元, 用于确定预设的网络模型为训练模型, 基于各个所述降维数据信 息, 对 所述网络模型进行训练, 得到已训模型; 若 所述已训模型未满足预设的停止迭代条件, 则将 所述已训模型作为训练模型, 并基于各个所述降维数据信息, 重新对所述训练模型进行训 练, 直至得到的已训模型满足所述停止迭代条件, 则确定所述已训模型为分类模型。权 利 要 求 书 2/2 页 3 CN 114897600 A 3

.PDF文档 专利 数据降维方法及装置

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据降维方法及装置 第 1 页 专利 数据降维方法及装置 第 2 页 专利 数据降维方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:23:48上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。