全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210705737.8 (22)申请日 2022.06.21 (71)申请人 中国银行股份有限公司 地址 100818 北京市西城区复兴门内大街1 号 (72)发明人 郭慧杰 李健保  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 张思淼 (51)Int.Cl. G06Q 40/02(2012.01) G06N 20/00(2019.01) G06Q 10/10(2012.01) G06F 16/215(2019.01) (54)发明名称 一种基于联邦学习的建模方法、 装置、 设备 及介质 (57)摘要 本申请公开了基于联邦学习的建模方法、 装 置、 设备及介质, 可应用于人工智能领域或金融 领域。 应用于第一参与方, 第一参与方持有标签 数据, 确定第一参与方和第二参与方的用户交 集; 接收第二参与方发送加密后的第一模型参数 和第一中间结果; 第一模型参数和第一中间结果 为根据第一数据训练第一模型得到; 根据第一模 型参数、 第一中间结果和第二数据训练第二模 型, 得到梯度信息、 第二模型参数和第二中间结 果; 梯度信息用于更新第二模型; 将加密后的第 二模型参数和第二中间结果发送至第二参与方 进行迭代, 直到待训练机器学习模型训练完成; 待训练机器学习模型包括第一模 型和第二模型, 联合第一参与方和第二参与方建立额度审批模 型, 提高模型的准确度。 权利要求书2页 说明书8页 附图2页 CN 115082193 A 2022.09.20 CN 115082193 A 1.一种基于联邦学习的建模方法, 其特征在于, 应用于第 一参与方, 所述第 一参与方持 有标签数据, 包括: 确定第一 参与方的第一样本和第二 参与方的第二样本的用户交集; 接收所述第 二参与方发送的加密后的第 一模型参数和第 一中间结果; 所述第 一模型参 数和所述第一中间结果为根据第一数据训练第一模型得到; 所述第一数据为在所述第二样 本中所述用户交集对应的第一用户特 征数据; 根据所述第一模型参数、 所述第 一中间结果和第 二数据训练第二模型, 得到梯度信 息、 第二模型参数和第二中间结果; 所述梯度信息用于更新所述第二模型; 所述第二数据包括 在所述第一样本中所述用户交集对应的第二用户特 征数据和所述标签数据; 将加密后的第 二模型参数和第 二中间结果发送至所述第 二参与方进行迭代训练, 直到 确定待训练机器学习模型训练完成; 所述待训练机器学习模型包括所述第一模型和所述第 二模型。 2.根据权利要求1所述的方法, 其特征在于, 所述第 一用户特征数据为通过对第 三用户 特征数据进行数据清洗和异常值处理得到; 所述第三用户特征数据为从第四用户特征数据 中确定出位于预设范围内的用户特征数据; 所述第四用户特征数据为所述第一样本中与所 述用户交集对应的用户特征数据; 所述预设范围包括: 客户资产、 消费、 还款、 征信、 信用卡 账单、 转账、 代发 薪、 收入。 3.根据权利要求2所述的方法, 其特征在于, 所述确定第 一参与方的第 一样本和第 二参 与方的第二样本的用户交集, 包括: 利用差分隐私技术, 确定第一参与方的第一样本和第二参与方的第二样本的用户交 集。 4.根据权利要求1所述的方法, 其特征在于, 所述确定待训练机器学习模型训练完成, 包括: 确定所述第二模型的损失函数收敛。 5.根据权利要求1 ‑4任意一项所述的方法, 其特征在于, 所述待训练机器学习模型可以 为以下算法的任意 一种: 随机森林、 Xgbo ost、 GBDT、 l ightGBM。 6.一种基于联邦学习的建模装置, 其特征在于, 应用于第 一参与方, 所述第 一参与方持 有标签数据, 包括: 确定单元, 用于确定第一 参与方的第一样本和第二 参与方的第二样本的用户交集; 接收单元, 用于接收所述第二参与方发送的加密后的第一模型参数和第一中间结果; 所述第一模型参数和所述第一中间结果为根据第一数据训练第一模型得到; 所述第一数据 为在所述第二样本中所述用户交集对应的第一用户特 征数据; 计算单元, 用于根据 所述第一模型参数、 所述第 一中间结果和第二数据训练第 二模型, 得到梯度信息、 第二模型参数和 第二中间结果; 所述梯度信息用于更新所述第二模型; 所述 第二数据包括在所述第一样本中所述用户交集对应的第二用户特 征数据和所述标签数据; 发送单元, 用于将加密后的第 二模型参数和第 二中间结果发送至所述第 二参与方进行 迭代训练, 直到确定待训练机器学习模型训练完成; 所述待训练机器学习模型包括所述第 一模型和所述第二模型。 7.根据权利要求6所述的装置, 其特征在于, 所述第 一用户特征数据为通过对第 三用户权 利 要 求 书 1/2 页 2 CN 115082193 A 2特征数据进行数据清洗和异常值处理得到; 所述第三用户特征数据为从第四用户特征数据 中确定出位于预设范围内的用户特征数据; 所述第四用户特征数据为所述第一样本中与所 述用户交集对应的用户特征数据; 所述预设范围包括: 客户资产、 消费、 还款、 征信、 信用卡 账单、 转账、 代发 薪、 收入。 8.根据权利要求7 所述的装置, 其特 征在于, 所述确定单 元, 用于: 利用差分隐私技术, 确定第一参与方的第一样本和第二参与方的第二样本的用户交 集。 9.一种计算机设备, 其特 征在于, 所述计算机设备包括处 理器以及存 储器: 所述存储器用于存 储程序代码, 并将所述 程序代码传输给 所述处理器; 所述处理器用于根据所述程序代码中的指令执行权利要求1 ‑5中任意一项所述的方 法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质用于存储计算机 程序, 所述计算机程序用于执 行权利要求1 ‑5中任意一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115082193 A 3

.PDF文档 专利 一种基于联邦学习的建模方法、装置、设备及介质

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于联邦学习的建模方法、装置、设备及介质 第 1 页 专利 一种基于联邦学习的建模方法、装置、设备及介质 第 2 页 专利 一种基于联邦学习的建模方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:18:15上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。