专利一种基于联邦学习的建模方法、装置、设备及介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210705737.8 (22)申请日 2022.06.21 (71)申请人中国银行股份有限公司地址 100818 北京市西城区复兴门内大街1 号 (72)发明人郭慧杰　李健保　 (74)专利代理机构北京集佳知识产权代理有限公司 11227 专利代理师张思淼 (51)Int.Cl. G06Q 40/02(2012.01) G06N 20/00(2019.01) G06Q 10/10(2012.01) G06F 16/215(2019.01) (54)发明名称一种基于联邦学习的建模方法、装置、设备及介质 (57)摘要本申请公开了基于联邦学习的建模方法、装置、设备及介质，可应用于人工智能领域或金融领域。应用于第一参与方，第一参与方持有标签数据，确定第一参与方和第二参与方的用户交集；接收第二参与方发送加密后的第一模型参数和第一中间结果；第一模型参数和第一中间结果为根据第一数据训练第一模型得到；根据第一模型参数、第一中间结果和第二数据训练第二模型，得到梯度信息、第二模型参数和第二中间结果；梯度信息用于更新第二模型；将加密后的第二模型参数和第二中间结果发送至第二参与方进行迭代，直到待训练机器学习模型训练完成；待训练机器学习模型包括第一模型和第二模型，联合第一参与方和第二参与方建立额度审批模型，提高模型的准确度。权利要求书2页说明书8页附图2页 CN 115082193 A 2022.09.20 CN 115082193 A 1.一种基于联邦学习的建模方法，其特征在于，应用于第一参与方，所述第一参与方持有标签数据，包括：确定第一参与方的第一样本和第二参与方的第二样本的用户交集；接收所述第二参与方发送的加密后的第一模型参数和第一中间结果；所述第一模型参数和所述第一中间结果为根据第一数据训练第一模型得到；所述第一数据为在所述第二样本中所述用户交集对应的第一用户特征数据；根据所述第一模型参数、所述第一中间结果和第二数据训练第二模型，得到梯度信息、第二模型参数和第二中间结果；所述梯度信息用于更新所述第二模型；所述第二数据包括在所述第一样本中所述用户交集对应的第二用户特征数据和所述标签数据；将加密后的第二模型参数和第二中间结果发送至所述第二参与方进行迭代训练，直到确定待训练机器学习模型训练完成；所述待训练机器学习模型包括所述第一模型和所述第二模型。 2.根据权利要求1所述的方法，其特征在于，所述第一用户特征数据为通过对第三用户特征数据进行数据清洗和异常值处理得到；所述第三用户特征数据为从第四用户特征数据中确定出位于预设范围内的用户特征数据；所述第四用户特征数据为所述第一样本中与所述用户交集对应的用户特征数据；所述预设范围包括：客户资产、消费、还款、征信、信用卡账单、转账、代发薪、收入。 3.根据权利要求2所述的方法，其特征在于，所述确定第一参与方的第一样本和第二参与方的第二样本的用户交集，包括：利用差分隐私技术，确定第一参与方的第一样本和第二参与方的第二样本的用户交集。 4.根据权利要求1所述的方法，其特征在于，所述确定待训练机器学习模型训练完成，包括：确定所述第二模型的损失函数收敛。 5.根据权利要求1 ‑4任意一项所述的方法，其特征在于，所述待训练机器学习模型可以为以下算法的任意一种：随机森林、 Xgbo ost、 GBDT、 l ightGBM。 6.一种基于联邦学习的建模装置，其特征在于，应用于第一参与方，所述第一参与方持有标签数据，包括：确定单元，用于确定第一参与方的第一样本和第二参与方的第二样本的用户交集；接收单元，用于接收所述第二参与方发送的加密后的第一模型参数和第一中间结果；所述第一模型参数和所述第一中间结果为根据第一数据训练第一模型得到；所述第一数据为在所述第二样本中所述用户交集对应的第一用户特征数据；计算单元，用于根据所述第一模型参数、所述第一中间结果和第二数据训练第二模型，得到梯度信息、第二模型参数和第二中间结果；所述梯度信息用于更新所述第二模型；所述第二数据包括在所述第一样本中所述用户交集对应的第二用户特征数据和所述标签数据；发送单元，用于将加密后的第二模型参数和第二中间结果发送至所述第二参与方进行迭代训练，直到确定待训练机器学习模型训练完成；所述待训练机器学习模型包括所述第一模型和所述第二模型。 7.根据权利要求6所述的装置，其特征在于，所述第一用户特征数据为通过对第三用户权　利　要　求　书 1/2 页 2 CN 115082193 A 2特征数据进行数据清洗和异常值处理得到；所述第三用户特征数据为从第四用户特征数据中确定出位于预设范围内的用户特征数据；所述第四用户特征数据为所述第一样本中与所述用户交集对应的用户特征数据；所述预设范围包括：客户资产、消费、还款、征信、信用卡账单、转账、代发薪、收入。 8.根据权利要求7 所述的装置，其特征在于，所述确定单元，用于：利用差分隐私技术，确定第一参与方的第一样本和第二参与方的第二样本的用户交集。 9.一种计算机设备，其特征在于，所述计算机设备包括处理器以及存储器：所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；所述处理器用于根据所述程序代码中的指令执行权利要求1 ‑5中任意一项所述的方法。 10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储计算机程序，所述计算机程序用于执行权利要求1 ‑5中任意一项所述的方法。权　利　要　求　书 2/2 页 3 CN 115082193 A 3

专利 一种基于联邦学习的建模方法、装置、设备及介质

专利一种基于联邦学习的建模方法、装置、设备及介质