全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210601632.8 (22)申请日 2022.05.30 (71)申请人 新奥新智科技有限公司 地址 065099 河北省廊坊市广阳区临 空经 济区航谊道自贸区科创基地2101 (72)发明人 丁启杰  (74)专利代理 机构 北京嘉科知识产权代理事务 所(特殊普通 合伙) 11687 专利代理师 张艳 (51)Int.Cl. G06N 20/00(2019.01) G06F 21/32(2013.01) G06Q 40/02(2012.01) (54)发明名称 联合学习训练方法及装置 (57)摘要 本公开涉及联合学习技术领域, 提供了一种 联合学习训练方法及装置。 该方法包括: 构建参 与方的编码网络, 以及服务方的解码网络; 获取 参与方的训练数据样本和服务方的基础数据样 本, 其中, 训练数据样本参与方携带有训练数据 样本的标识号, 基础数据样本携带有基础数据样 本的标识号和标签; 根据训练数据样本的标识 号, 从基础数据样本中, 为训练数据样本匹配训 练数据样 本对应的标签; 基于训练数据样本和训 练数据样 本对应的标签, 对解码网络和编码网络 进行联合学习训练。 权利要求书2页 说明书10页 附图2页 CN 114897186 A 2022.08.12 CN 114897186 A 1.一种联合学习训练方法, 其特 征在于, 包括: 构建参与方的编码网络, 以及服 务方的解码网络; 获取所述参与方的训练数据样本和所述服务方的基础数据样本, 其中, 所述训练数据 样本携带有所述训练数据样本的标识号, 所述基础数据样本携带有所述基础数据样本的标 识号和标签; 根据所述训练数据样本的标识号, 从所述基础数据样本中, 为所述训练数据样本匹配 所述训练数据样本对应的标签; 基于所述训练数据样本和所述训练数据样本对应的标签, 对所述解码网络和所述编码 网络进行 联合学习训练。 2.根据权利要求1所述的方法, 其特征在于, 所述基于所述训练数据样本和所述训练数 据样本对应的标签, 对所述 解码网络和所述编码网络进行 联合学习训练, 包括: 将所述训练数据样本 输入所述编码网络, 输出 所述训练数据样本对应的编码值; 基于所述训练数据样本对应的编码值和标签, 通过所述解码网络, 利用 梯度下降算法 计算所述训练数据样本对应的梯度; 基于所述训练数据样本对应的梯度, 更新所述 解码网络和所述编码网络的网络参数。 3.根据权利要求2所述的方法, 其特征在于, 所述基于所述训练数据样本对应的梯度, 更新所述 解码网络和所述编码网络的网络参数, 包括: 基于所述训练数据样本对应的梯度, 利用梯度反向传播算法更新所述解码网络的网络 参数; 基于所述训练数据样本对应的梯度, 利用所述梯度反 向传播算法更新所述编码网络的 网络参数。 4.根据权利要求1所述的方法, 其特征在于, 所述基于所述训练数据样本和所述训练数 据样本对应的标签, 对所述 解码网络和所述编码网络进行 联合学习训练, 包括: 确定所述联合学习训练对应的训练总轮次, 其中, 所述训练总轮次用于指示所述联合 学习训练的总次数; 循环执行如下步骤进行 所述联合学习训练: 将所述训练数据样本 输入所述编码网络, 输出 所述训练数据样本对应的编码值; 基于所述训练数据样本对应的编码值和标签, 通过所述解码网络, 利用 梯度下降算法 计算所述训练数据样本对应的梯度; 基于所述训练数据样本对应的梯度, 更新所述解码网络和所述编码网络的网络参数, 同时训练轮次加一, 其中, 训练轮次用于表示当前 所述联合学习训练的次数; 当所述训练轮次等于所述训练总轮次, 结束所述联合学习训练, 当所述训练轮次小于 所述训练总轮次, 继续所述联合学习训练。 5.根据权利要求1所述的方法, 其特征在于, 所述基于所述训练数据样本和所述训练数 据样本对应的标签, 对所述 解码网络和所述编码网络进行 联合学习训练, 包括: 确定所述联合学习训练对应的目标模型精度, 其中, 所述目标模型精度用于指示通过 所述联合学习训练, 所述 解码网络和所述编码网络最终要达 到的模型精度; 循环执行如下步骤进行 所述联合学习训练: 将所述训练数据样本 输入所述编码网络, 输出 所述训练数据样本对应的编码值;权 利 要 求 书 1/2 页 2 CN 114897186 A 2基于所述训练数据样本对应的编码值和标签, 通过所述解码网络, 利用 梯度下降算法 计算所述训练数据样本对应的梯度; 基于所述训练数据样本对应的梯度, 更新所述解码网络和所述编码网络的网络参数, 同时计算所述解码网络和所述编码网络的当前模型精度, 其中, 当前模型精度用于表示当 前所述联合学习训练对应的模型精度; 当所述当前模型精度等于或大于所述目标模型精度, 结束所述联合学习训练, 当所述 当前模型精度小于所述目标模型精度, 继续所述联合学习训练。 6.根据权利要求1所述的方法, 其特征在于, 所述基于所述训练数据样本和所述训练数 据样本对应的标签, 对所述解码网络和所述编码网络进行联合学习训练之后, 所述方法还 包括: 当存在多个所述 参与方时: 从所述多个所述 参与方中确定出目标参与方; 利用所述 解码网络和所述目标参与方的编码网络, 为所述目标参与方提供 预测服务。 7.根据权利要求6所述的方法, 其特征在于, 所述利用所述解码网络和所述目标参与方 的编码网络, 为所述目标参与方提供 预测服务, 包括: 获取预测数据, 其中, 所述预测数据包括多个样本; 将所述预测数据中的每个样本输入所述目标参与方的编码网络, 输出所述预测数据中 的每个样本对应的编码值; 将所述预测数据中的每个样本对应的编码值输入所述解码网络, 输出所述预测数据对 应的预测结果。 8.一种联合学习训练装置, 其特 征在于, 包括: 构建模块, 被 配置为构建参与方的编码网络, 以及服 务方的解码网络; 获取模块, 被配置为获取所述参与方的训练数据样本和所述服务方的基础数据样本, 其中, 所述训练数据样本参与方携带有所述训练数据样本的标识号, 所述基础数据样本携 带有所述基础数据样本的标识号和标签; 匹配模块, 被配置为根据 所述训练数据样本的标识号, 从所述基础数据样本 中, 为所述 训练数据样本匹配所述训练数据样本对应的标签; 训练模块, 被配置为基于所述训练数据样本和所述训练数据样本对应的标签, 对所述 解码网络和所述编码网络进行 联合学习训练。 9.一种电子设备, 包括存储器、 处理器以及存储在所述存储器中并且可在所述处理器 上运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求 1至 7中任一项所述方法的步骤。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于, 所述计算机程序被处 理器执行时实现如权利要求1至7中任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114897186 A 3

.PDF文档 专利 联合学习训练方法及装置

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 联合学习训练方法及装置 第 1 页 专利 联合学习训练方法及装置 第 2 页 专利 联合学习训练方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:24:39上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。