全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210716064.6 (22)申请日 2022.06.22 (71)申请人 平安银行股份有限公司 地址 518000 广东省深圳市罗湖区深南 东 路5047号 (72)发明人 刘文渊  (74)专利代理 机构 深圳紫藤知识产权代理有限 公司 44570 专利代理师 魏学昊 (51)Int.Cl. G06K 9/62(2022.01) G06Q 40/02(2012.01) (54)发明名称 样本生成方法、 装置、 终端设备及计算机可 读存储介质 (57)摘要 本申请提供一种样本生成方法、 装置、 终端 设备及计算机可读存储介质, 该方法包括: 获取 初始样本集, 初始样本集中每个样 本具有属性标 签; 根据每个样本的属性标签, 从初始样本集中 确定具有目标属性标签的目标样 本; 根据预设的 关联关系, 获取目标样本的第一生成样本; 对目 标属性标签进行相关分析, 确定与目标属性标签 的相关属性标签以及与相关属性标签对应的第 二生成样本; 根据目标样本、 第一生成样本和第 二生成样本, 生成实际关联样本。 本申请提供的 样本生成方法, 可以将样本自身的关联样本以及 样本标签的关联标签所对应的额外的关联样本 进行结合, 提高了样本数据的关联分类的效果, 从侧面提高了管理的效率。 权利要求书2页 说明书11页 附图2页 CN 115204267 A 2022.10.18 CN 115204267 A 1.一种样本生成方法, 其特 征在于, 所述方法包括: 获取初始样本集, 所述初始样本集中每 个样本具有属性标签; 根据每个样本的属性标签, 从所述初始样本集中确定具有目标属性标签的目标样本; 根据预设的关联关系, 获取 所述目标样本的第一 生成样本; 对所述目标属性标签进行相关分析, 确定与所述目标属性标签的相关属性标签以及与 所述相关属性标签对应的第二 生成样本; 根据所述目标样本、 所述第一 生成样本和所述第二 生成样本, 生成实际关联样本 。 2.根据权利要求1所述的样本生成方法, 其特征在于, 所述对所述目标属性标签进行相 关分析, 确定与所述目标属性标签的相关属性标签以及与所述相关属性标签对应的第二生 成样本, 包括: 对所述目标属性标签进行拆解分析, 得到所述目标属性标签的子属性标签, 所述目标 属性标签包括所述子属性标签; 对所述目标属性标签进行近似分析, 得到所述目标属性标签的近似属性标签, 所述相 关属性标签包括子属性标签以及近似属性标签; 根据所述子属性标签, 从所述初始样本集得到所述子属性标签对应的相关样本; 根据所述近似属性标签, 从所述初始样本集得到所述近似属性标签对应的近似样本, 所述相关样本和所述近似样本为所述第二 生成样本 。 3.根据权利要求2所述的样本生成方法, 其特征在于, 所述根据所述子属性标签, 从所 述初始样本集得到所述子属性标签对应的相关样本, 包括: 根据所述子属性标签, 从所述初始样本集得到初始相关样本; 计算所述初始相关样本与 所述目标属性标签的相似度, 一个初始相关样本对应一个相 似度; 根据所述相似度, 对初始相关样本进行排序, 得到排序后的初始相关样本; 根据预设的排序阈值, 从排序后的初始相关样本中, 确定得到相关样本 。 4.根据权利要求3所述的样本生成方法, 其特征在于, 所述根据所述相似度, 对初始相 关样本进行排序, 得到排序后的初始相关样本, 包括: 根据所述相似度的数值, 进行递减排序, 得到递减排序的初始相关样本 。 5.根据权利要求2所述的样本生成方法, 其特征在于, 所述对所述目标属性标签进行近 似分析, 得到所述目标属性标签的近似属性标签, 包括: 将所述目标属性标签转 化为目标词向量; 计算所述目标词向量相似的相似词向量; 从所述初始样本集中确定所述相似词向量对应的近似属性标签。 6.根据权利要求2所述的样本生成方法, 其特征在于, 所述根据所述近似属性标签, 从 所述初始样本集得到所述近似属性标签对应的近似样本, 包括: 若所述近似属性标签为多个, 对所述近似属性标签进行聚类分析, 得到与所述目标属 性标签的匹配近似属性标签; 从所述初始样本集中确定所述匹配近似属性标签对应的近似样本 。 7.根据权利要求1所述的样本生成方法, 其特征在于, 所述根据所述目标样本、 所述第 一生成样本和所述第二 生成样本, 生成实际关联样本, 包括:权 利 要 求 书 1/2 页 2 CN 115204267 A 2合并所述目标样本、 所述第一生成样本、 所述相关样本和所述近似样本, 得到合并样 本; 过滤所述合并样本中的重复样本, 生成所述实际关联样本 。 8.一种样本生成装置, 其特 征在于, 所述装置包括: 第一获取模块, 用于获取初始样本集, 所述初始样本集中每 个样本具有属性标签; 第一确定模块, 用于根据每个样本的属性标签, 从所述初始样本集中确定具有目标属 性标签的目标样本; 第二获取模块, 用于根据预设的关联关系, 获取 所述目标样本的第一 生成样本; 第二确定模块, 用于对所述目标属性标签进行相关分析, 确定与所述目标属性标签的 相关属性标签以及与所述相关属性标签对应的第二 生成样本; 生成模块, 用于根据 所述目标样本、 所述第一生成样本和所述第二生成样本, 生成实际 关联样本 。 9.一种终端设备, 其特征在于, 所述终端设备包括处理器、 存储器以及存储于所述存储 器中并可在所述处理器上运行的计算机程序, 所述处理器执行所述计算机程序以实现权利 要求1至7任一项所述的样本生成方法中的步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有计算机 程序, 所述计算机程序被处理器执行以实现权利要求 1至7任一项 所述的样 本生成方法中的 步骤。权 利 要 求 书 2/2 页 3 CN 115204267 A 3

.PDF文档 专利 样本生成方法、装置、终端设备及计算机可读存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 样本生成方法、装置、终端设备及计算机可读存储介质 第 1 页 专利 样本生成方法、装置、终端设备及计算机可读存储介质 第 2 页 专利 样本生成方法、装置、终端设备及计算机可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:23:59上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。