全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210680515.5 (22)申请日 2022.06.16 (71)申请人 深圳市小赢信息技 术有限责任公司 地址 518000 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (入驻深圳市 前海商务秘书 有限公司) (72)发明人 马林 吴丹  (74)专利代理 机构 深圳中一联合知识产权代理 有限公司 4 4414 专利代理师 林春梅 (51)Int.Cl. G06Q 40/02(2012.01) G06F 17/18(2006.01) G06N 20/00(2019.01) (54)发明名称 模型训练样本的处理方法、 装置、 终端设备 和存储介质 (57)摘要 本申请适用于深度学习技术领域, 提供了一 种模型训练样本的处理方法、 装置、 终端设备和 存储介质。 其中, 上述模型训练样本的处理方法 具体包括: 利用样本时间周期中不同分位值的特 征变量, 预测目标时间周期中对应 分位值的特征 变量, 得到初始样本数据, 所述初始样本数据的 特征变量随时间周期变化; 将所述初始样本数据 按照分位值进行排序, 并对排序后特征变量的大 小不满足一致性条件的特征变量进行修正, 得到 满足所述一致性条件的修正后的特征变量; 将所 述修正后的特征变量映射回所述初始样本数据, 得到目标样 本数据, 所述目标样 本数据用于进行 模型训练。 本申请的实施例可以提高模型的准确 性与可靠性。 权利要求书2页 说明书9页 附图4页 CN 115115445 A 2022.09.27 CN 115115445 A 1.一种模型训练样本的处 理方法, 其特 征在于, 包括: 利用样本时间周期中不同分位值的特征变量, 预测目标时间周期中对应分位值的特征 变量, 得到初始样本数据, 所述初始样本数据的特 征变量随时间周期变化; 将所述初始样本数据按照分位值进行排序, 并对排序后特征变量的大小不满足一致性 条件的特 征变量进行修 正, 得到满足所述 一致性条件的修 正后的特 征变量; 将所述修正后的特征变量映射回所述初始样本数据, 得到目标样本数据, 所述目标样 本数据用于进行模型训练。 2.如权利要求1所述的模型训练样本的处理方法, 其特征在于, 所述利用样本时间周期 中不同分位值的特征变量, 预测目标时间周期 中对应分位值的特征变量, 得到初始样本数 据, 包括: 获取训练样本数据, 所述训练样本数据包括所述样本时间周期中不同分位值的特征变 量, 所述训练样本数据的特 征变量随时间周期变化; 构建待训练的分位数回归 模型; 利用所述训练样本数据和梯度 下降法对所述待训练 的分位数回归模型进行训练, 求解 不同分位 值对应的模型参数, 得到目标分位数回归 模型; 利用所述目标分位数回归模型中不同分位值对应的模型参数, 预测所述目标时间周期 内不同分位 值的特征变量, 得到所述初始样本数据。 3.如权利要求2所述的模型训练样本的处理方法, 其特征在于, 所述构建待训练 的分位 数回归模型, 包括: 构建所述待训练的分位数回归模型y=m(x)+ε, 其 中, y为特征变量, x为时间周期, m(x) 为不同分位数对应的斜 率组成的数组, ε为 不同分位 值对应的截距组成的数组。 4.如权利要求3所述的模型训练样本的处理方法, 其特征在于, 所述待训练的分位数回 归模型以一阶分位 数回归y=β1x+β0表示, 所述模型参 数包括不同分位数对 应的斜率组成的 数组β1和不同分位数对应的截距组成的数组β0; 相应的, 所述利用所述训练样本数据和梯度 下降法对所述待训练 的分位数回归模型进 行训练, 求 解不同分位 值对应的模型参数, 包括: 利用所述训练样本数据和梯度 下降法对所述待训练 的分位数回归模型进行训练, 求解 不同分位数对应的斜 率组成的数组β1和不同分位数对应的截距组成的数组β0。 5.如权利要求2至4任意一项所述的模型训练样本的处理方法, 其特征在于, 所述对排 序后特征变量的大小不满足一 致性条件的特 征变量进行修 正之前, 所述处 理方法还 包括: 依次将所述初始样本数据中每个分位值作为当前分位值, 若所述当前分位值的特征变 量大于所述当前分位值的下一分位值的特征变量, 则确认所述下一分位值的特征变量不满 足所述一致性条件。 6.如权利要求2至4任意一项所述的模型训练样本的处理方法, 其特征在于, 所述模型 参数包括 斜率; 在所述对排序后特征变量的大小不满足一致性条件的特征变量进行修正的步骤中, 对 当前分位 值的特征变量进行修 正的步骤, 包括: 若所述当前分位值对应的斜率大于0, 且大于所述下一分位值对应的斜率, 则将所述当 前分位值的特征变量修正为所述下一分位 值的特征变量;权 利 要 求 书 1/2 页 2 CN 115115445 A 2或者, 若所述当前分位值对应的斜率小于0, 且小于所述下一分位值对应的斜率, 则将 所述当前分位 值的特征变量修正为所述下一分位 值的特征变量。 7.如权利要求6所述的模型训练样本的处 理方法, 其特 征在于, 所述处 理方法还 包括: 若所述当前分位值对应的斜率大于0, 且小于所述下一分位值对应的斜率, 或者, 若所 述当前分位值对应的斜率小于0, 且大于所述下一分位值对应的斜率, 则调整 所述待训练的 分位数回归 模型的超参数, 并对所述待训练的分位数回归 模型重新进行训练。 8.一种模型训练样本的处 理装置, 其特 征在于, 包括: 样本预测单元, 用于利用样本时间周期中不同分位值的特征变量, 预测目标时间周期 中对应分位值的特征变量, 得到初始样本数据, 所述初始样本数据的特征变量随时间周期 变化; 样本修正单元, 用于将所述初始样本数据按照分位值进行排序, 并对排序后特征变量 的大小不满足一致性条件的特征变量进行修正, 得到满足所述一致性条件的修正后的特征 变量; 样本映射单元, 用于将所述修正后的特征变量映射回所述初始样本数据, 得到目标样 本数据, 所述目标样本数据用于进行模型训练。 9.一种终端设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器上 运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求1至7 任一项所述处 理方法的步骤。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于, 所述计算机程序被处 理器执行时实现如权利要求1至7任一项所述处 理方法的步骤。权 利 要 求 书 2/2 页 3 CN 115115445 A 3

.PDF文档 专利 模型训练样本的处理方法、装置、终端设备和存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练样本的处理方法、装置、终端设备和存储介质 第 1 页 专利 模型训练样本的处理方法、装置、终端设备和存储介质 第 2 页 专利 模型训练样本的处理方法、装置、终端设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:24:03上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。