全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221082695 3.8 (22)申请日 2022.07.14 (71)申请人 腾讯科技 (上海) 有限公司 地址 201200 上海市徐汇区虹梅路1801号C 区5层 (72)发明人 徐华鹏  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 唐宇鑫 (51)Int.Cl. G06N 3/04(2006.01) G06N 3/08(2006.01) G06Q 30/02(2012.01) (54)发明名称 一种数据处理方法、 装置、 计算机设备及存 储介质 (57)摘要 本申请实施例公开了一种数据处理方法、 装 置、 计算机设备及存储介质, 可应用于人工智能 以及云技术等各种场景, 包括: 获取业务对象在 业务历史周期内对应的业务特征; 业务特征包括 业务对象对应的业务基础特征以及业务序列特 征; 获取候选业务数据的候选数据特征, 对业务 序列特征以及候选数据特征进行自注意力特征 提取处理, 得到业务序列递进关系特征; 对业务 基础特征对应的业务基础向量、 业务序列特征对 应的业务序列向量、 候选数据特征对应的候选向 量以及业务序列递进关系特征进行特征拼接处 理, 得到业务拼接特征, 对业务拼接特征进行特 征提取处理, 得到业务对象针对侯选业务数据的 业务触发率。 采用本申请实施例, 可以提升预测 准确度。 权利要求书5页 说明书26页 附图9页 CN 115115036 A 2022.09.27 CN 115115036 A 1.一种数据处 理方法, 其特 征在于, 包括: 获取业务对象在业务历史周期内对应的业务特征; 所述业务特征包括所述业务对象对 应的业务基础特征以及业务序列特征; 所述业务基础特征是基于所述业务对象在所述业务 历史周期内的历史业务数据所确定的; 所述业务序列特征是基于所述历史业务数据中的正 向业务数据所确定的; 获取候选业务数据的候选数据 特征, 对所述业务序列 特征以及所述候选数据 特征进行 自注意力特征提取处理, 得到所述业务序列特征对应的业务序列递进关系 特征; 所述业务 序列递进关系特征用于表征所述候选数据特征与所述业务序列特征之 间的依赖 关系; 所述 候选数据特 征包括第一类型 数据的第一数据特 征或第二类型 数据的第二数据特 征; 对所述业务基础特征对应的业务基础 向量、 所述业务序列特征对应的业务序列向量、 所述候选数据特征对应的候选向量以及所述业务序列递进关系特征进 行特征拼接处理, 得 到业务拼接特征, 对所述业务拼接特征进行特征提取处理, 得到所述业务对 象针对所述侯 选业务数据的业 务触发率。 2.根据权利要求1所述的方法, 其特征在于, 所述获取业务对象在业务历史周期内对应 的业务特征, 包括: 在获取到与业务对象相关联的业务预测请求 时, 获取在业务历史周期内用于发送至所 述业务对 象的历史业务数据, 基于所述业务预测请求所指示的预测类型, 在业务历史周期 内获取所述历史业务数据中的正向业务数据, 基于获取到的所述正向业务数据, 确定所述 业务对象对应的业 务序列特 征; 获取与所述历史业 务数据相关联的业 务统计特 征; 获取与所述历史业务数据相关联的业务数据标识, 基于所述业务数据标识确定所述业 务对象对应的业 务数据特 征; 获取所述业务对象对应的业务对象标识, 基于所述业务对象标识确定所述业务对象对 应的业务对象特 征; 基于所述业务统计特征、 所述业务数据特征以及所述业务对象特征, 确定所述业务对 象对应的业务基础特征, 将所述业务基础特征以及所述业务序列特征确定为所述业务对象 在所述业务历史周期内对应的业 务特征。 3.根据权利要求1所述的方法, 其特征在于, 所述获取候选业务数据的候选数据特征, 对所述业务序列特征以及所述候选数据特征进行自注意力特征提取处理, 得到所述业务序 列特征对应的业 务序列递进关系特 征, 包括: 获取候选业务数据的候选数据 特征, 将所述业务特征以及所述候选数据 特征输入至针 对所述业务对 象的触发率预估模型; 所述触发率预估模型包括共享嵌入层、 自注意力层以 及求和池化层; 通过所述共享嵌入层对所述候选数据 特征进行特征编码处理, 得到所述候选数据 特征 对应的候选向量; 通过所述共享嵌入层对所述业务特征中的所述业务序列 特征进行特征编码处理, 得到 所述业务序列特 征对应的业 务序列向量; 将所述候选向量以及所述业务序列向量输入至所述自注意力层, 通过所述自注意力层 以及所述求和池化层, 对所述候选 向量以及所述业务序列向量进行自注意力提取处理, 得权 利 要 求 书 1/5 页 2 CN 115115036 A 2到所述业务序列特 征对应的业 务序列递进关系特 征。 4.根据权利要求3所述的方法, 其特征在于, 所述业务序列特征包括H个业务序列子特 征; H为正整数; 所述H个业务序列 子特征包括业务序列子特征Xg; g为小于或者等于H的正整 数; 所述将所述候选向量以及所述业务序列向量输入至所述自注意力层, 通过所述自注意 力层以及所述求和池化层, 对所述候选向量以及所述业务序列向量进行自注意力提取处 理, 得到所述 业务序列特 征对应的业 务序列递进关系特 征, 包括: 将所述候选向量以及所述 业务序列向量输入至所述自注意力层; 从所述业务序列向量中获取所述业务序列子特征Xg对应的业务序列子向量, 将获取到 的业务序列子向量确定为所述业务序列子特征Xg对应的键向量Kg, 将获取到的业务序列子 向量确定为所述业务序列子特征Xg对应的值向量Vg, 将所述候选向量确定为所述业务序列 子特征Xg对应的查询向量; 通过所述自注意力层, 基于所述键向量Kg和所述查询向量, 确定所述业务序列子特征Xg 对应的权 重参数Wg; 对所述权重参数Wg以及所述值向量Vg进行点乘处理, 得到所述业务序列子特征Xg对应 的递进关系特 征Ug; 在获取到H个业务序列子特征分别对应的递进关系特征时, 通过所述求和池化层, 对H 个递进关系特 征进行求和处 理, 得到所述 业务序列向量对应的业 务序列递进关系特 征。 5.根据权利要求1所述的方法, 其特征在于, 所述业务基础特征包括业务统计特征、 业 务数据特 征以及业 务对象特 征; 所述对所述业务基础特征对应的业务基础向量、 所述业务序列 特征对应的业务序列向 量、 所述候选数据特征对应的候选向量以及所述业务序列递进关系特征进行特征拼接处 理, 得到业务拼接特征, 对所述业务拼接特征进 行特征提取 处理, 得到所述业务对象针对所 述侯选业 务数据的业 务触发率, 包括: 在将所述业务基础特征输入至针对所述业务对象的触发率预估模型时, 通过所述触发 率预估模型中的共享嵌入层, 获取所述业务基础特征对应的业务基础向量; 所述业务基础 向量包括所述业务统计特征对应的业务统计向量、 所述业务数据特征对应的业务数据向量 以及所述 业务对象特 征对应的业 务对象向量; 对所述业务统计向量、 所述业务数据向量、 所述业务对象向量、 所述业务序列特征对应 的业务序列向量、 所述候选数据特征对应的候选向量以及所述业务序列递进关系特征进 行 特征拼接处 理, 得到业 务拼接特征; 通过所述触发率预估模型中的特征拼接提取层, 对所述业务拼接特征进行特征提取处 理, 得到所述 业务对象针对所述 候选业务数据的业 务触发率。 6.根据权利要求1所述的方法, 其特 征在于, 所述 候选业务数据的数量 为Y, Y为正整数; 所述方法还 包括: 从所述Y个候选业务数据中确定待排序数据, 获取所述待排序数据对应的出价以及所 述业务对象针对所述待排序数据的转 化率; 基于所述待排序 数据对应的出价、 所述业务对象针对所述待排序 数据的转化率以及所 述业务对象针对所述待排序数据的业 务触发率, 确定所述待排序数据对应的排序参数;权 利 要 求 书 2/5 页 3 CN 115115036 A 3

.PDF文档 专利 一种数据处理方法、装置、计算机设备及存储介质

文档预览
中文文档 41 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共41页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种数据处理方法、装置、计算机设备及存储介质 第 1 页 专利 一种数据处理方法、装置、计算机设备及存储介质 第 2 页 专利 一种数据处理方法、装置、计算机设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:28:58上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。