全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210755862.X (22)申请日 2022.06.29 (71)申请人 中国工商银行股份有限公司 地址 100140 北京市西城区复兴门内大街 55号 (72)发明人 吕朝辉 罗涛 施佳子 于海燕  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 吴梦圆 (51)Int.Cl. G06Q 40/06(2012.01) G06Q 40/02(2012.01) G06K 9/62(2022.01) (54)发明名称 操作数据处理方法、 装置、 电子设备及存储 介质 (57)摘要 本公开提供了一种操作数据处理方法, 可以 应用于大数据技术领域或金融领域。 该操作数据 处理方法包括: 获取目标用户在第一预设时间段 内基于交易客户端产生的目标操作数据; 将上述 目标操作数据输入预先训练好的关键字提取模 型中, 输出与上述目标操作数据对应的目标关键 字; 将上述目标关键字输入向量化模型中, 确定 上述向量化模 型中至少两个聚类簇中, 与上述目 标关键字对应的目标聚类簇; 以及根据上述目标 聚类簇和预设计算方式确定与上述目标操作数 据对应的向量化数据。 本公开还提供了一种操作 数据处理装置、 设备、 存 储介质。 权利要求书3页 说明书30页 附图9页 CN 115082245 A 2022.09.20 CN 115082245 A 1.一种操作数据处 理方法, 包括: 获取目标用户在第一预设时间段内基于交易 客户端产生的目标操作数据; 将所述目标操作数据输入预先训练好的关键字提取模型中, 输出与 所述目标操作 数据 对应的目标关键 字; 将所述目标关键字输入向量化模型中, 确定所述向量化模型中至少两个聚类簇中, 与 所述目标关键 字对应的目标聚类簇; 以及 根据所述目标聚类簇和预设计算方式确定与所述目标操作数据对应的向量 化数据。 2.根据权利要求1所述的方法, 其中, 所述根据所述目标聚类簇和预设计算方式确定与 所述目标操作数据对应的向量 化数据包括: 获取所述目标聚类簇中目标簇心的向量 化数据; 确定所述目标关键 字距离所述目标簇心的距离, 得到第一距离; 确定所述目标关键字距离非 目标簇心的距离, 得到第 二距离, 其中, 所述非目标簇心包 括所述至少两个聚类簇中除所述目标簇心之外的簇心; 根据所述目标簇心的向量化数据、 所述第一距离、 所述第二距离、 以及聚类簇的数量, 确定与所述目标操作数据对应的向量 化数据。 3.根据权利要求1所述的方法, 还 包括, 在所述将所述目标操作数据输入预先训练好的关键字提取模型中, 输出与 所述目标操 作数据对应的目标关键字之前, 对所述 目标操作数据进行预处理, 得到处理后的目标操作 数据; 其中, 所述将所述目标操作数据输入预先训练好的关键字提取模型中, 输出与所述目 标操作数据对应的目标关键 字包括: 将所述处理后的目标操作 数据输入预先训练好的关键字提取模型中, 输出与 所述处理 后的目标操作数据对应的目标关键 字。 4.根据权利要求3所述的方法, 其中, 所述对所述目标操作数据进行预处理, 得到处理 后的目标操作数据包括: 对所述目标操作数据进行去停用词处理、 去无效词处理和去无效英文处理, 得到所述 处理后的目标操作数据。 5.根据权利要求1所述的方法, 其中, 所述关键 字提取模型采用以下 方法训练得到: 获取金融系统中的用户在第二预设时间段内产生的历史操作数据, 得到第一样本数 据; 对所述第一样本数据进行 预处理, 得到处 理后的第一样本数据; 利用预设 关键字集对所述处 理后的第一样本数据进行 标注, 得到训练数据集; 以及 利用所述训练数据集训练待训练的关键 字提取模型, 得到所述关键 字提取模型。 6.根据权利要求1所述的方法, 其中, 所述向量 化模型采用以下 方法训练得到: 获取金融系统中m个用户在第三预设时间段内产生的历史操作数据, 得到第二样本数 据, 其中, m≥2; 对所述第二样本数据进行 预处理, 得到处 理后的第二样本数据; 针对所述m个用户中的每个用户, 将与所述用户对应的所述处理后的第二样本数据输 入所述关键 字提取模型中, 输出与所述用户对应的关键 字, 最终得到m组关键 字;权 利 要 求 书 1/3 页 2 CN 115082245 A 2对所述m组关键 字进行聚类, 得到n个聚类簇, 其中, 2≤n≤m; 针对所述m个用户中的每个用户, 根据 所述n个聚类簇确定所述用户的历史操作数据对 应的向量 化数据, 最终得到m个向量 化数据; 以及 根据所述 n个聚类簇和所述m个向量 化数据确定所述向量 化模型。 7.根据权利要求6所述的方法, 其中, 所述聚类簇中位于簇心处的关键字表示所述m个 用户中的其中一个用户的历史操作数据; 所述针对所述m个用户中的每个用户, 根据 所述n个聚类簇确定所述用户的历史操作数 据对应的向量 化数据, 最终得到m个向量 化数据包括: 针对所述n个聚类簇中的每个聚类簇, 对第i聚类簇中位于簇心处的关键字进行向量 化, 得到第i簇心向量 化数据, 其中, 1≤i≤n; 利用所述第i簇心向量化数据和预设计算方式确定所述第i聚类簇中与位于非簇心处 的关键字对应的非簇心向量化数据, 其中, 所述位于非簇心处的关键字包括所述第i聚类簇 中除位于簇心处的关键字 之外的关键字, 最 终得到n个簇心向量化数据和m ‑n个非簇心向量 化数据; 根据所述n个簇心向量化数据和所述m ‑n个非簇心向量化数据确定所述m个向量化数 据。 8.根据权利要求7所述的方法, 其中, 所述利用所述第i簇心向量化数据和预设计算方 式确定所述第i聚类簇中与位于非簇心处的关键 字对应的非簇心向量 化数据: 确定所述第 i聚类簇中所述位于非簇心处 的关键字距离所述第i 聚类簇中簇心的距离, 得到第三距离; 确定所述第i聚类簇中所述位于非簇心处的关键字距离其他簇心 的距离, 得到第 四距 离, 其中, 所述 其他簇心包括所述 n个聚类簇中去除所述第i聚类簇中的簇心之外的簇心; 根据所述第i聚类簇的簇心向量数据、 所述第三距离、 所述第 四距离、 以及聚类簇的数 量, 确定所述第i聚类簇中与位于非簇心处的关键 字对应的非簇心向量 化数据。 9.根据权利要求1所述的方法, 还 包括: 获取所述目标用户在所述第一预设时间段内基于所述交易 客户端产生的交易数据; 将所述交易数据和所述向量化数据输入产品推荐模型中, 输出与所述目标用户对应的 金融产品。 10.一种操作数据处 理装置, 包括: 第一获取模块, 用于获取目标用户在第 一预设时间段内基于交易客户端产生的目标操 作数据; 第一输入输出模块, 用于将所述目标操作数据输入预先训练好的关键字提取模型中, 输出与所述目标操作数据对应的目标关键 字; 第一确定模块, 将所述目标关键字输入向量化模型中, 确定所述向量化模型中至少两 个聚类簇中, 与所述目标关键 字对应的目标聚类簇; 以及 第二确定模块, 用于根据所述目标聚类簇和预设计算方式确定与所述目标操作数据对 应的向量 化数据。 11.一种电子设备, 包括: 一个或多个处 理器;权 利 要 求 书 2/3 页 3 CN 115082245 A 3

.PDF文档 专利 操作数据处理方法、装置、电子设备及存储介质

文档预览
中文文档 43 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共43页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 操作数据处理方法、装置、电子设备及存储介质 第 1 页 专利 操作数据处理方法、装置、电子设备及存储介质 第 2 页 专利 操作数据处理方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:23:41上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。