全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210687919.7 (22)申请日 2022.06.16 (71)申请人 平安银行股份有限公司 地址 518000 广东省深圳市罗湖区深南 东 路5047号 (72)发明人 吉宗诚 周娟 肖银龙 黎建辉  廖晓格 林志超 马睿 夏天  阙子扬  (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 专利代理师 贾耀斌 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/216(2020.01) G06F 40/284(2020.01)G06F 40/289(2020.01) G06Q 40/02(2012.01) (54)发明名称 业务意图识别方法、 装置、 设备和存 储介质 (57)摘要 本发明实施例公开了一种业务意图识别方 法、 装置、 设备和存储介质, 该方法包括获取业务 过程中的多个用户描述语句; 对 各用户描述语句 进行词句划分, 得到多个长难句; 采用预设业务 词典对各长难句进行分词处理, 得到多个业务词 语; 根据各业务词语构建业务词图, 并根据业务 词图, 确定业务关键词; 基于业务关键词, 识别用 户描述语句的业务意图。 本实施例通过对用户描 述语句中的长难句进行业务关键词抽取, 得到长 难句中与本领域业务相关的重要信息, 减少了原 长难句中的冗余内容, 通过业务词典来进行分 词, 减少了分词错误, 避免分词错误影响业务关 键词抽取的准确率, 从而提升用户意图识别的准 确率和意图识别效率。 权利要求书2页 说明书8页 附图3页 CN 115062161 A 2022.09.16 CN 115062161 A 1.一种业 务意图识别方法, 其特 征在于, 包括: 获取业务过程中的多个用户描述语句; 对各所述用户描述语句进行词句划分, 得到多个长难句; 采用预设业 务词典对各 所述长难句进行分词处 理, 得到多个业 务词语; 根据各所述业务词语构建业 务词图, 并根据所述 业务词图, 确定业 务关键词; 基于所述 业务关键词, 识别所述用户描述语句的业 务意图。 2.根据权利要求1所述的业务意图识别方法, 其特征在于, 所述采用预设业务词典对各 所述长难句进行分词处 理, 得到多个业 务词语包括: 采用分词算法和预设业 务词典对所述长难句进行分词处 理, 得到多个分词; 对每个所述分词进行词性标注, 得到各 所述分词对应的词性; 基于预定停用词表和所述词性, 剔除所述多个分词中的停用词, 得到多个业 务词语。 3.根据权利要求1所述的业务意图识别方法, 其特征在于, 所述根据各所述业务词语构 建业务词图包括: 根据预设的共线关系计算式, 计算各 所述业务词语在所述长难句中的共线关系; 将各所述业务词语对应作为 一个节点; 根据各所述节点以及对应的共线关系构建多 级共线关系的业 务词图。 4.根据权利要求1所述的业务意图识别方法, 其特征在于, 所述根据所述业务词图, 确 定业务关键词包括: 采用预设RANK计算公式, 计算所述 业务词图中各节点的RANK值; 根据所述RANK值, 从各 所述业务词语中选取多个词语, 得到业 务关键词。 5.根据权利要求4所述的业务意图识别方法, 其特征在于, 所述根据所述RANK值, 从各 所述业务词语中选取多个词语, 得到业 务关键词包括: 将所述业务词图中每个节点按照对应的RANK值由大到小的顺序进行排序, 得到RANK值 排序; 从所述RANK值排序中选取前N个RANK值对应的词语, 得到业务关键词, 其中, N为正整 数。 6.根据权利要求4所述的业务意图识别方法, 其特征在于, 在所述采用预设业务词典对 各所述长难句进行分词处 理, 得到多个词语之前, 还 包括: 在预设的标准问题数据库中提取业 务词汇; 计算所述 业务词汇在所述标准问题数据库中的词频和逆文档频度; 根据各所述业务词汇对应的词频和逆文档频度, 确定各 所述业务词汇的权 重值; 基于所述 业务词汇以及各 所述业务词汇的权 重值, 构建业 务词典。 7.根据权利要求6所述的业 务意图识别方法, 其特 征在于, 所述预设RANK计算公式为: 其中, Rank(Vi)表示节点Vi的RANK值, In(Vi)表示节点Vi的前驱节点集合, Out(Vj)表示 节点Vj的后继节点集合, d为预定阻尼因数; W( Vj)为节点Vj在所述业务词典中的权重值; Rank(Vj)表示节点Vj的RANK值。权 利 要 求 书 1/2 页 2 CN 115062161 A 28.一种业 务意图识别装置, 其特 征在于, 包括: 获取单元, 用于获取业 务过程中的多个用户描述语句; 划分单元, 用于对各 所述用户描述语句进行词句划分, 得到多个长难句; 分词单元, 用于采用预设业 务词典对各 所述长难句进行分词处 理, 得到多个业 务词语; 确定单元, 用于根据 各所述业务词语构建业务词图, 并根据 所述业务词图, 确定业务关 键词; 识别单元, 用于基于所述 业务关键词, 识别所述用户描述语句的业 务意图。 9.一种计算机设备, 其特征在于, 所述计算机设备包括存储器和至少一个处理器, 所述 存储器存储有计算机程序, 所述处理器用于执行所述计算机程序以实施权利要求1 ‑7中任 一项所述的业 务意图识别方法。 10.一种计算机存储介质, 其特征在于, 其存储有计算机程序, 所述计算机程序被执行 时, 实施根据权利要求1 ‑7中任一项所述的业 务意图识别方法。权 利 要 求 书 2/2 页 3 CN 115062161 A 3

.PDF文档 专利 业务意图识别方法、装置、设备和存储介质

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 业务意图识别方法、装置、设备和存储介质 第 1 页 专利 业务意图识别方法、装置、设备和存储介质 第 2 页 专利 业务意图识别方法、装置、设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:20:56上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。