全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210698944.5 (22)申请日 2022.06.20 (71)申请人 平安银行股份有限公司 地址 518000 广东省深圳市罗湖区深南 东 路5047号 (72)发明人 柳阳  (74)专利代理 机构 深圳紫藤知识产权代理有限 公司 44570 专利代理师 魏学昊 (51)Int.Cl. G06V 20/52(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01) G06V 10/764(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06Q 40/02(2012.01) (54)发明名称 一种场景识别方法、 装置、 设备和存 储介质 (57)摘要 本申请实施例公开了一种场景识别方法、 装 置、 设备和存储介质, 应用于场景识别模 型, 所述 场景识别模 型包括第一子模型、 第二子模型和第 三子模型, 方法包括: 获取场景图像, 所述场景图 像包括一段时间内的多张图像帧; 将所述场景图 像输入至训练完成的所述场景识别模 型; 通过所 述第一子模 型输出得到第一图像; 通过所述第二 子模型输 出得到第二图像; 将所述第一图像和第 二图像进行融合, 得到融合特征图; 将所述融合 特征图输入至所述第三子模型, 得到评分类别 图。 通过场景识别模型判断场景图像是否与预设 的场景图像匹配, 从而精确判断场景图像是否为 真实图像 。 权利要求书2页 说明书12页 附图4页 CN 115205778 A 2022.10.18 CN 115205778 A 1.一种场景识别方法, 其特征在于, 应用于场景识别模型, 所述场景识别模型包括第 一 子模型、 第二子模型和第三子模型, 所述方法包括: 获取场景图像, 所述场景图像包括 一段时间内的多张图像帧; 将所述场景图像输入至训练完成的所述场景识别模型; 通过所述第一子模型输出得到第一图像, 其中, 所述第一图像用于突出显示所述场景 图像中的识别目标物; 通过所述第二子模型输出得到第二图像, 其中, 所述第二图像用于表征所述场景图像 中的每个像素对实现预测过程的贡献程度的概率分布, 所述预测过程为由所述场景图像得 到所述第二图像的过程; 将所述第一图像和第二图像进行融合, 得到融合特 征图; 将所述融合特征图输入至所述第 三子模型, 得到评分类别图, 其中, 所述评分类别图具 有评分和类别, 所述评分用于表征所述场景图像与预存场景图的匹配程度, 所述类别用于 表征对于所述场景图像的识别结果。 2.根据权利要求1所述的方法, 其特征在于, 在所述获取场景图像之前, 所述方法还包 括: 训练初始第一子模型和初始第二子模型, 得到训练完成的第一子模型和第二子模型; 利用训练完成的所述第 一子模型、 所述第 二子模型以及所述决策子模型获取训练完成 的所述场景识别模型。 3.根据权利要求2所述的方法, 其特征在于, 训练初始第一子模型和初始第二子模型, 得到训练完成的第一子模型和第二子模型, 包括: 获取训练样本, 其中, 所述训练样本包括至少一个具有评分的第一场景图像, 以及至少 一个具有显著性区域的第二场景图像, 所述第一场景图像对应的原始图像与所述第二场景 图像对应的原始图像相同, 所述第一场景图像的评 分和所述第二场景图像的显著性区域由 所述第三子模型确定; 将所述训练样本输入初始场景识别模型, 获取所述初始第一子模型的第一损 失函数, 以及获取 所述初始第二子模型的第二损失函数; 重复执行以上步骤, 直至所述第一损 失函数和所述第二损 失函数收敛, 得到训练完成 的所述场景识别模型。 4.根据权利要求3所述的方法, 其特征在于, 所述获取所述初始第 一子模型的第 一损失 函数, 以及获取 所述初始第二子模型的第二损失函数, 包括: 将所述第一场景图像输入至初始第二子模型, 获取 所述第一场景图像的预测归因图; 根据所述预测归因图和所述第一场景图像的真实归因图, 获取 所述第二损失函数; 将所述第二场景图像输入至初始第 一子模型, 获取所述第 二场景图像的预测显著性图 像; 根据所述预测显著性图像和所述第 一场景图像的真实显著性图像, 获取所述初始第 一 子模型的第一损失函数。 5.根据权利要求3或4所述的方法, 其特征在于, 所述第二损 失函数包括区域损 失函数 和面积损失函数, 所述区域损失函数用于表征所述贡献程度概率分布所包含像素的位置的 准确程度, 所述面积损失函数用于表征所述贡献程度概率分布所包含像素的面积的准确程权 利 要 求 书 1/2 页 2 CN 115205778 A 2度, 所述获取 所述第二损失函数, 包括: 根据第一预测值结合EM算法, 构建所述区域损失函数; 所述第一预测值为所述初始第 二子模型对已知分类的所述第一场景图像进 行预测, 得到所述第一场景图像所包含像素的 位置的第一 概率分布; 根据第二预测值构建所述面积损失函数, 所述面积损失函数为所述第 一概率分布所包 含的全部概 率的和值; 计算所述 区域损失函数与 所述面积损失函数的加和, 所述加和的值即为所述第 二损失 函数的值。 6.根据权利要求1所述的方法, 其特征在于, 在所述将所述第 一图像和第 二图像进行融 合, 得到融合特 征图之前, 所述方法还 包括: 计算第一权 重和第二权 重; 所述将所述第一图像和第二图像进行融合, 得到融合特 征图, 包括: 根据所述第一权重和所述第二权重, 对所述第一图像和所述第二图像进行融合, 得到 融合特征图。 7.根据权利要求6所述的方法, 其特 征在于, 所述计算第一权 重和第二权 重, 包括: 获取预设参数和第 三场景图像的评分; 所述第 三场景图像为所述场景图像中的任意一 张图像帧; 获取所述预设参数与 所述第三场景图像的评分乘积的极小值, 将所述极小值作为融合 所述第一图像的第一权 重; 获取预设值与所述第一权 重的差值, 将所述差值作为融合所述第二图像的第二权 重。 8.一种场景识别装置, 其特 征在于, 包括: 场景图像获取 单元, 用于获取场景图像, 所述场景图像包括 一段时间内的多张图像帧; 输入单元, 用于将所述场景图像输入至训练完成的所述场景识别模型; 第一子模型单元, 用于通过所述第 一子模型输出得到第 一图像, 其中, 所述第 一图像用 于突出显示所述场景图像中的识别目标物; 第二子模型单元, 用于通过所述第 二子模型输出得到第 二图像, 其中, 所述第 二图像用 于表征所述场景图像中的每个像素对实现预测过程的贡献程度的概率分布, 所述预测过程 为由所述场景图像得到所述第二图像的过程; 融合单元, 用于将所述第一图像和第二图像进行融合, 得到融合特 征图; 第三子模型单元, 用于将所述融合特征图输入至所述第 三子模型, 得到评分类别图, 其 中所述评分类别图具有评分和类别, 所述评分用于表征所述场景图像与预存场景图的匹配 程度, 所述类别用于表征对于所述场景图像的识别结果。 9.一种设备, 其特征在于, 包括处理器和存储器, 所述存储器存储有多条指令; 所述处 理器从所述存储器中加载指 令, 以执行如权利要求1至7任一项 所述的一种场景识别方法中 的步骤。 10.一种存储介质, 其特征在于, 所述存储介质存储有多条指令, 所述指令适于处理器 进行加载, 以执 行权利要求1至7任一项所述的一种场景识别方法中的步骤。权 利 要 求 书 2/2 页 3 CN 115205778 A 3

.PDF文档 专利 一种场景识别方法、装置、设备和存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种场景识别方法、装置、设备和存储介质 第 1 页 专利 一种场景识别方法、装置、设备和存储介质 第 2 页 专利 一种场景识别方法、装置、设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:17:48上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。