全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210777241.1 (22)申请日 2022.06.30 (71)申请人 武汉众邦银行股份有限公司 地址 432200 湖北省武汉市黄陂区盘龙城 经济开发区汉口北大道88号汉口北国 际商品交易中心D2区1-2层、 2 2-23层 (72)发明人 陈如校 李耀 田羽 兰翔  李诗宇 熊子依  (74)专利代理 机构 成都正煜知识产权代理事务 所(普通合伙) 51312 专利代理师 徐金琼 (51)Int.Cl. G06Q 40/02(2012.01) G06F 16/22(2019.01) G06F 16/242(2019.01) (54)发明名称 一种基于人行数据的客户收入评估方法、 装 置及存储介质 (57)摘要 本发明涉及信息技术领域, 提供了一种基于 人行数据的客户收入评级方法、 装置及存储介 质。 目的在于推导用户的工资收入。 利用公积金 参缴金额AM、 参缴地址及 距今最近一次的参缴日 期YM, 计算不同参缴地址、 不同参缴日期YM的所 有客户的平均工资, 并计算后一年相对前一年的 工资上涨幅度fYM。 若参缴日期YM为当前年份, 直 接推出当前工资, 若参缴日期非当前年份, 则依 据工资上涨幅度fYM间接推算出当前的工资水 平。 对于未匹配中公积金参缴信息的客户, 以行 内存在代发工资的作为样本, 代发工资作为样本 客户的目标变量Y, 同时对人行征信及用户申请 信息加工衍生变量X, 建立衍生变量X与目标变量 Y之间相关关系, 预测不存在公积金参缴信息客 户的工资收入。 权利要求书2页 说明书4页 附图1页 CN 115170278 A 2022.10.11 CN 115170278 A 1.一种基于人 行数据的客户收入评估方法, 其特 征在于, 包括以下步骤: 步骤1、 获取所有进件用户的申请贷款信 息及人行征信报告信 息, 并对所有用户是否存 在用户公积金记录进行 标记, 若存在标记为1, 若不存在公积金记录, 则标记为0; 步骤2、 针对步骤1中存在公积金记录的用户, 获取用户人行报告中距今最近的一次公 积金的参缴日期YM, 并以参缴日期YM为基础往前推一年, 计算出近一年的平均 公积金的参 缴额度, 记为(Y M, AM), 其中Y M表示参缴日期, AM表示 参缴金额; 步骤3、 针对步骤2获取的参缴日期YM和参缴金额AM, 依据参缴日期YM对应的公积金参 缴逻辑, 推导用户参缴日期YM的工资水平, 记为(YM, amount), amount表示参缴日期YM的工 资收入; 步骤4、 依据 步骤3计算得出的用户参缴日期YM、 工资收入amount及步骤1中征信报告参 缴日期YM的参缴地记录, 计算每一个参缴地所有用户后一年工 资金额平均值相对于前一年 工资金额平均值的比值, 作为对应参缴地社会平均工资金额的年均上涨幅度f; 步骤5、 针对步骤3中所有的用户, 若参缴日期YM为当前年份, 则直接代表了用户当前的 工资收入; 若参缴日期 YM非当前年份, 则依据步骤4中计算出的平均工资金额上涨幅度f, 计 算出参缴日期YM为非当前年份的用户税前工资额度折现为当前年份的税前工资额度, 即 获得用户较为 准确的当前税前工资额度; 步骤6、 针对步骤5中计算出的当前用户税前工资、 依据当前税收逻辑转化为对应的用 户当前税后工资额度; 步骤7、 针对步骤1中未匹配 中任何公积金信息的用户、 即步骤1标记为0的用户, 进一步 匹配存在行内代发工资行为的用户作为收入预测模型的建模样本, 以此代发工 资作为样本 用户的实际税后工资收入; 步骤8、 针对步骤7中存在代发工资行为的样本用户, 匹配用户申请数据及步骤1中的人 行征信数据, 并对所有 数据进行数据清洗、 特征衍生、 缺 失值填充、 特征编码处理, 形成可供 入模使用的特征, 以步骤7中的实际税后工资收入为Y值, 衍生标准化的用户申请数据及人 行征信数据为X值, 建立起衍生变量X与实际税后工 资收入Y值之间的线性回归模 型, 即收入 预测模型, 并以此模型在线预测未匹配中任何公积金信息的用户的工资收入。 2.根据权利要求1所述的一种基于人行数据的客户收入评估方法, 其特征在于, 对于步 骤4中参缴地, 在各参缴地的银行客户数据量满足评估结果稳定的条件下, 参缴地的最小 单 位包括县级、 市级、 省级以及地区级, 地区单位越小, 针对特定用户的工资收入预测效果越 准确; 对于步骤8中匹配的数据, 还匹配外部多头数据、 消费数据及交易数据, 增加收入预测 模型的预测精度。 3.一种基于人 行数据的客户收入评估 装置, 其特 征在于, 包括: 样本获取模块, 该模块获取全量申请进件用户的申请数据、 人行征信数据及行内代发 工资数据, 作为用户后续工资收入计算的分析基础数据; 样本处理模块, 对获取的全量进件用户的人行征信数据按照有无公积金参缴信息, 用 公积金参缴信息的用户标记为 1, 无公积金参缴信息的用户标记为0。 同时针对标记为0且匹 配中行内代发工 资的用户, 对该部 分用户获取的申请数据及人行征信数据, 进 行数据清洗、 特征衍生、 缺失值 填充、 特征编码处 理, 形成可 供建模使用的特 征特征。权 利 要 求 书 1/2 页 2 CN 115170278 A 2工资推断模块, 对于存在公积金参缴记录的用户, 获取距今最近的一次公积金参缴日 期YM, 并以参缴日期 YM为基础 往前推一年, 计算出近一年的平均公积金参缴额度, 记为(YM, AM), 若参缴 日期YM为当前年份, 则直接依据当前公积金参缴逻辑计算出月平均收入; 若参 缴日期YM非当前年份, 则通过用户对应的参缴年份、 参缴金额及相应的参缴地信息, 计算每 一个参缴地所有用户后一年工 资金额平均值相对于前一年工资金额平均值的比值, 作为对 应参缴地社会平均工资金额的年平均上涨幅度f, 依据计算出的年平均工资金额上涨幅度 f, 计算出参缴日期 YM为非当前年份的用户税 前工资额度折现为当前年份的税前工 资额度, 即 获得用户较为准确的现有税前工资额度, 最后依据现有税 收逻辑转化为对应的用户税后工 资收入, 对于无公积金参缴记录的用户, 以标记为0且匹配 中行内代发工资的用户为样本, 代发工资为 目标变量, 申请数据及人行征信数据衍生变量 为建模特征, 建立起代发工 资收入与衍生变量之间的关联线性回归模 型, 即收入 预测模型, 通过该模型在线预测未匹配中任何公积金参缴记录的用户工资收入。 4.一种存储介质, 其特征在于, 所述存储介质存储有一种基于人行数据的客户收入评 级的程序, 处理器执行所述程序时实现如权利要求1 ‑2任一所述的一种基于人行数据的客 户收入评级方法。权 利 要 求 书 2/2 页 3 CN 115170278 A 3

.PDF文档 专利 一种基于人行数据的客户收入评估方法、装置及存储介质

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于人行数据的客户收入评估方法、装置及存储介质 第 1 页 专利 一种基于人行数据的客户收入评估方法、装置及存储介质 第 2 页 专利 一种基于人行数据的客户收入评估方法、装置及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:17:52上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。