全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210744584.8 (22)申请日 2022.06.27 (71)申请人 长沙理工大 学 地址 410000 湖南省长 沙市天心区赤岭路 45号 (72)发明人 张在美 吕娟 刘彦  (74)专利代理 机构 长沙知行亦创知识产权代理 事务所(普通 合伙) 43240 专利代理师 皮尚慧 (51)Int.Cl. G06Q 40/02(2012.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于生成对抗网络的信用评分分类方法、 装 置及存储介质 (57)摘要 本发明提供了一种基于生成对抗网络的信 用评分分类方法、 装置及存储介质, 其中该分类 方法基于生成对抗网络的方法与决策边界概念 相结合, 使用生成对抗网络来生成边界类数据, 通过对少数类样本进行学习并生成符合少数类 数据分布的合成样本, 对少数类样 本进行数据扩 充。 本发明不仅可 以解决数据的不平衡问题, 并 同时考虑具有数值型和类别型的特征类型, 能够 同时处理稀疏的类别型数据和密集的数值型数 据, 而且还能够在线更新。 权利要求书2页 说明书5页 附图2页 CN 114971885 A 2022.08.30 CN 114971885 A 1.一种基于生成对抗网络的信用评分 分类方法, 其特 征在于, 包括 步骤: S1, 获取数据样本中的距离决策边界预设距离内的边界少数类数据; S2, 将所述所述数据样本中的数据数据分割为类别型特征和数值型特征, 使用生成对 抗网络架构对带有所述数值型特征和所述类别型特征的表格数据进行建模, 获得分类模 型, 所述分类模型由CatN N模型和GBDT2N N模型两个神经网络组件线性组合而成; S3, 通过训练生成对抗网络来估计数据的分布, 并生成少数类数, 以对边界少数类数据 进行过采样和获得一个平衡的数据集, 并使用所述数据集来训练所述分类模型, 以获得修 正后的所述分类模型; 其中, 所述平衡后的数据集中的数据分割为所述类别型特征和所述 数值型特征, 所述类别型 特征放入CatN N进行训练, 所述数值型 特征放入GBDT2N N进行训练; S4, 对修正后的所述分类模型进行测试和验证通过后, 通过所述CatNN模型和GBDT2NN 模型分别输出一个分类结果TARGET, 再根据对应的权 重计算最终的分类结果。 2.根据权利要求1所述的基于生成对抗网络的信用评分分类方法, 其特征在于, 所述步 骤S1包括: S11, 从所有的所述数据样本中使用KN N算法提取k个最近的数据样本f(ai); S12, 在f(ai)中计算属于多数类的数据样本的数量, 在 所述数量大于或等于k/2且小于 k, 判断数据ai为边界少数类数据; 若否, 则判断所述数据ai为远离决策边界或完全被多数 类数据包围的数据。 3.根据权利要求1所述的基于生成对抗网络的信用评分分类方法, 其特征在于, 所述步 骤S2包括: S21, 生成对抗网络训练条件生成器和判别器; S22, 在生成模型训练过程中, 将所述所述数据样本中的数据数据分割为类别型特征和 数值型特征, 对所述类别型特征进行单热编码并使用Gumbel ‑softmax激活函数来建模, 将 所述数值型特征归一化并使用tanh激活, 并将tanh激活和Gumbel ‑Softmax激活都放在条件 生成器网络的输出 上, 以生成混合类型的表格数据; S23, 通过 所述数据样本进行训练获得 所述分类模型。 4.根据权利要求1所述的基于生成对抗网络的信用评分分类方法, 其特征在于, 所述步 骤S21包括: 先将随机选择的噪声z和来自高斯分布的类条件y连接起来, 然后提供给生成 器, 生成器根据输入(z,y)生 成假数据Xg; 判别器根据y区分Xg和Xo根据目标函数, 生 成器和 判别器依次更新 参数, 以获得 所述对抗网络训练条件生成器和判别器。 5.根据权利要求4所述的基于生成对抗网络的信用评分分类方法, 其特征在于, 所述步 骤S3中的通过训练生成对抗网络来估计数据的分布, 并生成少数类数, 以对边界少数类数 据进行过采样和获得一个平衡的数据集的步骤, 包括: 从高斯分布中随机选取一个噪声z, 将类条件y设为边界少数类, 将变量z和y连接起来, 然后输入到所述生成器中, 当生成的数 据数量达到每个类中数据数量的差异,生成的数据与少数类数据合并, 从而获得所述平衡 的数据集。 6.一种计算机装置, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器 上运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求 1至 5任一项所述的基于生成对抗网络的信用评分 分类方法的步骤。 7.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在权 利 要 求 书 1/2 页 2 CN 114971885 A 2于, 所述计算机程序被处理器执行时实现如权利要求 1至5任一项 所述的基于生成对抗网络 的信用评分 分类方法的步骤。权 利 要 求 书 2/2 页 3 CN 114971885 A 3

.PDF文档 专利 基于生成对抗网络的信用评分分类方法、装置及存储介质

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于生成对抗网络的信用评分分类方法、装置及存储介质 第 1 页 专利 基于生成对抗网络的信用评分分类方法、装置及存储介质 第 2 页 专利 基于生成对抗网络的信用评分分类方法、装置及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:22:54上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。