全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221091525 6.X (22)申请日 2022.08.01 (71)申请人 昆明理工大 学 地址 650050 云南省昆明市呈贡区景明南 路727号 (72)发明人 沈俊鑫 沈冰亮 冯井荣 吕佳历  (74)专利代理 机构 湖北权上知识产权代理事务 所(特殊普通 合伙) 42287 专利代理师 范瑞鹏 (51)Int.Cl. G06F 16/2458(2019.01) G06K 9/62(2022.01) G06N 5/00(2006.01) G06Q 30/02(2012.01) G06Q 40/04(2012.01) (54)发明名称 一种基于informer预测的数据资源定价方 法 (57)摘要 本发明提供一种基于informer预测的数据 资源定价方法, 以机器学习实现数据本身因素和 市场因素的双向考虑, 有效提高数据资源交易效 率, 使数据资源交易过程更加透明和规范性。 方 法中的数据稀缺性评分、 数据挖掘系数、 数据时 效性评分、 数据销量指标, 用市场机制因素作为 市场定价依据, 有效盘活数据资源并形成闭环的 价值链条, 最终正式进入会计报表, 通过数据资 源市场机制和数据资源价值机制实现双平衡。 本 发明方法定义了记录结构熵及其计算方法, 以及 模型采用记录结构熵指标度量数据资源自身的 真实“信息含金量 ”。 因此, 本发明方法有效解决 数据资源交易中数据资源的 “含金密度 ”难题, 本 发明方法还创造性地重新给出数据稀缺性评分 计算方法。 权利要求书2页 说明书5页 附图1页 CN 115455071 A 2022.12.09 CN 115455071 A 1.一种基于i nformer(改为中文)预测的数据资源定价方法, 其特 征在于, 包括 步骤: S1)输入数据资源交易记录; S2)用分类器将记录按 交通地理、 精准营销、 舆情监测、 企业管理、 科研技术、 产业经济、 金融征信、 健康医疗、 生活服 务、 行业监测报告分类; S3)以数据稀缺性评分、 数据挖掘系数、 数据时效性评分、 数据销量、 记录结构熵、 数据 更新时间、 数据量大小、 数据行业类型和商品价格9个维度进行嵌入编码, 生成训练集T; S4)用训练集T训练基于i nformer预测模型M; S5)将训练集T的商品价格维度置 0进行遮盖处 理, 生成测试集D; S6)用测试集D输入到预测模型M进行 预测, 生成预测集P; S7)用损失函数统计预测误差 MSE, 若MSE>0.15, 继续迭代, 返回步骤S4); S8)输入数据稀缺性评分、 数据挖掘系数、 数据 时效性评分、 数据销量、 记录结构熵、 数 据更新时间、 数据量大小、 数据行业类型8个维度的被预测的数据集K; S9)用模型M预测数据集K, 输出新预测集S, S就是被预测数据集K的预测价格集。 2.根据权利 要求1所述的一种基于informer预测的数据资源定价方法, 其特征在于, 步 骤S1)所述的数据资源交易记录含有1万条以上。 3.根据权利 要求1所述的一种基于informer预测的数据资源定价方法, 其特征在于, 步 骤S2)所述的分类 器采用决策树 算法。 4.根据权利 要求1所述的一种基于informer预测的数据资源定价方法, 其特征在于, 步 骤S3)所述的数据稀缺性评分Lv1由数据交易平台卖方数量Rs和买方数量Rb根据 得出。 5.根据权利 要求1所述的一种基于informer预测的数据资源定价方法, 其特征在于, 步 骤S3)所述的数据 挖掘系数Dig∈(0, 1)由数据交易平台专 家组评估给 出。 6.根据权利 要求1所述的一种基于informer预测的数据资源定价方法, 其特征在于, 步 骤S3)所述的数据时效性评分Lvt∈(0, 1)由数据交易平台专家组根据 数据所搭载信 息的生 命周期打 分。 7.根据权利 要求1所述的一种基于informer预测的数据资源定价方法, 其特征在于, 步 骤S3)所述的记录结构熵HS=‑∑G∈Sp(G)log p(G)相对于图结构熵, 其中: p(G)是记录G的概 率; S是一个同构集 合的集合, 字节空间Ω, S∈Ω。 8.根据权利 要求1所述的一种基于informer预测的数据资源定价方法, 其特征在于, 步 骤S3)所述的嵌入编码, 步骤为: 将输入数据序列用Sconv1D(width=3, stride=1)函数进 行一维卷积输出α U; 用 计算序列生成PE, 其中pos为输入序列值, i为输入序列的序号, dmodel为模型运算时的维 度; 将输入数据序列的数据更新时间维度格式化为yyyy ‑mm‑dd, HH: MM: SS格式的时间戳向权 利 要 求 书 1/2 页 2 CN 115455071 A 2量SE; 计算输出序列xt=α U+PE+SE 。 9.根据权利 要求1所述的一种基于informer预测的数据资源定价方法, 其特征在于, 步 骤S4)所述的基于informer预测模型M采用ProbSparse  Self‑Attention机制的soft  max函 数, 其计算公式为: 其中 是大小与q相同的稀疏矩阵的度量M (q, K)下的Top ‑u个q, V是预测模型M训练生 成的键值向量, K是预测模 型M训练生成的键, d是 K的维度, Top ‑u为稀疏性得分最高的5个q。 10.根据权利要求1所述的一种基于informer预测的数据资源定价方法, 其特征在于, 步骤S4)所述的基于i nformer预测模型M的Encoder采用两层堆叠的模式。 11.根据权利要求1所述的一种基于informer预测的数据资源定价方法, 其特征在于, 步骤S4)所述的基于i nformer预测模型M的Decoder采用两层堆叠的模式。 12.根据权利要求1所述的一种基于informer预测的数据资源定价方法, 其特征在于, S7)所述的损失函数公式为: 其中wi为第i个权值, yi为第i个真实 值, 为第i个预测值。权 利 要 求 书 2/2 页 3 CN 115455071 A 3

.PDF文档 专利 一种基于informer预测的数据资源定价方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于informer预测的数据资源定价方法 第 1 页 专利 一种基于informer预测的数据资源定价方法 第 2 页 专利 一种基于informer预测的数据资源定价方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:26:58上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。