全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210976509.4 (22)申请日 2022.08.15 (71)申请人 宁波工程学院 地址 315020 浙江省宁波市江北区风 华路 201号 (72)发明人 张敏捷 周继彪 董升 张振亚  (74)专利代理 机构 北京睿智保诚专利代理事务 所(普通合伙) 11732 专利代理师 杜娟 (51)Int.Cl. G06Q 30/02(2012.01) G06Q 30/06(2012.01) G06N 20/00(2019.01) G06K 9/62(2022.01) G06F 17/18(2006.01) (54)发明名称 一种城市公共自行车站点租还需求量预测 方法及系统 (57)摘要 本发明公开了一种城市公共自行车站点租 还需求量预测方法及系统, 涉及智能交通和数据 挖掘技术领域, 首先采集区域内公共自行车站点 的历史租/还数据以及外部特征集; 以站点为单 位, 根据预设时间步长对历史租/还数据进行预 设时间段内的时间序列重采样, 并与外部特征集 组合, 得到组合数据集; 从组合数据集中划分出 训练集、 测试集和任务集, 基于KNN算法, 使用训 练集和测试集对LightGBM预测模型进行训练和 测试, 得到最终LightGBM预测模型; 将组合数据 集中待预测站点的任务集输入最终LightGBM预 测模型, 得到预测结果。 本发明解决了城市公共 自行车租还需求预测这一问题, 具有可操作性 强、 准确度高、 高效、 适用范围广的优点。 权利要求书2页 说明书7页 附图5页 CN 115311015 A 2022.11.08 CN 115311015 A 1.一种基于KNN ‑LightGBM组合算法的城市公共自行车站点租还需求量预测方法, 其特 征在于, 包括以下步骤: 步骤1、 采集区域内公共自行 车站点的历史租/还数据以及外 部特征集; 步骤2、 以站点为单位, 根据预设时间步长对历史租/还数据进行预设时间段内的时间 序列重采样, 并与外 部特征集组合, 得到组合数据集; 步骤3、 从所述组合数据集中划分出训练集、 测试集和任务集, 基于KNN算法, 使用训练 集和测试集对L ightGBM预测模型进行训练和 测试, 得到最终L ightGBM预测模型; 步骤4、 将组合数据 集中待预测站点的任务集数据输入最终Li ghtGBM预测模型, 得到预 测结果。 2.根据权利要求1所述的一种基于KNN ‑LightGBM组合算法的城市公共自行车站点租还 需求量预测方法, 其特征在于, 所述步骤3中, 基于KNN算法, 使用训练集和测试集对 LightGBM预测模型进行训练和 测试, 得到最终L ightGBM预测模型的具体方法为: 步骤3.1、 基于训练集数据, 构建每 个站点的历史租/还量平均向量矩阵; 步骤3.2、 使用回归模型计算待预测站点和其他每个站点的历史租/还量平均向量间余 弦相似度, 并按照大小 进行排序, 得到相似度集 合D; 步骤3.3、 设置KN N搜索近邻初始数量 为k=1; 步骤3.4、 从相似度集合D中按照数值从大到小确定前k个站点, 取所述前k个站点的时 间序列, 结合待预测站点的时间序列和外 部特征集, 组合得到 输入向量Xinput; 步骤3.5、 将输入向量Xinput输入LightGBM预测模型中; 步骤3.6、 采用最速下降法对Li ghtGBM预测模型进行参数调整至最优, 基于预测结果和 实际租/还量, 得到预测准确度; 步骤3.7、 令k =k+1, 返回步骤3.4, 当满足停止条件时, 即停止循环过程, 进入步骤3.8; 步骤3.8、 将测试集输入该训练的Li ghtGBM预测模型进行数据预测, 并对预测准确度进 行测试判定, 若未通过测试判定, 则返回步骤3.3; 若通过测试判定, 则对比k轮循环所得到 的预测准确度, 取最大值对应k值下LightGBM预测模型的参数集方案, 确定最终LightGBM预 测模型。 3.根据权利要求2所述的一种基于KNN ‑LightGBM组合算法的城市公共自行车站点租还 需求量预测方法, 其特征在于, 所述步骤3.2中, 回归模型为最优回归模型, 所述最优回归模 型的选取 方法为: 步骤a、 使用传统OLS回归模型分别对空间滞后模型SLM和空间误差模型SEM进行测试, 若输出结果中空间滞后模型SLM的拉格朗日乘数统计量LM ‑lag和空间误差模型SEM的拉格 朗日乘数统计量LM ‑Error均低于预设阈值, 则放弃空间计量模 型, 使用OLS回归模 型作为最 优回归模型; 步骤b、 若空间滞后模型SLM 的拉格朗日乘数统计量LM ‑lag和空间误差模型SEM 的拉格 朗日乘数统计量LM ‑Error中存在单项高于预设阈值, 即当空间滞后模型SLM的拉格朗日乘 数统计量LM ‑lag高于预设阈值时, 选择 空间滞后模 型SLM作为最优回归模 型, 当空间误差模 型SEM的拉格朗日乘数统计量LM ‑Error高于预设阈值时, 选择 空间误差模 型SEM作为最优回 归模型; 步骤c、 若空间滞后模型SLM 的拉格朗日乘数统计量LM ‑lag和空间误差模型SEM 的拉格权 利 要 求 书 1/2 页 2 CN 115311015 A 2朗日乘数统计量LM ‑Error均高于预设阈值, 则对比空间滞后模型SLM的稳健值和空间误差 模型SEM的稳健值, 选择两个稳健值中最大稳健值对应的回归模型作为最优回归模 型, 若两 个稳健值相同, 则取 空间滞后模 型SLM的拉格朗日乘数统计量LM ‑lag和空间误差模 型SEM的 拉格朗日乘数统计量 LM‑Error中较大 数值所对应的回归 模型作为 最优回归 模型。 4.根据权利要求3所述的一种基于KNN ‑LightGBM组合算法的城市公共自行车站点租还 需求量预测方法, 其特征在于, 所述空间滞后模型SLM和空间误差模型SEM均属于空间回归 模型, 空间回归 模型的表达式为: Y=β X+lnα +λWu+ρ WYY+ ε; 其中, Y代表n ×1维因变量向量, ε代表n ×1维残差向量, 其中残差向量ε服从多变量正 态分布N(0, σ2IN), 均值E( ε )为0, 方差σ2为有限值, IN为n维单位矩阵; X为n ×k解释变量向 量, k为解释变量个数; β 为k ×1维待估参数向量, Wu和Wy均为n×n的非随机空间权重矩阵, λ 表示残差空间相关系数, ρ 表示因变量空间自相关系数, ln表示n阶单位向量, α 表示n维回归 向量的截距系数。 5.根据权利要求2所述的一种基于KNN ‑LightGBM组合算法的城市公共自行车站点租还 需求量预测方法, 其特 征在于, 所述预测准确度的度量指标选取拟合优度R2。 6.根据权利要求2所述的一种基于KNN ‑LightGBM组合算法的城市公共自行车站点租还 需求量预测方法, 其特征在于, 所述步骤3.7中, 停止条件为: k值大于20或第k个站点与待 预 测站点的历史租/还量均值向量间余弦相似度小于 0.5。 7.根据权利要求1所述的一种基于KNN ‑LightGBM组合算法的城市公共自行车站点租还 需求量预测方法, 其特征在于, 所述步骤1 中, 通过市民IC卡的信息统计, 提取得到区域内公 共自行车站点的历史租/还数据。 8.根据权利要求1所述的一种基于KNN ‑LightGBM组合算法的城市公共自行车站点租还 需求量预测方法, 其特 征在于, 所述外 部特征集包括天气、 时间及空间变量。 9.一种基于KNN ‑LightGBM组合算法的城市公共自行车站点租还需求量预测系统, 其特 征在于, 包括: 数据采集模块, 用于采集区域内公共自行 车站点的历史租/还数据以及外 部特征集; 时间序列重采样模块, 用于以站点为单位, 根据 预设时间步长对历史租/还数据进行预 设时间段内的时间序列重采样, 并与外 部特征集组合, 得到组合数据集; 预测模型训练模块, 用于从所述组合数据集中划分出训练集、 测试集和任务集, 基于 KNN算法, 使用训练集和测试集对LightGBM预测模型进行训练和测试, 得到最终LightGBM预 测模型; 预测模块, 用于将组合数据集中待预测站点的任务集数据输入最终LightGBM预测模 型, 得到预测结果。权 利 要 求 书 2/2 页 3 CN 115311015 A 3

.PDF文档 专利 一种城市公共自行车站点租还需求量预测方法及系统

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种城市公共自行车站点租还需求量预测方法及系统 第 1 页 专利 一种城市公共自行车站点租还需求量预测方法及系统 第 2 页 专利 一种城市公共自行车站点租还需求量预测方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:26:50上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。