iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211018912.2 (22)申请日 2022.08.24 (66)本国优先权数据 202210666534.2 202 2.06.13 CN (71)申请人 哈尔滨工业大 学 地址 150001 黑龙江省哈尔滨市南岗区西 大直街92号 (72)发明人 赵英 郭亮 关明 刘冬梅  (74)专利代理 机构 哈尔滨奥博专利代理事务所 (普通合伙) 23220 专利代理师 叶以方 (51)Int.Cl. G06Q 10/04(2012.01) G06N 20/00(2019.01) G06K 9/62(2022.01) (54)发明名称 一种基于个人用户画像的产废量预测方法 (57)摘要 一种基于个人用户画像的产废量预测方法, 它涉及一种产废量预测方法。 本发 明为了解决目 前对个体用户产废量分析缺乏对个体特征和生 活垃圾产量之间定量分析的问题。 本发明的步骤 为: 步骤一、 收集用户原始数据; 步骤二、 对步骤 一中收集的用户原始数据进行分析和研究, 并论 证其可靠性; 步骤三、 数据预处理; 步骤四、 用户 个人特征与产废量相关性分析; 步骤五、 决策树 模型输入特征的筛选; 步骤六、 建立个人产废量 用户画像决策树模型; 步骤七、 基于个人用户画 像的生活垃圾产量预测。 本发明属于环境保护领 域。 权利要求书1页 说明书4页 附图1页 CN 115186933 A 2022.10.14 CN 115186933 A 1.一种基于个人用户画像的产废量预测方法, 其特征在于: 所述一种基于个人用户画 像的产废量预测方法的具体步骤如下: 步骤一、 收集用户原 始数据; 步骤二、 对步骤一中收集的用户原 始数据进行分析和研究, 并论证其可靠性; 步骤三、 数据预处 理; 步骤四、 用户个人 特征与产废量相关性分析; 步骤五、 决策树模型输入特 征的筛选; 步骤六、 建立个人产废量用户画像决策树模型; 步骤七、 基于个人用户画像的生活垃圾产量预测。 2.根据权利要求1所述的一种基于个人用户画像的产废量预测方法, 其特征在于: 步骤 一中用户原始数据包括年龄、 性别、 兴趣爱好、 性格特征、 收入以及用户产生的餐厨垃圾和 其他垃圾量。 3.根据权利要求1所述的一种基于个人用户画像的产废量预测方法, 其特征在于: 步骤 二中对调研人 的基本信息如分布地区、 性别比例和年龄占比情况分别进行统计分析, 以了 解信息的分布规律情况, 并证明所收集的数据是随机抽样的结果, 样本数据可以被认为是 整体的代 表。 4.根据权利要求1所述的一种基于个人用户画像的产废量预测方法, 其特征在于: 步骤 三对获取到的数据进 行预处理, 包括数据的清洗、 异常值的去除、 数据离散化、 语义转换、 编 码处理等。 5.根据权利要求1所述的一种基于个人用户画像的产废量预测方法, 其特征在于: 步骤 四中挖掘对生活垃圾产废量影响较大的特征, 对特征之 间与特征及垃圾产量之 间进行相关 性分析, 挖掘 相关关系较高的参数, 从而为下一 步建模中选用的最优特 征提供参 考。 6.根据权利要求1所述的一种基于个人用户画像的产废量预测方法, 其特征在于: 步骤 五中采用机器学习的方法进一步确定最优特征, 将相关系分析方法的结果和机器学习的结 果联合确定决策树最优输入 特征, 最终确定最优 特征为7个: 用户的年龄、 受教育程度、 年收 入、 家庭成员数、 兴趣爱好、 每周健身次数、 性格特 征。 7.根据权利要求1所述的一种基于个人用户画像的产废量预测方法, 其特征在于: 步骤 六中采用机器学习决策树模型实现餐厨垃圾及其他垃圾这两类生活垃圾产量用户画像的 构建, 生活垃圾总量 为餐厨垃圾及其 他垃圾的总和; 模型的建立分为二个步骤: 模型的训练和模型的验证: 通过模型输入特征和输出垃圾 产量的训练, 得到决策树模型结构; 并验证该模型的准确 率, 若准确率达标, 个人产废用户 画像决策树模型建立完成。 8.根据权利要求1所述的一种基于个人用户画像的产废量预测方法, 其特征在于: 步骤 七中在研究区域内收集新的数据, 利用已建立的决策树模型预测个人及对应区域产生垃圾 的量, 包括厨余垃圾、 其 他垃圾和总垃圾, 对预测结果进行综合评价和分析。权 利 要 求 书 1/1 页 2 CN 115186933 A 2一种基于个人用户画像的产废量预测方 法 技术领域 [0001]本发明涉及一种产废量预测方法, 属于环境保护领域。 背景技术 [0002]随着大数据技术在各个领域的不断应用, 数据服务行业日渐兴起, “数据服务指 提 供数据采集、 数据传输、 数据存储、 数据处理(包括计算、 分析、 可视化等)、 数据交换、 数据销 毁等数据各种生存形态演变的一种信息技术驱动的服务。 数据服务应用的关键在于通过获 取用户数据建立相应的数据分析模型, 分析不同顾客的行为偏好并据此制定不同的管理策 略。 为了更好地呈现出不同用户的偏好, 在刻画用户行为偏好的过程中, 用到了一种主流模 型——用户画像。 [0003]机器学习是大数据技术的重要应用工具, 它用计算机和算法从 “数据”中学习并发 现“模式和洞察 ”, 因为在许多情况下, “模式和洞察 ”就隐藏在“数据”之中。 随着时代发展, 从业务流程中积累的数据对人类来说理解起来可能非常复杂, 然而算法却能够比人更快、 更准确地从数据中挖掘出 “模式和洞察 ”。 [0004]为了更好的实现垃圾的收集、 运输和处理, 垃圾产量和种类的预测十分必要, 目前 国外学者研究方向较多在社会因素对垃圾产量的影响, 通过对垃圾回收利用 、 生命周期评 价的研究, 致力于搭建循环经济体系; 国内学者的研究多集中在 对内在因素和个体因素上, 各学者对内在因素 的分析主要运用模型和算法建立产废量与城市人 口、 城市规模、 经济发 展之间的联系, 继而对垃圾产生量进 行预测; 对个体因素的研究主要集中在家庭人口分布、 受教育程度、 职业、 收入对垃圾产量和组分的影响, 大多为定性研究, 缺少对个体特征和生 活垃圾产生 量之间的定量分析。 [0005]人物特征与其产生垃圾的种类和数量应具有一定的联系, 为了深入探讨他们之间 的关系, 本方法引入 人物画像概念, 通过对 人物特征信息(年龄、 性别、 性格特征、 收入、 产废 量)的问卷调研, 基于python分析工具分析其关联性, 运用机器学习中的决策树分类算法, 以产废量为基础 对不同群体进 行聚类, 形成不同产废量下的人物画像图谱。 并以此为基础, 预测某地区不同类别(餐厨垃圾和其它垃圾)的垃圾产生量, 为地区垃圾总量的精准预测提 供更多的数据、 方法和模型。 发明内容 [0006]本发明为解决目前对个体用户产废量分析缺乏对个体特征和生活垃圾产量之间 定量分析的问题, 进 而提出一种基于个人用户画像的产废量预测方法。 [0007]本发明为 解决上述问题采取的技 术方案是: 本发明的具体步骤为: [0008]步骤一、 收集用户原 始数据; [0009]步骤二、 对步骤一中收集的用户原 始数据进行分析和研究, 并论证其可靠性; [0010]步骤三、 数据预处 理; [0011]步骤四、 用户个人 特征与产废量相关性分析;说 明 书 1/4 页 3 CN 115186933 A 3

.PDF文档 专利 一种基于个人用户画像的产废量预测方法

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于个人用户画像的产废量预测方法 第 1 页 专利 一种基于个人用户画像的产废量预测方法 第 2 页 专利 一种基于个人用户画像的产废量预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:00:13上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。