(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210209986.8
(22)申请日 2022.03.04
(65)同一申请的已公布的文献号
申请公布号 CN 114706864 A
(43)申请公布日 2022.07.05
(73)专利权人 阿波罗智能技 术 (北京) 有限公司
地址 100085 北京市海淀区上地十街10号1
幢1层105
(72)发明人 苟少帅
(74)专利代理 机构 北京鸿德 海业知识产权代理
有限公司 1 1412
专利代理师 谷春静
(51)Int.Cl.
G06F 16/23(2019.01)
G06F 16/242(2019.01)G06F 16/2458(2019.01)
G06F 16/25(2019.01)
G06F 16/27(2019.01)
(56)对比文件
CN 10982 9375 A,2019.0 5.31
CN 10980 0887 A,2019.0 5.24
审查员 庄文龙
(54)发明名称
自动挖掘场景数据的模 型更新方法、 装置及
存储介质
(57)摘要
本公开提供了自动挖掘场景数据的模型更
新方法、 装置及存储介质, 涉及自动驾驶、 深度学
习以及大数据处理等人工智能领域, 其中的方法
可包括: 针对每次获取到的待入库数据, 分别对
其进行特征数据抽取, 并将所述特征数据存入数
据库系统中; 当确定符合预定的触发条件时, 从
数据库系统中获取本次触发对应的特征数据, 并
根据获取到的特征数据进行模型的训练和评估。
应用本公开所述方案, 可节省人力和时间成本,
提升处理效率等。
权利要求书2页 说明书9页 附图3页
CN 114706864 B
2022.11.01
CN 114706864 B
1.一种自动挖掘场景 数据的模型 更新方法, 包括:
针对每次获取到的待入库数据, 分别对其进行特征数据抽取, 包括: 抽取出由简单字段
数据和复杂字段数据组成的特征数据, 将所述特征数据存入第一数据库系统, 所述第一数
据库系统为数据仓库类系统, 并从所述特征数据中提取出全部或符合预定要求的简单字段
数据, 将提取出 的简单字段数据存入第二数据库系统, 所述第二数据库系统为联机分析处
理类系统;
当确定符合预定的触发条件时, 从所述数据库系统中获取本次触发对应的特征数据,
包括: 当到达预定的时间点时, 从所述第一数据库系统中获取全部的复杂字段数据, 作为本
次触发对应的特征数据, 当获取到用户的手动触发请求时, 根据所述第二数据库系统中的
简单字段数据, 从所述第一数据库系统中的复杂字段数据中过滤出符合用户需求的复杂字
段数据, 将过 滤出的复杂字段 数据作为本次触发对应的特 征数据;
根据获取到的特 征数据进行模型的训练和评估。
2.根据权利要求1所述的方法, 其中,
所述根据 所述第二数据库系统中的简单字段数据, 从所述第 一数据库系统中的复杂 字
段数据中过 滤出符合用户需求的复杂字段 数据包括:
通过对所述第 二数据库系统中的简单字段数据进行分析筛选, 生成符合所述用户需求
的数据标识列表;
从所述第一数据库系统中的复杂字段数据中过滤出所述数据标识列表中的数据标识
对应的复杂字段 数据。
3.根据权利要求1~ 2中任一项所述的方法, 其中,
所述进行模型的训练包括: 进行模型的全量训练, 或者, 进行模型的增量训练;
和/或, 所述进行模型的训练包括: 采用集群训练方式进行模型的训练, 或者, 采用单机
训练方式进行模型的训练。
4.根据权利要求1~ 2中任一项所述的方法, 还 包括:
对所述数据库系统中的数据进行 可视化展示;
和/或, 支持对所述数据库系统中的数据进行即席查询。
5.根据权利要求1~ 2中任一项所述的方法, 其中,
所述根据获取到的特征数据进行模型的训练和评估包括: 根据获取到的特征数据进行
模型的训练, 对训练得到的模型进行指标评估。
6.一种自动挖掘场景 数据的模型 更新装置, 包括: 数据处 理模块以及模型 更新模块;
所述数据处理模块, 用于针对每次获取到的待入库 数据, 分别对其进行特征数据抽取,
包括: 抽取出 由简单字段数据和复杂字段数据组成的特征数据, 将所述特征数据存入第一
数据库系统, 所述第一数据库系统为数据仓库类系统, 并从所述特征数据中提取出全部或
符合预定要求的简单字段数据, 将提取出 的简单字段数据存入第二数据库系统, 所述第二
数据库系统为联机分析处 理类系统;
所述模型更新模块, 用于当确定符合预定的触发条件时, 从所述数据库系统中获取本
次触发对应的特征数据, 包括: 当到达预定的时间点时, 从所述第一数据库系统中获取全部
的复杂字段数据, 作为本次触发对应的特征数据, 当获取到用户的手动触发请求时, 根据所
述第二数据库系统中的简单字段数据, 从所述第一数据库系统中的复杂字段数据中过滤出权 利 要 求 书 1/2 页
2
CN 114706864 B
2符合用户需求的复杂字段数据, 将过滤出 的复杂字段数据作为本次触发对应的特征数据;
根据获取到的特 征数据进行模型的训练和评估。
7.根据权利要求6所述的装置, 其中,
所述模型更新模块通过对所述第 二数据库系统中的简单字段数据进行分析筛选, 生成
符合所述用户需求的数据标识列 表, 从所述第一数据库系统中的复杂字段数据中过滤出所
述数据标识列表中的数据标识对应的复杂字段 数据。
8.根据权利要求6~7中任一项所述的装置, 其中,
所述模型 更新模块进行模型的全量训练, 或者, 进行模型的增量训练;
和/或, 所述模型更新模块采用集群训练方式进行模型的训练, 或者, 采用单机训练方
式进行模型的训练。
9.根据权利要求6~7中任一项所述的装置, 其中,
所述数据处理模块进一步用于, 对所述数据库系统中的数据进行可视化展示, 和/或,
支持对所述数据库系统中的数据进行即席查询。
10.根据权利要求6~7中任一项所述的装置, 其中,
所述模型更新模块根据获取到的特征数据进行模型的训练, 并对训练得到的模型进行
指标评估。
11.一种电子设备, 包括:
至少一个处 理器; 以及
与所述至少一个处 理器通信连接的存 储器; 其中,
所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处
理器执行, 以使所述至少一个处 理器能够执 行权利要求1 ‑5中任一项所述的方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中, 所述计算机指令用于
使计算机执 行权利要求1 ‑5中任一项所述的方法。
13.一种计算机程序产品, 包括计算机程序/指令, 所述计算机程序/指令被处理器执行
时实现权利要求1 ‑5中任一项所述的方法。权 利 要 求 书 2/2 页
3
CN 114706864 B
3
专利 自动挖掘场景数据的模型更新方法、装置及存储介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 11:21:12上传分享