iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211150821.4 (22)申请日 2022.09.21 (71)申请人 携程旅游信息技 术 (上海) 有限公司 地址 201203 上海市浦东 新区自由贸易试 验区碧波路518号3 02室 (72)发明人 王子奕 刘嘉伟 鞠剑勋 李健 (74)专利代理 机构 上海隆天律师事务所 31282 专利代理师 钟宗 (51)Int.Cl. G06F 16/9537(2019.01) G06F 16/951(2019.01) G06F 40/284(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 基于深度学习的兴趣点融合方法、 系统、 设 备及存储介质 (57)摘要 本发明提供了基于深度学习的兴趣点融合 方法、 系统、 设备及存储介质, 该方法包括: 将各 待检测的兴趣点的经纬度分别编码成一个字符 串, 得到地理坐标对应的空间索引 值, 将坐标哈 希值相同的兴趣点分别两两组合得到若干候选 兴趣点对; 提取候选兴趣点对中两个候选兴趣点 的词汇特征和语义特征, 并输入语义识别神经网 络预测两个候选兴趣点是否为重复关系; 以及当 符合重复关系, 则将两个候选兴趣点融合。 本发 明能够自动发现知识库中具有重复关系的实体, 实现兴趣点的归一化, 辅助网站运营人员及时修 复这类兴趣点, 以提升信息覆盖全面性和平台可 靠性, 改善OTA用户的查询体验。 权利要求书2页 说明书13页 附图4页 CN 115495676 A 2022.12.20 CN 115495676 A 1.一种基于深度学习的兴趣点融合方法, 其特 征在于, 包括以下步骤: 将各待检测的兴趣点的经纬度分别编码 成一个字符串, 得到地理坐标对应的空间索引 值, 将坐标哈希值相同的兴趣点分别两 两组合得到若干候选兴趣点对; 提取所述候选兴趣点对中两个候选兴趣点的词汇特征和语义特征, 并输入语义识别神 经网络预测两个所述 候选兴趣点是否为重复关系; 以及 当符合重复关系, 则将两个所述 候选兴趣点融合。 2.如权利要求1所述的基于深度 学习的兴趣点融合方法, 其特征在于, 所述将各待检测 的兴趣点的经纬度分别编码成一个字符串, 得到地理坐标对应的空间索引值, 将坐标哈希 值相同的兴趣点分别两 两组合得到若干候选兴趣点对, 包括: 通过Geohash算法, 将每 个兴趣点的经纬度编码成一个字符串; 根据预设精度截断空间索引值, 将坐标哈希值相同的兴趣点分别两两组合得到若干候 选兴趣点对。 3.如权利要求1所述的基于深度 学习的兴趣点融合方法, 其特征在于, 所述提取所述候 选兴趣点对中两个候选 兴趣点的词汇特征和语义特征, 并输入语义识别神经网络预测两个 所述候选兴趣点是否为重复关系, 包括: 至少基于名称信 息、 地址信息、 介绍文本信 息, 获得所述候选兴趣点对中两个候选兴趣 点的词汇特 征的相似参数; 获得所述候选兴趣点对中两个候选兴趣点的语义特 征的相似参数; 将所述词汇特征的相似参数和语义特征的相似参数输入经过训练的逻辑分类器预测 两个所述 候选兴趣点是否为重复关系。 4.如权利要求3所述的基于深度 学习的兴趣点融合方法, 其特征在于, 所述至少基于名 称信息、 地址信息、 介绍文本信息, 获得所述候选 兴趣点对中两个候选 兴趣点的词汇特征的 相似参数, 包括: 对于两个所述候选兴趣点的名称信息, 除去预设省份、 城市等前缀字段以及预设关键 词后缀外, 计算所述名称的其 余部分的第一杰卡德相似系数f1; 对于两个所述候选兴趣点的所述地址信息, 除去预设省份、 城市、 景点名称字段外, 计 算所述地址信息的其 余部分的第二杰卡德相似系数f2; 对于两个所述候选兴趣点的所述介绍文本信息进行分词, 计算≥4字的短语的第三杰 卡德相似系数f3。 5.如权利要求4所述的基于深度 学习的兴趣点融合方法, 其特征在于, 所述获得所述候 选兴趣点对中两个候选兴趣点的语义特 征的相似参数, 包括: 通过三个不同的BERT编码器分别提取两个所述候选兴趣点在名称、 地址、 介绍上的表 征; 分别对同一字段的语义向量计算余弦相似度, 获得第四余弦相似度f4、 第五余弦相似度 f5、 第六余弦相似度f6。 6.如权利要求5所述的基于深度 学习的兴趣点融合方法, 其特征在于, 所述将所述词汇 特征的相似参数和语义特征的相似参数输入经过训练的逻辑分类器预测两个所述候选兴 趣点是否为重复关系, 包括: 将第一杰卡德相似系数f1、 第二杰卡德相似系数f2、 第三杰卡德相似系数f3、 第四余弦权 利 要 求 书 1/2 页 2 CN 115495676 A 2相似度f4、 第五余弦相似度f5、 第六余弦相似度f6输入一个经过训练的逻辑分类器预测两个 POI是否为重复关系。 7.如权利要求1所述的基于深度 学习的兴趣点融合方法, 其特征在于, 所述当符合重复 关系, 则将两个所述 候选兴趣点融合, 包括: 当逻辑分类器预测为重复关系的概率值大于预设阈值, 则将两个所述候选兴趣点的相 关信息合并为 一个兴趣点。 8.一种基于深度学习的兴趣点融合系统, 用于实现权利要求1所述的基于深度学习的 兴趣点融合方法, 其特 征在于, 包括: 兴趣点配对模块, 将各待检测的兴趣点的经纬度分别编码成一个字符串, 得到地理坐 标对应的空间索引值, 根据 空间索引值的相似性, 将坐标哈希值相同的兴趣点分别两两组 合得到若干候选兴趣点对; 兴趣点匹配模块, 提取所述候选兴趣点对中两个候选兴趣点的词汇特征和语义特征, 并输入语义识别神经网络预测两个所述 候选兴趣点是否为重复关系; 以及 兴趣点融合模块, 当符合重复关系, 则将两个所述 候选兴趣点融合。 9.一种基于深度学习的兴趣点融合设备, 其特 征在于, 包括: 处理器; 存储器, 其中存 储有所述处 理器的可 执行指令; 其中, 所述处理器配置为经由执行所述可执行指令来执行权利要求1至7任意一项所述 基于深度学习的兴趣点融合方法的步骤。 10.一种计算机可读存储介质, 用于存储程序, 其特征在于, 所述程序被处理器执行时 实现权利要求1至7任意 一项所述基于深度学习的兴趣点融合方法的步骤。权 利 要 求 书 2/2 页 3 CN 115495676 A 3
专利 基于深度学习的兴趣点融合方法、系统、设备及存储介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 SC 于
2024-03-03 12:13:46
上传分享
举报
下载
原文档
(762.0 KB)
分享
友情链接
TB-T 2231.2-2018 铁道车辆制动系统 第2部分:货车.pdf
NIST.SP.800-53r5-draft-IT系统和组织的安全与隐私控制_Security and Privacy Controls for Information Systems and Organizations .pdf
DB6528-T 189-2023 加工辣椒品种InDel指纹数据库构建规范 巴音郭楞蒙古自治州.pdf
DB-T 39-2010 地震台网设计技术要求 重力观测网.pdf
GB-T 35275-2017 信息安全技术 SM2密码算法加密签名消息语法规范.pdf
GB-T 18154-2000 监控式抑爆装置技术要求.pdf
DB31-T 1241-2020 公共数据“三清单”管理规范 上海市.pdf
GB-T 12167-2006 带电作业用铝合金紧线卡线器.pdf
DB13-T 2948-2019 公路桥面铺装层维修设计与施工技术规范 河北省.pdf
ISOIEC 42001-2023.pdf
法律法规 西安市工业节能条例2022-02-11.pdf
产品采购安全管理制度.pdf
GB 18384-2020 电动汽车安全要求.pdf
GB-T 38596-2020 催化剂生产废水中重金属含量的测定.pdf
GB/T 6165-2021 高效空气过滤器性能试验方法 效率和阻力.pdf
T-CSES 41—2021 二氧化碳捕集利用与封存术语.pdf
GM-T 0067-2019 基于数字证书的身份鉴别接口规范.pdf
GB-T 19828-2018 食盐定点生产企业质量管理技术规范.pdf
GB-T 33560-2017 信息安全技术 密码应用标识规范.pdf
GB-T 29246-2023 信息安全技术 信息安全管理体系 概述和词汇.pdf
1
/
20
评价文档
赞助3元 点击下载(762.0 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。