(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202211140949.2
(22)申请日 2022.09.20
(65)同一申请的已公布的文献号
申请公布号 CN 115221310 A
(43)申请公布日 2022.10.21
(73)专利权人 北京大学
地址 100871 北京市海淀区颐和园路5号
(72)发明人 孙艳春 黄罡 马郓
(74)专利代理 机构 北京润泽恒知识产权代理有
限公司 1 1319
专利代理师 苟冬梅
(51)Int.Cl.
G06F 16/335(2019.01)
G06F 8/70(2018.01)
G06F 16/33(2019.01)G06F 16/35(2019.01)
G06F 16/36(2019.01)
G06F 40/30(2020.01)
G06K 9/62(2022.01)
(56)对比文件
CN 111949307 A,2020.1 1.17
审查员 王佳
(54)发明名称
一种基于知识图谱的开源应用自动化推荐
方法及装置
(57)摘要
本发明提供了一种基于知识图谱的开源应
用自动化推荐方法与装置。 该方法包括: 通过软
件开发层级知识目录, 进入目标知识条目页面;
根据目标知识条目页面的预设链接, 获取目标开
源应用; 根据开源应用知识图谱, 推荐与目标开
源应用相适应的库和框架的组合。 本发明通过软
件开发层 级知识目录, 构建系统性的软件开发学
习知识体系, 并通过预设链接可以直接获取到与
软件开发知识点相对应的开源应用, 实现了软件
开发理论和实践的连通, 解决了现有开源应用组
织的无序性。 此外, 通过构建开源应用知识图谱,
在获取到开源应用的同时, 可以自动地为初学者
推荐在实际开发 中配合使用的库和框架项目, 提
升了开源应用实 践的高效性。
权利要求书2页 说明书16页 附图2页
CN 115221310 B
2022.12.16
CN 115221310 B
1.一种基于知识图谱的开源应用自动化推荐方法, 其特 征在于, 包括:
通过软件开发层级知识目录, 进入目标知识条目页面;
根据所述目标知识条目页面的预设链接, 获取目标开源应用;
根据开源应用知识图谱, 推荐与所述目标开源应用相适应的库和框架的组合;
其中, 所述 开源应用知识图谱是通过如下步骤到的:
获取开源应用数据, 所述开源应用数据中包括开源应用和各个所述开源应用之间的依
赖关系;
利用类型识别模型, 得到各个所述 开源应用的类型;
根据开源应用之间的依赖关系, 确定出所述开源应用中的直链项目、 被依赖项目和依
赖项目;
根据所述开源应用的类型, 从所述直链项目、 所述被依赖项目和所述依赖项目中筛选
出用于构建知识图谱的候选开源应用;
以所述候选开源应用为知识图谱实体, 以所述依赖关系为知识图谱关系, 构建所述开
源应用知识图谱。
2.根据权利要求1所述的基于知识图谱的开源应用自动 化推荐方法, 其特征在于, 所述
软件开发层级知识目录是通过如下步骤得到的, 所述 步骤包括:
获取分类页面数据; 所述分类页面数据包括分类页面和知识条目页面;
通过规则对所述分类页面数据进行筛 选;
以筛选后的所述分类页面表示分支节点, 以筛选后的所述知识条目页面表示叶子节
点, 构建树结构的所述软件开发层级知识目录 。
3.根据权利要求2所述的基于知识图谱的开源应用自动 化推荐方法, 其特征在于, 所述
知识条目页面还 包括链接数据, 所述 步骤还包括:
根据所述链接数据, 在各个知识条目页面建立对应的预设链接, 以链接与所述知识条
目页面对应的开源应用。
4.根据权利要求1所述的基于知识图谱的开源应用自动 化推荐方法, 其特征在于, 所述
类型识别模型 是通过如下步骤建立的:
获取训练数据集, 并对各个训练数据进行标注, 得到标注后的训练数据集, 所述标注表
征所述训练数据是否为框架或库类型的开源应用;
对所述标注后的训练数据集进行 预处理, 得到预处 理后的训练数据集;
利用所述预处 理后的训练数据集进行模型训练, 得到所述类型识别模型。
5.根据权利要求1所述的基于知识图谱的开源应用自动 化推荐方法, 其特征在于, 根据
开源应用知识图谱, 推荐与所述目标开源应用相适应的库和框架的组合, 包括:
根据开源应用知识图谱, 确定所述目标开源应用的所有依赖项目;
根据开源应用知识图谱, 确定出 所有依赖项目的知识嵌入向量;
计算各个所述知识嵌入向量与所述目标开源应用的相似度, 得到各个所述知识嵌入向
量的相似度值;
根据所述相似度值, 确定出多个目标依赖项目;
将所述多个目标依赖项目作为与 所述目标开源应用相适应的库和框架的组合, 进行推
荐。权 利 要 求 书 1/2 页
2
CN 115221310 B
26.根据权利要求5所述的基于知识图谱的开源应用自动 化推荐方法, 其特征在于, 根据
开源应用知识图谱, 确定出 所有依赖项目的知识嵌入向量, 包括:
根据所述开源应用知识图谱中的所述知识图谱实体和所述知识图谱关系, 利用TransD
模型构建所述依赖项目的知识嵌入向量。
7.一种基于知识图谱的开源应用自动化推荐装置, 其特 征在于, 包括:
层级知识目录模块, 用于通过 软件开发层级知识目录, 进入目标知识条目页面;
链接模块, 用于根据所述目标知识条目页面的预设链接, 获取目标开源应用;
推荐模块, 用于根据开源应用 知识图谱, 推荐与所述目标开源应用相适应的库和框架
的组合;
其中, 所述装置还包括开源软件知识图谱构建模块, 所述开源软件知识图谱构建模块
包括:
第一构建子模块, 用于获取开源应用数据, 所述开源应用数据中包括开源应用和所述
开源应用之间的依赖关系;
第二构建子模块, 用于利用类型识别模型, 得到各个所述 开源应用的类型;
第三构建子模块, 用于根据开源应用之间的依赖关系, 确定出所述开源应用中的直链
项目、 被依赖项目和依赖项目;
第四构建子模块, 用于根据所述开源应用的类型从所述直链项目、 所述被依赖项目和
所述依赖项目中筛 选出用于构建知识图谱的候选开源应用;
第五构建子模块, 用于以所述候选开源应用为知识图谱实体, 以所述依赖关系为知识
图谱关系, 构建所述 开源应用知识图谱。
8.一种电子设备, 包括存储器、 处理器及存储在所述存储器上的计算机程序, 其特征在
于, 所述处理器执行所述计算机程序以实现权利要求 1至6中任一项 所述的基于知识图谱的
开源应用自动化推荐方法中的步骤。
9.一种计算机可读存储介质, 其上存储有计算机程序/指令, 其特征在于, 所述计算机
程序/指令被处理器执行时实现如权利要求 1至6中任一项 所述的基于知识图谱的开源应用
自动化推荐方法中的步骤。权 利 要 求 书 2/2 页
3
CN 115221310 B
3
专利 一种基于知识图谱的开源应用自动化推荐方法及装置
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:13:48上传分享