iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211200331.0 (22)申请日 2022.09.29 (71)申请人 北京世纪好未来教育科技有限公司 地址 100089 北京市海淀区中关村大街32 号19层1901室 (72)发明人 王智浩 李云良 胡飞  (74)专利代理 机构 北京开阳星知识产权代理有 限公司 1 1710 专利代理师 王艳斌 (51)Int.Cl. G06F 16/33(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01) (54)发明名称 写作素材的推荐方法、 装置、 电子设备及存 储介质 (57)摘要 本公开提供一种写作素材的推荐方法、 装 置、 电子设备及存储介质, 方法包括: 接收用户输 入的查询语句; 根据所述查询语句, 从素材库中 确定出与所述查询语句相关的多个候选素材; 对 所述查询语句和每个候选素材进行分词和词性 统计, 以获取所述每个候选素材对应的词性维度 特征; 对所述查询语句和所述每个候选素材进行 拼接编码, 以获取所述每个候选素材对应的语义 特征; 根据所述词性维度特征和所述语义特征, 确定所述查询语句与所述每个候选素材之间的 相关度; 根据所述相关度, 从所述多个候选素材 中确定出第一预设个数的目标素材进行推荐。 本 方案能够提高相关度计算的准确度, 从而提高写 作素材推荐的准确度。 权利要求书3页 说明书17页 附图6页 CN 115455152 A 2022.12.09 CN 115455152 A 1.一种写作素 材的推荐方法, 其中, 所述方法包括: 接收用户输入的查询语句; 根据所述 查询语句, 从素 材库中确定出与所述 查询语句 相关的多个候选素 材; 对所述查询语句和每个候选素材进行分词和词性统计, 以获取所述每个候选素材对应 的词性维度特 征; 对所述查询语句和所述每个候选素材进行拼接编码, 以获取所述每个候选素材对应的 语义特征; 根据所述词性维度特征和所述语义特征, 确定所述查询语句与 所述每个候选素材之间 的相关度; 根据所述相关度, 从所述多个候选素 材中确定出第一预设个数的目标 素材进行推荐。 2.如权利要求1所述的写作素 材的推荐方法, 其中, 所述方法还 包括: 根据所述每 个候选素 材包含的主题词的个数, 确定所述每 个候选素 材的主题词特 征; 并且其中, 所述根据所述词性维度特征和所述语义特征, 确定所述查询语句与所述每 个候选素 材之间的相关度, 包括: 根据所述主题词特征、 所述词性维度特征和所述语义特征, 确定所述查询语句与所述 每个候选素 材之间的相关度。 3.如权利要求2所述的写作素材的推荐方法, 其中, 所述根据所述主题词特征、 所述词 性维度特 征和所述语义特 征, 确定所述 查询语句与所述每 个候选素 材之间的相关度, 包括: 针对所述每个候选素材, 将所述每个候选素材的所述主题词特征和所述词性维度 特征 进行拼接, 得到第一 拼接特征; 按照预设的第一 转换矩阵, 对所述第一 拼接特征进行维度转换, 得到第一 转换特征; 将所述第一转换特征与所述每个候选素材的所述语义特征进行拼接, 得到第 二拼接特 征; 按照预设的第二 转换矩阵, 对所述第二 拼接特征进行维度转换, 得到第二 转换特征; 按照预设的第三 转换矩阵, 对所述第二 转换特征进行维度转换, 得到第三 转换特征; 将所述第三转换特征的特征值确定为所述查询语句与所述每个候选素材之间的相关 度。 4.如权利要求1所述的写作 素材的推荐方法, 其中, 所述对所述查询语句和每个候选素 材进行分词和词性统计, 以获取 所述每个候选素 材对应的词性维度特 征, 包括: 对所述查询语句和所述每个候选素材分别进行分词, 得到所述查询语句对应的第 一分 词和所述每 个候选素 材对应的第二分词; 按照预设的词性维度表, 统计所述第一分词中包含的各词性的个数, 得到第一词性特 征; 按照所述词性维度表, 统计所述每个候选素材对应的所述第 二分词中包含的各词性的 个数, 得到第二词性特 征; 按照所述词性维度表, 统计所述第 一分词与所述每个候选素材对应的所述第 二分词中 包含同一词性的个数, 得到第三词性特 征; 针对所述每个候选素材, 将所述第一词性特征、 所述第二词性特征和所述第三词性特 征进行拼接, 得到所述每 个候选素 材对应的第四词性特 征;权 利 要 求 书 1/3 页 2 CN 115455152 A 2对所述第四词性特 征进行标准化处理, 得到所述每 个候选素 材对应的词性维度特 征。 5.如权利要求1所述的写作素材的推荐方法, 其中, 所述根据所述查询语句, 从素材库 中确定出与所述 查询语句 相关的多个候选素 材, 包括: 利用预先训练的双塔模型的查询语句端编码模型, 根据 所述查询语句确定所述查询语 句对应的请求表示向量; 计算所述请求表示向量与所述素材库中每个素材表示向量之间的相似度, 其中, 所述 素材库中的素材表示向量是预先利用所述双塔模型的素材端编码模型对多个素材进行编 码得到的; 根据所述相似度, 从所述素材库中确定出与所述请求表示向量之间的相似度最高的第 二预设个数的目标 素材表示向量; 将所述目标 素材表示向量对应的素 材, 确定为所述多个候选素 材。 6.如权利要求1 ‑5任一项所述的写作素材的推荐方法, 其中, 所述根据所述相关度, 从 所述多个候选素 材中确定出第一预设个数的目标 素材进行推荐, 包括: 根据所述相关度, 从所述多个候选素材中确定出所述第 一预设个数的相关度最高的目 标素材; 根据所述目标 素材对应的相关度, 确定所述目标 素材对应的第一 概率序列; 根据所述第 一概率序列, 从多个得分序列中确定出与 所述第一概率序列之间的相对熵 最小的目标 得分序列; 按照所述目标得分序列中每个所述目标素材的得分概率, 对所述目标素材进行排序后 推荐给所述用户。 7.如权利要求6所述的写作素 材的推荐方法, 其中, 所述方法还 包括: 根据所述目标素材包含的主题词的个数, 以及所述目标素材包含所述查询语句中的词 的个数, 确定所述目标 素材对应的第二 概率序列; 根据所述查询语句与 所述目标素材之间的相似度, 以及所述查询语句与所述目标素材 之间的相关度, 确定所述目标 素材对应的第三 概率序列; 将所述目标素材携带的标签的数量作为对应目标素材的得分, 根据所述得分确定所述 目标素材对应的第四概 率序列; 从所述第二概率序列、 所述第 三概率序列和所述第四概率序列中选择至少两个作为所 述多个得分序列。 8.如权利要求7所述的写作 素材的推荐方法, 其中, 所述根据所述查询语句与 所述目标 素材之间的相似度, 以及所述查询 语句与所述 目标素材之间的相关度, 确定所述 目标素材 对应的第三 概率序列, 包括: 获取相似度对应的第一预设权 重以及相关度对应的第二预设权 重; 根据所述第 一预设权重和所述第 二预设权重, 对所述查询语句与所述目标素材之间的 相似度以及所述查询语句与所述目标素材之间的相关度进 行加权求和, 得到所述目标素材 的召回分数; 根据所述目标 素材的召回分数, 确定所述目标 素材对应的第三 概率序列。 9.一种写作素 材的推荐装置, 其中, 所述装置包括: 接收模块, 用于 接收用户输入的查询语句;权 利 要 求 书 2/3 页 3 CN 115455152 A 3

PDF文档 专利 写作素材的推荐方法、装置、电子设备及存储介质

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 写作素材的推荐方法、装置、电子设备及存储介质 第 1 页 专利 写作素材的推荐方法、装置、电子设备及存储介质 第 2 页 专利 写作素材的推荐方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:13:42上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。