iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211117014.2 (22)申请日 2022.09.14 (71)申请人 出门问问信息科技有限公司 地址 100044 北京市海淀区高梁桥 斜街42 号院1号楼-1层-101 (72)发明人 冯小琴 张济鹏 陈云琳 叶顺平  (74)专利代理 机构 北京庚致知识产权代理事务 所(特殊普通 合伙) 11807 专利代理师 韩德凯 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/30(2020.01) G06F 40/289(2020.01) G10L 13/10(2013.01) (54)发明名称 韵律模型的构建方法和装置、 韵律标注方 法、 电子设备 (57)摘要 本申请提供了一种韵律模型的构建方法和 装置、 韵律标注方法、 电子设备, 包括: 获取输入 数据, 以及各个前序分类器对输入 数据中训练文 本的前序标注文本, 其中输入数据的韵律等级高 于各个前序分类器对应的韵律等级; 基于输入数 据和多个前序标注文本, 对初始分类器进行参数 调整, 以获得目标分类器; 以及整合各个前序分 类器和目标分类 器, 获得韵律模型。 权利要求书2页 说明书9页 附图2页 CN 115470351 A 2022.12.13 CN 115470351 A 1.一种韵律模型的构建方法, 其特 征在于, 包括: 获取输入数据, 以及各个前序分类器对所述输入数据中训练文本的前序标注文本, 其 中所述输入数据的韵律 等级高于各个所述前序分类 器对应的韵律 等级; 基于所述输入数据和多个所述前序标注文本, 对初始分类器进行参数调整, 以获得目 标分类器; 以及 整合各个所述前序分类 器和所述目标分类 器, 获得韵律模型。 2.根据权利要求1所述的韵律模型的构建方法, 其特征在于, 所述基于所述输入数据和 多个所述前序标注文本, 对初始分类 器进行参数调整, 以获得目标分类 器, 包括: 利用所述初始分类器对所述输入数据的训练文本和各个所述前序标注文本分别进行 韵律标注, 以获得多个对应于所述输入数据的韵律 等级的韵律标注文本; 将各个所述韵律标注文本分别与 所述输入数据的预期标注结果进行比对, 分别获得多 个所述标注误差; 根据各个所述标注误差对所述初始分类 器进行参数调整; 以及 响应于各个所述标注误差均小于误差阈值的比对结果, 获得目标分类器, 其中所述目 标分类器生成的韵律标注文本与所述输入数据的预期标注结果之间的标注误差小于误差 阈值。 3.根据权利要求1所述的韵律模型的构建方法, 其特征在于, 在所述获取输入数据, 以 及各个前序分类 器对所述输入数据中训练文本的前序标注文本之前, 还 包括: 利用前序数据对另一初始分类器进行参数调整, 以获得前序分类器, 其中所述前序分 类器生成的标注结果与所述前序数据的预期标注结果之间的标注误差小于前序误差阈值。 4.根据权利要求1所述的韵律模型的构建方法, 其特征在于, 在所述获取输入数据, 以 及各个前序分类 器对所述输入数据中训练文本的前序标注文本之前, 包括: 利用所述输入数据对初始提取模块进行参数调 整, 以获得用于提取表征所述输入数据 的文本特 征的特征向量的语义 提取模块。 5.根据权利要求4所述的韵律模型的构建方法, 其特征在于, 在所述利用所述输入数据 对初始提取模块进行参数调整, 以获得用于提取表征所述输入数据的文本特征的特征向量 的语义提取模块之后, 包括: 对所述语义 提取模块进行蒸馏, 以获得用于提取 所述特征向量的目标提取模块。 6.根据权利要求1至5中任一项所述的韵律模型的构建方法, 其特征在于, 在所述获取 输入数据, 以及各个前序分类 器对所述输入数据中训练文本的前序标注文本之前, 包括: 提取用于表征 所述输入数据的文本特 征的特征向量。 7.一种韵律模型的构建装置, 其特 征在于, 包括: 输入数据获取模块, 用于获取输入数据, 以及各个前序分类器对所述输入数据中训练 文本的前序标注文本, 其中所述输入数据的韵律等级高于各个所述前序分类器对应的韵律 等级; 目标分类器生成模块, 用于基于所述输入数据和多个所述前序标注文本, 对初始分类 器进行参数调整, 以获得目标分类 器; 以及 韵律模型构建模块, 用于整合各个所述前序分类 器和所述目标分类 器, 获得韵律模型。 8.一种韵律标注方法, 其特 征在于, 包括:权 利 要 求 书 1/2 页 2 CN 115470351 A 2获取目标文本; 利用韵律模型对所述目标文本进行韵律标注, 其中所述韵律模型由权利要求1至6 中任 一项所述的韵律模型的构建方法构建; 以及 生成所述目标文本的韵律标注文本, 其中所述韵律标注文本具备对应于至少一个韵律 等级的标注信息 。 9.一种电子设备, 其特征在于, 包括存储器、 处理器及存储在存储器上并可在处理器上 运行的计算机程序, 所述处理器执行所述程序时, 以实现如权利要求1至6中任一项所述的 韵律模型的构建方法。 10.一种可读存储介质, 其特征在于, 所述可读存储介质存储有计算机程序, 所述计算 机程序适于处理器进行加载, 以执行如权利要求1至6中任一项所述的韵律模型的构建方 法。权 利 要 求 书 2/2 页 3 CN 115470351 A 3

PDF文档 专利 韵律模型的构建方法和装置、韵律标注方法、电子设备

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 韵律模型的构建方法和装置、韵律标注方法、电子设备 第 1 页 专利 韵律模型的构建方法和装置、韵律标注方法、电子设备 第 2 页 专利 韵律模型的构建方法和装置、韵律标注方法、电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:13:51上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。