专利 用于对话场景的音似纠错方法及装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211196704.1 (22)申请日 2022.09.29 (71)申请人重庆长安汽车股份有限公司地址 400020 重庆市江北区鱼嘴镇长安汽车全球研发中心 (72)发明人张洪健　刘大全　谭瑞　 (74)专利代理机构北京清亦华知识产权代理事务所(普通合伙) 11201 专利代理师张伟 (51)Int.Cl. G06F 40/232(2020.01) G06F 40/242(2020.01) G06F 40/30(2020.01) G06F 16/35(2019.01) G06F 16/33(2019.01)G06F 16/332(2019.01) G10L 15/22(2006.01) G10L 15/18(2013.01) G10L 15/06(2013.01) G10L 15/26(2006.01) (54)发明名称用于对话场景的音似纠错方法及装置 (57)摘要本申请公开了一种用于对话场景的音似纠错方法及装置，方法包括：基于预设语义协议，根据车机对话领域的多个实体构造规则数据；基于预先训练的泛化模型对规则数据进行泛化增强，生成泛化语料；采集车机对话领域的混淆词和近音字符，并按预设比例随机替换泛化语料，构造纠错数据，生成纠错语料；修改语言模型的mask 规则，以音似字符代替随机字符进行mask，训练语言模型；基于预先构建的拼音规则表和纠错语料，增加近音噪音训练语言模型，得到偏音似的语言模型，以在对话场景中进行音似纠错。本申请实施例可以通过数据增强的方式训练偏音似文本分布的语言模型，在对话场景中音似纠错，提升了纠错检错的精确度，并且提升了车辆的交互感。权利要求书2页说明书10页附图6页 CN 115545013 A 2022.12.30 CN 115545013 A 1.一种用于对话场景的音似纠错方法，其特征在于，包括以下步骤：基于预设语义协议，根据车机对话领域的多个实体构造规则数据；基于预先训练的泛化模型对所述规则数据进行泛化增强，生成泛化语料；采集车机对话领域的混淆词和近音字符，并按预设比例随机替换所述泛化语料，构造纠错数据，生成纠错语料；修改语言模型的mask规则，以音似字符代替随机字符进行mask，训练所述语言模型；以及基于预先构建的拼音规则表和所述纠错语料，增加近音噪音训练所述语言模型，得到偏音似的语言模型，以在对话场景中进行音似纠错。 2.根据权利要求1所述的方法，其特征在于，所述根据车机对话领域的多个实体构造规则数据，包括：将所述多个实体依据所述预设语义协议中的不同意图随机填充到所述预设语义协议的词槽里。 3.根据权利要求1所述的方法，其特征在于，所述修改掩码语言模型MLM模块中的mask 规则，以音似字符代替随机字符进行mask，训练所述MLM模块，包括：修改随机其他字符的替换规则，将原词替换为近音词、混淆词，以构造所述mask 规则。 4.根据权利要求1所述的方法，其特征在于，所述基于预先构建的拼音规则表和所述纠错语料，增加近音噪音训练所述语言模型，得到偏音似的语言模型，包括：构建所述纠错语料的纠错字符的多维度特征，并构建音似分类机器学习模型，以进行纠错分类。 5.一种用于对话场景的音似纠错装置，其特征在于，包括：构造模块，用于基于预设语义协议，根据车机对话领域的多个实体构造规则数据；生成模块，用于基于预先训练的泛化模型对所述规则数据进行泛化增强，生成泛化语料；处理模块，用于采集车机对话领域的混淆词和近音字符，并按预设比例随机替换所述泛化语料，构造纠错数据，生成纠错语料；修改模块，用于修改语言模型的mask规则，以音似字符代替随机字符进行mask，训练所述语言模型；以及纠错模块，用于基于预先构建的拼音规则表和所述纠错语料，增加近音噪音训练所述语言模型，得到偏音似的语言模型，以在对话场景中进行音似纠错。 6.根据权利要求5所述的装置，其特征在于，所述构造模块进一步用于将所述多个实体依据所述预设语义协议中的不同意图随机填充到所述预设语义协议的词槽里。 7.根据权利要求5所述的装置，其特征在于，所述修改模块进一步用于修改随机其他字符的替换规则，将原词替换为近音词、混淆词，以构造所述mask 规则。 8.根据权利要求5所述的装置，其特征在于，所述纠错模块进一步用于构建所述纠错语料的纠错字符的多维度特征，并构建音似分类机器学习模型，以进行纠错分类。 9.一种车辆，其特征在于，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序，以实现如权利要求 1‑4任一项所述的用于对话场景的音似纠错方法。权　利　要　求　书 1/2 页 2 CN 115545013 A 210.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行，以用于实现如权利要求1 ‑4任一项所述的用于对话场景的音似纠错方法。权　利　要　求　书 2/2 页 3 CN 115545013 A 3

专利 用于对话场景的音似纠错方法及装置

专利用于对话场景的音似纠错方法及装置