iso file download
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202211107345.8 (22)申请日 2022.09.13 (65)同一申请的已公布的文献号 申请公布号 CN 115204190 A (43)申请公布日 2022.10.18 (73)专利权人 中科聚信 信息技术 (北京) 有限公 司 地址 100081 北京市海淀区学院南路62号 院1号楼4层40 6室 (72)发明人 韩双江 姜长江 苏雯斐 王辉  黄荣辉 战启铭  (74)专利代理 机构 北京远大卓悦知识产权代理 有限公司 1 1369 专利代理师 史霞(51)Int.Cl. G06F 40/42(2020.01) G06F 40/289(2020.01) G06F 40/30(2020.01) (56)对比文件 CN 108287825 A,2018.07.17 CN 106095753 A,2016.1 1.09 CN 112966508 A,2021.0 6.15 CN 107908712 A,2018.04.13 CN 102708147 A,2012.10.0 3 US 20142783 59 A1,2014.09.18 黄政豪 等.基 于术语自动抽取的科技文献 翻译辅助系统的设计与实现. 《万方数据知识服 务平台》 .2018, 审查员 郭明华 (54)发明名称 金融领域 术语转化为英文的装置及方法 (57)摘要 本发明公开了一种金融领域术语转化为英 文的装置, 包括: 术语库预处理模块, 其用于加载 词库, 所述词库预设有金融领域术语; 中文语义 分析分词模块, 其用于获取待处理语句, 并且根 据金融领域术语将语句按语句顺序拆分成多个 单词和/或词语; 中文转换为英文模块, 其用于将 拆分后的多个单词和/或词语转换为英文术语; 结果输出模块, 其用于输出待处理语句和对应的 英文术语。 本发明具有精准分析金融领域语义, 且精准转化为英文术语的有益效果。 本发明提供 一种金融领域术语转化为英文的方法, 金融领域 语义分析精准, 英 语术语转 化精准。 权利要求书2页 说明书5页 附图3页 CN 115204190 B 2022.11.22 CN 115204190 B 1.金融领域 术语转化为英文的装置, 其特 征在于, 包括: 术语库预处 理模块, 其用于加载词库, 所述词库预设有金融领域 术语; 中文语义分析分词模块, 其用于获取待处理语句, 并且根据金融领域术语将语句按语 句顺序拆分成多个单词和/或词语; 中文转换为英文模块, 其用于将拆分后的多个单词和/或词语转换为对应的英文术语; 其中, 中文语义分析分词模块拆分语句的方法包括以下步骤: 步骤一、 按照中文单词逐个拆分语句, 并计算中文单词个数n, 拆分后中文单词按照语 句顺序组成有序集 合An= (A1, A 2, Am...An) , 中文单词个数n设置为迭代循环次数; 步骤二、 语义分析: 取出有序 集合An中的第一个元素A1, 并且与所述词库对比, 若命中, 则记录该元素, 并映射对应的英文术语, 然后将该元素与集合An中剩余的元素做累积组合 形成新的拆分词汇, 将新的拆分词汇与所述词库对比, 命中的元素和词汇组合形成有序集 合Bn, 多次迭代创建新词汇直至A1与剩余 n‑1个元素累积组合完毕; 步骤三、 读取集合Bn中长度最长的最小单元语义词作为第一个拆分术语词, 第一个拆 分术语词的长度为m, 以A (m+1) 词开始第2轮迭代, 并从第2轮Bn集合中读取长度最长的最小 单元语义词作为第二个命中的拆分术语词, 并映射对应的英文术语, 多次迭代, 直至m=n结 束循环, 完成语义拆分, 形成拆分词汇; 结果输出模块, 其用于 输出待处 理语句和对应的英文术语。 2.如权利要求1所述的金融领域术语转化为英文的装置, 其特征在于, 所述词库包括内 置词库和自定义词库, 所述内置词库包括有多个金融领域术语, 所述自定义词库用于增加 新的术语, 且自定义词库的优先级高于内置词库。 3.如权利要求1所述的金融领域术语转化为英文的装置, 其特征在于, 若步骤二和步骤 三中与所述词库对比时, 未命中任何词汇, 则以元素A1组合累计An长度最长的最长语义词 作为拆分词, 并以占位符的形式代 表映射的英文术语。 4.如权利要求1所述的金融领域术语转化为英文的装置, 其特征在于, 还包括目标语义 整合模块, 其用于采用预设符号将 拆分后的相邻两个单词和/或词语之间进行拼接, 以及用 于采用预设符号 拼接对应的相邻的英文术语。 5.如权利要求4所述的金融领域术语转化为英文的装置, 其特征在于, 所述目标语义整 合模块用于提供语句对应的英文术语以驼峰式、 全大写和全小 写的形式显示。 6.如权利要求1所述的金融领域术语转化为英文的装置, 其特征在于, 所述结果输出模 块以控制台模式和Excel文件的形式的其中一种形式输出 结果。 7.金融领域 术语转化为英文的方法, 其特 征在于, 包括以下步骤: 步骤一、 获取待处理语句, 并且根据金融领域术语将语句按语句顺序拆分成多个单词 和/或词语, 其中, 预设包 含有多个金融领域 术语的词库; 其中, 拆分语句的方法包括以下步骤: 步骤a、 按照中文单词逐个拆分语句, 并计算中文单词个数n, 拆分后中文单词按照语句 顺序组成有序集 合An= (A1, A 2, Am...An) , 中文单词个数n设置为迭代循环次数; 步骤b、 语义分析: 取出有序集合An中的第一个元素A1, 并且与所述词库对比, 若命中, 则记录该元素, 并映射对应的英文术语, 然后将该元素与集合An中剩余的元素做累积组合 形成新的拆分词汇, 将新的拆分词汇与所述词库对比, 命中的元素和词汇组合形成有序集权 利 要 求 书 1/2 页 2 CN 115204190 B 2合Bn, 多次迭代创建新词汇直至A1与剩余 n‑1个元素累积组合完毕; 步骤c、 读取集合Bn中长度最长的最小单元语义词作为第 一个拆分术语词, 第一个拆分 术语词的长度为m, 以A (m+1) 词开始第2轮迭代, 并从第2轮Bn集合中读取长度最长的最小单 元语义词作为第二个命中的拆分术语词, 并映射对应的英文术语, 多次迭代, 直至m=n结束 循环, 完成语义拆分, 形成拆分词汇; 步骤二、 将拆分后的多个单词和/或词语转换为英文术语; 步骤三、 输出待处 理语句和对应的英文术语。权 利 要 求 书 2/2 页 3 CN 115204190 B 3

PDF文档 专利 金融领域术语转化为英文的装置及方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 金融领域术语转化为英文的装置及方法 第 1 页 专利 金融领域术语转化为英文的装置及方法 第 2 页 专利 金融领域术语转化为英文的装置及方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:13:52上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。