(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202211107345.8
(22)申请日 2022.09.13
(65)同一申请的已公布的文献号
申请公布号 CN 115204190 A
(43)申请公布日 2022.10.18
(73)专利权人 中科聚信 信息技术 (北京) 有限公
司
地址 100081 北京市海淀区学院南路62号
院1号楼4层40 6室
(72)发明人 韩双江 姜长江 苏雯斐 王辉
黄荣辉 战启铭
(74)专利代理 机构 北京远大卓悦知识产权代理
有限公司 1 1369
专利代理师 史霞(51)Int.Cl.
G06F 40/42(2020.01)
G06F 40/289(2020.01)
G06F 40/30(2020.01)
(56)对比文件
CN 108287825 A,2018.07.17
CN 106095753 A,2016.1 1.09
CN 112966508 A,2021.0 6.15
CN 107908712 A,2018.04.13
CN 102708147 A,2012.10.0 3
US 20142783 59 A1,2014.09.18
黄政豪 等.基 于术语自动抽取的科技文献
翻译辅助系统的设计与实现. 《万方数据知识服
务平台》 .2018,
审查员 郭明华
(54)发明名称
金融领域 术语转化为英文的装置及方法
(57)摘要
本发明公开了一种金融领域术语转化为英
文的装置, 包括: 术语库预处理模块, 其用于加载
词库, 所述词库预设有金融领域术语; 中文语义
分析分词模块, 其用于获取待处理语句, 并且根
据金融领域术语将语句按语句顺序拆分成多个
单词和/或词语; 中文转换为英文模块, 其用于将
拆分后的多个单词和/或词语转换为英文术语;
结果输出模块, 其用于输出待处理语句和对应的
英文术语。 本发明具有精准分析金融领域语义,
且精准转化为英文术语的有益效果。 本发明提供
一种金融领域术语转化为英文的方法, 金融领域
语义分析精准, 英 语术语转 化精准。
权利要求书2页 说明书5页 附图3页
CN 115204190 B
2022.11.22
CN 115204190 B
1.金融领域 术语转化为英文的装置, 其特 征在于, 包括:
术语库预处 理模块, 其用于加载词库, 所述词库预设有金融领域 术语;
中文语义分析分词模块, 其用于获取待处理语句, 并且根据金融领域术语将语句按语
句顺序拆分成多个单词和/或词语;
中文转换为英文模块, 其用于将拆分后的多个单词和/或词语转换为对应的英文术语;
其中, 中文语义分析分词模块拆分语句的方法包括以下步骤:
步骤一、 按照中文单词逐个拆分语句, 并计算中文单词个数n, 拆分后中文单词按照语
句顺序组成有序集 合An= (A1, A 2, Am...An) , 中文单词个数n设置为迭代循环次数;
步骤二、 语义分析: 取出有序 集合An中的第一个元素A1, 并且与所述词库对比, 若命中,
则记录该元素, 并映射对应的英文术语, 然后将该元素与集合An中剩余的元素做累积组合
形成新的拆分词汇, 将新的拆分词汇与所述词库对比, 命中的元素和词汇组合形成有序集
合Bn, 多次迭代创建新词汇直至A1与剩余 n‑1个元素累积组合完毕;
步骤三、 读取集合Bn中长度最长的最小单元语义词作为第一个拆分术语词, 第一个拆
分术语词的长度为m, 以A (m+1) 词开始第2轮迭代, 并从第2轮Bn集合中读取长度最长的最小
单元语义词作为第二个命中的拆分术语词, 并映射对应的英文术语, 多次迭代, 直至m=n结
束循环, 完成语义拆分, 形成拆分词汇;
结果输出模块, 其用于 输出待处 理语句和对应的英文术语。
2.如权利要求1所述的金融领域术语转化为英文的装置, 其特征在于, 所述词库包括内
置词库和自定义词库, 所述内置词库包括有多个金融领域术语, 所述自定义词库用于增加
新的术语, 且自定义词库的优先级高于内置词库。
3.如权利要求1所述的金融领域术语转化为英文的装置, 其特征在于, 若步骤二和步骤
三中与所述词库对比时, 未命中任何词汇, 则以元素A1组合累计An长度最长的最长语义词
作为拆分词, 并以占位符的形式代 表映射的英文术语。
4.如权利要求1所述的金融领域术语转化为英文的装置, 其特征在于, 还包括目标语义
整合模块, 其用于采用预设符号将 拆分后的相邻两个单词和/或词语之间进行拼接, 以及用
于采用预设符号 拼接对应的相邻的英文术语。
5.如权利要求4所述的金融领域术语转化为英文的装置, 其特征在于, 所述目标语义整
合模块用于提供语句对应的英文术语以驼峰式、 全大写和全小 写的形式显示。
6.如权利要求1所述的金融领域术语转化为英文的装置, 其特征在于, 所述结果输出模
块以控制台模式和Excel文件的形式的其中一种形式输出 结果。
7.金融领域 术语转化为英文的方法, 其特 征在于, 包括以下步骤:
步骤一、 获取待处理语句, 并且根据金融领域术语将语句按语句顺序拆分成多个单词
和/或词语, 其中, 预设包 含有多个金融领域 术语的词库;
其中, 拆分语句的方法包括以下步骤:
步骤a、 按照中文单词逐个拆分语句, 并计算中文单词个数n, 拆分后中文单词按照语句
顺序组成有序集 合An= (A1, A 2, Am...An) , 中文单词个数n设置为迭代循环次数;
步骤b、 语义分析: 取出有序集合An中的第一个元素A1, 并且与所述词库对比, 若命中,
则记录该元素, 并映射对应的英文术语, 然后将该元素与集合An中剩余的元素做累积组合
形成新的拆分词汇, 将新的拆分词汇与所述词库对比, 命中的元素和词汇组合形成有序集权 利 要 求 书 1/2 页
2
CN 115204190 B
2合Bn, 多次迭代创建新词汇直至A1与剩余 n‑1个元素累积组合完毕;
步骤c、 读取集合Bn中长度最长的最小单元语义词作为第 一个拆分术语词, 第一个拆分
术语词的长度为m, 以A (m+1) 词开始第2轮迭代, 并从第2轮Bn集合中读取长度最长的最小单
元语义词作为第二个命中的拆分术语词, 并映射对应的英文术语, 多次迭代, 直至m=n结束
循环, 完成语义拆分, 形成拆分词汇;
步骤二、 将拆分后的多个单词和/或词语转换为英文术语;
步骤三、 输出待处 理语句和对应的英文术语。权 利 要 求 书 2/2 页
3
CN 115204190 B
3
专利 金融领域术语转化为英文的装置及方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:13:52上传分享