[发明专利]逐词比对句子的方法、系统、计算机程序产品及记录媒体无效
申请号: | 201110271090.4 | 申请日: | 2011-09-16 |
公开(公告)号: | CN102323921A | 公开(公告)日: | 2012-01-18 |
发明(设计)人: | 陈淮琰;唐海波;郑建锋 | 申请(专利权)人: | 无敌科技(西安)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 西安智邦专利商标代理有限公司 61211 | 代理人: | 商宇科 |
地址: | 710075 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 句子 方法 系统 计算机 程序 产品 记录 媒体 | ||
技术领域
本发明涉及一种逐词比对句子的方法、系统、计算机程序产品及计算机可读取记录媒体,尤其是关于一种考虑到同义词的逐词比对句子的方法、系统、计算机程序产品及计算机可读取记录媒体。
背景技术
在日常生活中,经常需要同时阅读相同内容,但用不同语言写成的文章,以确认能正确地解释文章内容。如此一来,就会遇到如何对照不同语言句子的问题。如果能提供一种简单的逐词比对方法,对不同语言句子作比对,对增进了解文章内容将会有很大的帮助。其中最常遇到的状况即是中文与英文的比对。
在先前技术中,通常会采用从中文向英文的比对路径,因为英文中存在大量的词组或俗语,若从英文向中文比对,得到的准确度较低。但由于中英语使用环境和语法的问题,即使采用中文向英文的比对路径,也会存在大量无法对应的词组。因此需要提出一种新的逐词比对句子的方法,以解决先前技术的缺失。
发明内容
本发明为解决背景技术中存在的上述技术问题,而提出逐词比对句子的方法、系统、计算机程序产品及计算机可读取记录媒体。
本发明的技术解决方案是本发明为一种逐词比对句子的方法,供逐词比对不同语言的第一语言句子及第二语言句子,以决定第一语言句子所包含的多个第一语言词组与第二语言句子所包含的多个第二语言词组的对应关系,其特殊之处在于:该方法包含下列步骤:
1)搜寻第一对照词库,以判断多个第一语言词组的第一语言词组是否存在于第一对照词库中;
2)若第一语言词组存在于第一对照词库中,则从第一对照词库中取得第一语言词组所对照之的一组第二语言释义;
3)搜寻第二语言词组变化形式词表,以判断一组第二语言释义中的特定第二语言释义是否存在于第二语言词组变化形式词表中;
4)若特定第二语言释义存在于第二语言词组变化形式词表中,则从第二语言词组变化形式词表中取得特定第二语言释义的一组第二语言变化形式词组;
5)比对一组第二语言变化形式词组中的特定第二语言变化形式词组和第二语言句子,以判断特定第二语言变化形式词组是否符合多个第二语言词组的第二语言词组;
6)若特定第二语言变化形式词组符合第二语言词组,则通过处理器控制标记模块对第一语言词组及第二语言词组进行标记,以表示两者间具有对应关系。
上述方法包括步骤7)若其中一个第二语言词组被标记为与两个以上的第一语言词组具有对应关系,则分别对每个第一语言词组计算权重值,以决定第二语言词组所应对应的第一语言词组。
上述针对具有对应关系的第一语言词组及第二语言词组,分析第二语言词组是否为语干与修饰词的组合;若是,则判断第二语言词组去掉修饰词后,是否与第一语言词组存在新对应关系;若是,则依据新对应关系,将第二语言词组的语干与第一语言词组新增入第二对照词库中。
第一语言句子为英文句子,第二语言句子为中文句子,其特殊之处在于:该方法包括:通过标记模块将第一语言句子中具有以下任一种特定型式的组合标记为第一语言词组:
A.冠词+(名词或形容词);
B.系动词+(形容词或动词);
C.(动词或名词)+介词;或者
D.介词+(动词或名词)。
一种内储用于逐词比对句子程序的计算机程序产品,其特殊之处在于:当计算机加载该程序并执行后,可完成如权利要求1所述的方法。
一种内储程序的计算机可读取记录媒体,其特殊之处在于:当计算机加载程序并执行后,可完成如权利要求1所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无敌科技(西安)有限公司,未经无敌科技(西安)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110271090.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:包括阳离子聚合物的井筒应用液及其使用方法
- 下一篇:多层外科用假体