[发明专利]用于形成机器翻译的语义单元及其表示库的方法及其系统无效
申请号: | 200710197070.0 | 申请日: | 2007-12-06 |
公开(公告)号: | CN101452447A | 公开(公告)日: | 2009-06-10 |
发明(设计)人: | 胡玥;高小宇;高庆狮 | 申请(专利权)人: | 北京科技大学 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京市中咨律师事务所 | 代理人: | 李 峥 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 形成 机器翻译 语义 单元 及其 表示 方法 系统 | ||
1.一种用于形成基于语义语言的自然语言机器翻译的语义单元及其表示库的方法,包括:
提取指定受限领域的语义单元及其双语或者多语语义单元及其表示;
创建所述指定受限领域的语义单元及其表示子库;以及
将所述多个指定受限领域的语义单元及其表示子库合并到原来的语义单元及其表示库,从而形成新的语义单元及其表示库。
2.根据权利要求1的形成语义单元及其表示库的方法,其中:
所述的提取语义单元及其双语或者多语语义单元及其表示包括提取指定场所或者领域或者情景的指定受限领域确定内容的语义单元及其双语或者多语表示;
所述的创建语义单元及其表示子库包括对所述语义单元及其表示进行去重复和去可弃处理,以形成双语或者多语语义单元及其表示子库。
3.根据权利要求2的形成语义单元及其表示库的方法,其中所述的提取指定受限领域的确定内容的语义单元及其双语或者多语表示步骤进一步包括:
控制逐句来注释句子;以及
提取该句语义单元及其双语或者多语表示。
4.根据权利要求2的形成语义单元及其表示库的方法,其中所述的对语义单元及其表示进行去重复和去可弃处理的步骤进一步包括:
逐句消去句中重复的语义单元及其表示;
逐句消去句中可弃的语义单元及其表示;以及
消去所述子库中重复的语义单元及其表示和可弃语义单元及其表示。
5.根据权利要求1的形成语义单元及其表示库的方法,其中还包括:
对所述合并了多个受限领域的语义单元及其表示子库的新的语义单元及其表示库,进行去重复、去可弃、和去非正常歧义处理。
6.一种用于形成基于语义语言的自然语言机器翻译的语义单元及其表示库的系统,包括:
用于提取指定受限领域的语义单元及其双语或者多语语义单元及其表示的装置;
用于创建所述指定受限领域的语义单元及其表示子库的装置;以及
用于将所述多个指定受限领域的语义单元及其表示子库合并到原来的语义单元及其表示库,以形成新的语义单元及其表示库的装置。
7.根据权利要求6所述的系统,其中:
所述用于提取语义单元及其双语或者多语语义单元及其表示的装置被配置来提取指定场所或者领域或者情景的指定受限领域的确定内容的语义单元及其双语或者多语表示;以及
所述用于创建语义单元及其表示子库的装置被配置来对所述语义单元及其表示进行去重复和去可弃处理,以形成双语或者多语语义单元及其表示子库。
8.根据权利要求6所述的系统,其中所述用于提取指定受限领域的确定内容的语义单元及其双语或者多语表示的装置进一步包括:
用于控制来逐句注释句子的装置;以及
用于提取该句语义单元及其双语或者多语表示的装置。
9.根据权利要求7的系统,其中所述用于创建语义单元及其表示子库的装置进一步包括:
用于逐句消去句中重复的语义单元及其表示的装置;
用于逐句消去句中可弃的语义单元及其表示的装置;以及
用于消去所述子库中重复的语义单元及其表示和可弃的语义单元及其表示的装置。
10.根据权利要求6的系统,其中用于合并多个受限领域的语义单元及其表示子库以形成新的语义单元及其表示库的装置被配置来进行去重复、去可弃、和去非正常歧义处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710197070.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:动作时间稳定的压缩机保护器
- 下一篇:显示器亮度调节方法及装置以及计算机