[发明专利]面向神经网络机器翻译的日语动词识别、词性标注方法有效
申请号: | 201911028262.8 | 申请日: | 2019-10-25 |
公开(公告)号: | CN110781667B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 张孝飞;诸敏刚;葛昱晖;陈莉莉;周聪 | 申请(专利权)人: | 北京中献电子技术开发有限公司 |
主分类号: | G06F40/253 | 分类号: | G06F40/253;G06F40/30;G06F40/58;G06N3/04;G06N3/08 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 鄢功军 |
地址: | 100081 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及机器翻译技术领域,尤其涉及一种面向神经网络机器翻译的日语动词识别、词性标注方法及系统。该方法包括以下步骤:S100、删除日语文本中的左邻接标志和结尾标志的特殊词汇;S200、查找选取得到候选动词;S300、切分得到待还原候选动词,对候选动词进行还原,若验证其正确,则该候选动词还原成功;S400、对还原成功的动词及其变形词尾进行切分,标注词性及其语法意义。本发明通过加入二次判断机制及完善复合动词的识别处理规则,提高了动词识别的准确度;同时对动词及其变形词尾进行词干、词尾、可能表现、时、态、情态的切分,有效提高了词法分析的准确性,从而有效提升了译文质量。 | ||
搜索关键词: | 面向 神经网络 机器翻译 日语 动词 识别 词性 标注 方法 | ||
【主权项】:
1.一种面向神经网络机器翻译的日语动词识别、词性标注方法,其特征在于,包括以下步骤:/nS100、检索并标注日语文本中包含候选动词查找时的左邻接标志和结尾标志的特殊词汇,不参与后续的动词识别,其中,左邻接标志为字符或字符串,结尾标志为字符;/nS200、检索左邻接标志和候选动词结尾标志,查找选取得到候选动词;/nS300、将左邻接标志的下一个字符至S200中得到的候选动词结尾标志字符部分切分出来作为待还原候选动词,对候选动词进行还原,并通过查词典的方式验证其是否正确,若正确,则该候选动词还原成功;/nS400、在确认还原成功后,对还原成功的动词及其变形词尾进行词干·词尾·可能表现·时·态·情态等语法意义上的切分,标注词性,并注明其语法意义。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中献电子技术开发有限公司,未经北京中献电子技术开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911028262.8/,转载请声明来源钻瓜专利网。