[发明专利]实现文本语义容错理解的方法及系统有效
申请号: | 201410196255.X | 申请日: | 2014-05-09 |
公开(公告)号: | CN105095178B | 公开(公告)日: | 2018-08-14 |
发明(设计)人: | 谢卿;王道广;彭丁辉;陈志刚;胡国平;胡郁;刘庆峰 | 申请(专利权)人: | 安徽科大讯飞医疗信息技术有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 王立民;吉海莲 |
地址: | 230088 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实现 文本 语义 容错 理解 方法 系统 | ||
本发明公开了一种实现文本语义容错理解的方法及系统,该方法包括:获取待解析的文本字串;基于预先构建的容错有向图文法网络对所述文本字串进行解码,获得解码路径;如果所述解码路径是精确匹配路径,则获取所述解码路径对应的语义信息,所述精确匹配路径是指所述匹配路径中不包含所述容错有向图文法网络中定义的可容错特殊标记;否则,基于预设的模糊词典对各解码路径进行模糊处理,得到优选的解码路径;获取所述优选的解码路径对应的语义信息。利用本发明,可以实现对句子短语等的具容错性的深层自然语言理解,提高自然语言理解系统的鲁棒性和准确性。
技术领域
本发明涉及自然语言处理技术领域,具体涉及一种实现文本语义容错理解的方法及系统。
背景技术
人工智能技术发展由来已久,而作为人工智能领域中最重要方向之一的自然语言理解技术也一直是研究的热点,可以说,让机器能理解自然语言是人类一直以来的梦想。特别是随着移动互联网时代的到来,人类进入了大数据时代,从海量数据中高效地分析和获取有价值的信息是未来技术发展的必然趋势。
传统的语义理解主要适用于准确文本字串的语义分析,特别是基于文法规则的自然语言理解,输入文本需要为精确文本,即不存在任何错别字或歧义字符的情况下,可以获得很好的语义理解结果。其具体流程如图1所示,主要步骤如下:
步一:设置句文法规则,所述句文法规则用于描述不同应用下可能的自然语言输入句法;
步二:对预置文法规则进行编译,得到有向图文法网络;
步三:在接收到自然语言输入(即文本输入)后,将输入的文本内容和预置的有向图文法网络进行匹配解析,并抽取相关语义,实现文本内容的自然语言理解。
这种基于精确文法网络匹配实现整句完全匹配的语义理解方式在实际应用中存在一定的缺点,如在打电话场景下,联系人姓名很可能音同字不同,在点歌和点播视频场景下,影视歌曲名称出现错漏字也很常见,在这种情况下,则无法对用户输入进行有效的分析和语义提取,限制了其应用范围。
发明内容
本发明实施例提供一种实现文本语义容错理解的方法及系统,以解决现有技术中输入的文本信息不完全符合预置的文法规则情况下语义理解的问题,提高自然语言理解系统的鲁棒性和准确性。
为此,本发明实施例提供如下技术方案:
一种实现文本语义容错理解的方法,包括:
获取待解析的文本字串;
基于预先构建的容错有向图文法网络对所述文本字串进行解码,获得解码路径;
如果所述解码路径是精确匹配路径,则获取所述解码路径对应的语义信息,所述精确匹配路径是指不包含所述容错有向图文法网络中定义的可容错特殊标记的匹配路径;
否则,基于预设的模糊词典对各解码路径进行模糊处理,得到优选的解码路径;
获取所述优选的解码路径对应的语义信息。
优选地,所述方法还包括:按以下方式构建容错有向图文法网络:
获取当前应用环境下的句文法规则;
对所述句文法规则进行容错设置,得到容错句文法规则;
对所述容错句文法规则进行编译,得到容错有向图文法网络。
优选地,所述基于预设的模糊词典对各解码路径进行模糊处理,得到优选的解码路径包括:
获取各解码路径中可容错特殊标记字段对应的文本子串;
基于预设的模糊词典对各可容错特殊标记字段对应的文本子串进行修正,获得最优修正结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞医疗信息技术有限公司,未经安徽科大讯飞医疗信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410196255.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:垃圾评论检测方法及设备
- 下一篇:具有内容插入功能的电子装置及其内容插入方法