[发明专利]实现文本语义容错理解的方法及系统有效
申请号: | 201410196255.X | 申请日: | 2014-05-09 |
公开(公告)号: | CN105095178B | 公开(公告)日: | 2018-08-14 |
发明(设计)人: | 谢卿;王道广;彭丁辉;陈志刚;胡国平;胡郁;刘庆峰 | 申请(专利权)人: | 安徽科大讯飞医疗信息技术有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 王立民;吉海莲 |
地址: | 230088 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实现 文本 语义 容错 理解 方法 系统 | ||
1.一种实现文本语义容错理解的方法,其特征在于,包括:
获取待解析的文本字串;
基于预先构建的容错有向图文法网络对所述文本字串进行解码,获得解码路径;
如果所述解码路径是精确匹配路径,则获取所述解码路径对应的语义信息,所述精确匹配路径是指不包含所述容错有向图文法网络中定义的可容错特殊标记的匹配路径;
否则,基于预设的模糊词典对各解码路径进行模糊处理,得到优选的解码路径;
获取所述优选的解码路径对应的语义信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:按以下方式构建容错有向图文法网络:
获取当前应用环境下的句文法规则;
对所述句文法规则进行容错设置,得到容错句文法规则;
对所述容错句文法规则进行编译,得到容错有向图文法网络。
3.根据权利要求1所述的方法,其特征在于,所述基于预设的模糊词典对各解码路径进行模糊处理,得到优选的解码路径包括:
获取各解码路径中可容错特殊标记字段对应的文本子串;
基于预设的模糊词典对各可容错特殊标记字段对应的文本子串进行修正,获得最优修正结果;
将所述最优修正结果替换对应的解码路径中可容错特殊标记字段对应的文本子串,得到优选的解码路径。
4.根据权利要求3所述的方法,其特征在于,所述基于预设的模糊词典对各可容错特殊标记字段对应的文本子串进行修正,获得最优修正结果包括:
依次计算各可容错特殊标记字段对应的文本子串与所述模糊词典中的字串的匹配相似度得分;
选择具有最大匹配相似度得分的字串作为所述文本子串的替换对象;
选择所有文本子串的替换对象中具有最大匹配相似度得分的字串,将其作为最优修正结果。
5.根据权利要求4所述的方法,其特征在于,所述计算各可容错特殊标记字段对应的文本子串与所述模糊词典中的字串的匹配相似度得分包括:
根据音素发音相似性或基于文本字串的编辑距离度量计算各可容错特殊标记字段对应的文本子串与所述模糊词典中的字串的匹配相似度得分。
6.根据权利要求3至5任一项所述的方法,其特征在于,所述基于预设的模糊词典对各解码路径进行模糊处理,得到优选的解码路径还包括:
计算所述最优修正结果的置信度;
如果所述置信度大于设定的阈值,则执行所述将最优修正结果替换对应的解码路径中可容错特殊标记字段对应的文本子串,得到优选的解码路径的步骤;
否则,分别统计各解码路径中包含的所述容错有向图文法网络中的确定字符的个数,并根据所述个数更新所述解码路径的得分;
选择具有最大得分的解码路径作为优选的解码路径。
7.一种实现文本语义容错理解的系统,其特征在于,包括:
文本字串获取模块,用于获取待解析的文本字串;
解码模块,用于基于预先构建的容错有向图文法网络对所述文本字串进行解码,获得解码路径;
第一判断模块,用于判断所述解码路径是否为精确匹配路径,所述精确匹配路径是指不包含所述容错有向图文法网络中定义的可容错特殊标记的匹配路径;
语义获取模块,用于在所述第一判断模块判断所述解码路径是精确匹配路径后,获取所述解码路径对应的语义信息;
模糊处理模块,用于在所述第一判断模块判断所述解码路径不是精确匹配路径后,基于预设的模糊词典对各解码路径进行模糊处理,得到优选的解码路径;
所述语义获取模块,还用于获取所述优选的解码路径对应的语义信息。
8.根据权利要求7所述的系统,其特征在于,所述系统还包括:容错有向图文法网络构建模块,所述容错有向图文法网络构建模块包括:
句文法规则获取单元,用于获取当前应用环境下的句文法规则;
容错设置单元,用于对所述句文法规则进行容错设置,得到容错句文法规则;
编译单元,用于对所述容错句文法规则进行编译,得到容错有向图文法网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞医疗信息技术有限公司,未经安徽科大讯飞医疗信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410196255.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:垃圾评论检测方法及设备
- 下一篇:具有内容插入功能的电子装置及其内容插入方法