[发明专利]语义分析方法及装置、计算设备及可读介质在审
申请号: | 201811347302.0 | 申请日: | 2018-11-13 |
公开(公告)号: | CN111241841A | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 崔桐;邢少敏 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30 |
代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 屠长存 |
地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 分析 方法 装置 计算 设备 可读 介质 | ||
1.一种语义分析方法,其特征在于,所述方法包括:
获取目标语句;
对所述目标语句进行分析,获取关于所述目标语句的基础事实;
根据预设的多个推理规则,对所述基础事实进行推理处理,得到关于所述目标语句的多个推理事实;
基于多个所述推理事实,生成关于所述目标语句的语义分析结果。
2.根据权利要求1所述的方法,其特征在于,对所述目标语句进行分析,获取关于所述目标语句的基础事实,包括:
对所述目标语句进行词法分析和句法分析;
基于所述词法分析和所述句法分析的分析结果,获取关于所述目标语句的所述基础事实。
3.根据权利要求2所述的方法,其特征在于,对所述目标语句进行词法分析,包括:
对所述目标语句进行分词处理;
对所述分词处理后的各个分词进行词性标注和命名实体识别。
4.根据权利要求3所述的方法,其特征在于,对所述分词处理后的各个分词进行词性标注和命名实体识别之后,所述方法还包括:
采用词典对各所述分词的词性和命名实体进行校验,并针对有错误的进行纠正。
5.根据权利要求2所述的方法,其特征在于,对所述目标语句进行句法分析,包括:
对所述目标语句进行依存句法分析,获取所述目标语句的句子结构。
6.根据权利要求1所述的方法,其特征在于,基于多个所述推理事实,生成关于所述目标语句的语义分析结果,包括:
判断多个所述推理事实中是否存在互相冲突的推理事实对;
若存在,获取互相冲突的推理事实对中的各推理事实所采用的推理规则的优先级;
删除所述互相冲突的推理事实对中的优先级低的推理规则对应的推理事实,而保留优先级高的推理规则对应的推理事实;
根据留下的推理事实,生成关于所述目标语句的所述目标语义分析结果。
7.根据权利要求1所述的方法,其特征在于,获取目标语句之后,对所述目标语句进行分析,获取关于所述目标语句的基础事实之前,该方法还包括:
根据为当前应用场景预设的白名单,检测并确定所述目标语句适用于所述当前应用场景。
8.根据权利要求1所述的方法,其特征在于,根据预设的多条推理规则,对所述基础事实进行推理处理,得到关于所述目标语句的推理事实包括:
将所述预设的多条推理规则导入推理引擎中;
将所述基础事实输入到所述推理引擎中,获取所述推理引擎输出的多个所述推理事实。
9.根据权利要求1所述的方法,其特征在于,根据预设的多个推理规则,对所述基础事实进行推理处理,得到关于所述目标语句的多个推理事实之前,所述方法还包括:
接收配置的多个所述推理规则以及各所述推理规则的优先级;
存储多个所述推理规则以及各所述推理规则的优先级。
10.一种语义分析装置,其特征在于,所述装置包括:
语句获取模块,用于获取目标语句;
事实分析模块,用于对所述目标语句进行分析,获取关于所述目标语句的基础事实;
推理模块,用于根据预设的多个推理规则,对所述基础事实进行推理处理,得到关于所述目标语句的多个推理事实;
生成模块,用于基于多个所述推理事实,生成关于所述目标语句的语义分析结果。
11.根据权利要求10所述的装置,其特征在于,所述事实分析模块,包括:
词法分析单元,用于对所述目标语句进行词法分析
句法分析单元,用于对所述目标语句进行句法分析;
事实分析单元,用于基于所述词法分析和所述句法分析的分析结果,获取关于所述目标语句的所述基础事实。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811347302.0/1.html,转载请声明来源钻瓜专利网。