[发明专利]一种基于规则与学习的语义解析方法、装置和电子设备有效
申请号: | 202011595286.4 | 申请日: | 2020-12-30 |
公开(公告)号: | CN112347793B | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 钱泓锦;李晓桐;刘占亮;杨玉树;窦志成;曹岗;文继荣 | 申请(专利权)人: | 北京智源人工智能研究院 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/194;G06F40/56;G06N20/00 |
代理公司: | 北京动力号知识产权代理有限公司 11775 | 代理人: | 梁艳;白婉露 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 规则 学习 语义 解析 方法 装置 电子设备 | ||
1.一种基于规则与学习的语义解析方法,其特征在于,包括:
基于规则集中的原有规则识别自然语言语句,生成结构化语句;
判断所述结构化语句是否能完整的表达所述自然语言语句的语义;如果不能,则获取所述自然语言语句和所述结构化语句的差异文本;
将所述差异文本输入预先训练的学习模型,生成新的规则;
利用所述新的规则更新所述规则集;
所述判断所述结构化语句是否能完整的表达所述自然语言语句的语义,包括:
计算所述结构化语句对所述自然语言语句的拟合度;
判断计算得到的拟合度是否达到拟合度阈值,如果未达到拟合度阈值,则所述结构化语句未能完整的表达所述自然语言语句的语义;
按照下式计算所述拟合度:
其中为文本编辑距离函数,为所述自然语言语句,为所述结构化语句,为由生成的自然语言文本;
所述获取所述自然语言语句和所述结构化语句的差异文本包括:
根据和的差异生成所述差异文本。
2.如权利要求1所述的基于规则与学习的语义解析方法,其特征在于,将所述差异文本输入预先训练的学习模型,生成新的规则包括:
判断差异文本的数量是否达到预设阈值,若是,则将所述差异文本输入预先训练的学习模型。
3.如权利要求1所述的基于规则与学习的语义解析方法,其特征在于,所述利用所述新的规则更新所述规则集包括:
对所述新的规则进行除冗操作,得到除冗后的新规则;
将所述除冗后的新规则加入所述规则集并与所述规则集中的原有规则进行除冗操作,得到更新后的规则集。
4.如权利要求3所述的基于规则与学习的语义解析方法,其特征在于,所述除冗操作包括:
计算待除冗操作的两个规则的文本编辑距离,当所述文本编辑距离低于距离阈值时,将待除冗操作的两个规则合并为一个规则。
5.一种基于规则与学习的语义解析装置,其特征在于,包括:
规则解析模块,用于基于规则集中的原有规则识别自然语言语句,生成结构化语句;
判断模块,用于判断所述结构化语句是否能完整的表达所述自然语言语句的语义;如果不能,则获取所述自然语言语句和所述结构化语句的差异文本,包括:根据和的差异生成所述差异文本;所述判断模块具体的用于:
计算所述结构化语句对所述自然语言语句的拟合度;
判断计算得到的拟合度是否达到拟合度阈值,如果未达到拟合度阈值,则所述结构化语句未能完整的表达所述自然语言语句的语义;
其中,按照下式计算所述拟合度:
其中为文本编辑距离函数,为所述自然语言语句,为所述结构化语句,为由生成的自然语言文本;
新规则生成模块,用于将所述差异文本输入预先训练的学习模型,生成新的规则;
更新模块,用于利用所述新的规则更新所述规则集。
6.一种存储器,其特征在于,存储有多条指令,所述指令用于实现如权利要求1-4任一项所述的方法。
7.一种电子设备,其特征在于,包括处理器和与所述处理器连接的存储器,所述存储器存储有多条指令,所述指令可被所述处理器加载并执行,以使所述处理器能够执行如权利要求1-4任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智源人工智能研究院,未经北京智源人工智能研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011595286.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防水型的轮胎硫化模具
- 下一篇:一种防撬防砸的锁门装置