[发明专利]一种修正自然语言理解模块的方法、装置及电子设备在审
申请号: | 201811577608.5 | 申请日: | 2018-12-20 |
公开(公告)号: | CN109783808A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 张贺 | 申请(专利权)人: | 出门问问信息科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京睿派知识产权代理事务所(普通合伙) 11597 | 代理人: | 刘锋 |
地址: | 100190 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然语言理解模块 修正 统计模型 语法规则 装置及电子设备 自然语言文本 补充 解析 人力资源 速度比较 人工的 更新 | ||
1.一种修正自然语言理解模块的方法,其特征在于,包括:
获取自然语言理解模块解析错误的自然语言文本;
根据所述解析错误的自然语言文本确定补充语法规则和补充统计模型;
根据所述补充语法规则和补充统计模型分别对所述自然语言理解模块进行修正,确定更新后的自然语言理解模块。
2.如权利要求1所述的方法,其特征在于,所述根据所述解析错误的自然语言文本确定补充语法规则和补充统计模型,具体包括:
根据所述解析错误的自然语言文本生成具有预定方式的补充语法规则;
根据所述补充语法规则,确定所述补充统计模型。
3.如权利要求2所述的方法,其特征在于,所述预定方式为正则表达式。
4.如权利要求2所述的方法,其特征在于,所述根据所述补充语法规则,确定所述补充统计模型,具体包括:
响应于相同垂直领域下的所述补充语法规则的数量达到设定阈值,将所述达到设定阈值的所述补充语法规则添加到训练所述补充统计模型的训练集合;
基于预定算法根据所述训练集合训练获取所述补充统计模型,其中,所述预定算法为最大熵算法、支持向量机算法或者神经网络算法。
5.如权利要求4所述的方法,其特征在于,所述训练集合中还包括通过领域知识库对模板进行扩展后确定的训练数据,其中,所述模板根据所述解析错误的自然语言文本以及所述解析错误的自然语言文本对应的正确的解析结果确定的。
6.如权利要求2所述的方法,其特征在于,根据所述补充语法规则,确定所述补充统计模型之后,该方法还包括:
根据所述补充统计模型解析所述解析错误的自然语言文本;
响应于解析正确,将所述解析错误的自然语言文本以及对应的正确的解析结果添加到回归测试数据集。
7.如权利要求1所述的方法,其特征在于,所述根据所述补充语法规则和补充统计模型分别对所述自然语言理解模块进行修正,确定更新后的自然语言理解模块,具体包括:
根据所述补充语法规则对所述自然语言理解模块中的原始语法规则进行修正,确定更新后的语法规则,同时根据所述补充统计模块对所述自然语言理解模块中的原始统计模块进行修正,确定更新后的统计模块;
根据所述更新后的语法规则和所述更新后的统计模块确定更新后的自然语言理解模块。
8.一种修正自然语言理解模块的装置,其特征在于,包括:
获取单元,用于获取自然语言理解模块解析错误的自然语言文本;
确定单元,用于根据所述解析错误的自然语言文本确定补充语法规则和补充统计模型;
修正单元,用于根据所述补充语法规则和补充统计模型分别对所述自然语言理解模块进行修正,确定更新后自然语言理解模块。
9.一种电子设备,包括存储器和处理器,其特征在于,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储计算机程序指令,其特征在于,所述计算机程序指令在被处理器执行时实现如权利要求1-7任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于出门问问信息科技有限公司,未经出门问问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811577608.5/1.html,转载请声明来源钻瓜专利网。