[发明专利]主谓语识别方法、装置、设备及计算机可读存储介质有效
申请号: | 201910521578.4 | 申请日: | 2019-06-17 |
公开(公告)号: | CN110287487B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 周环宇;余淼;冯欣伟;戴松泰;宋勋超 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/253 | 分类号: | G06F40/253;G06F16/33;G06F16/332 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 主谓 识别 方法 装置 设备 计算机 可读 存储 介质 | ||
1.一种主谓语识别方法,其特征在于,包括:
通过主语预测模型确定用户问题中的至少一个预测主语,并确定所述预测主语的第一分值;
根据所述第一分值确定预设数量的备选预测主语,并根据所述备选预测主语确定谓语语句,并在所述谓语语句中确定至少一个预测谓语,并通过谓语预测模型确定所述预测谓语的第二分值;
根据所述第一分值、所述第二分值在所述预测主语、所述预测谓语的组合中,确定出目标主语、谓语的组合。
2.根据权利要求1所述的方法,其特征在于,所述通过主语预测模型确定用户问题中的至少一个预测主语,包括:
在所述用户问题中标注准实体;
在所述准实体中确定所述预测主语。
3.根据权利要求2所述的方法,其特征在于,所述在所述准实体中确定所述预测主语,包括:
在实体库中确定所述准实体的最长公共子串,并将所述最长公共子串作为所述预测主语。
4.根据权利要求3所述的方法,其特征在于,所述确定所述预测主语的第一分值,包括:
根据所述预测主语与所述准实体的重合程度,确定所述预测主语的第一分值。
5.根据权利要求2所述的方法,其特征在于,所述在所述准实体中确定所述预测主语,包括:
获取实体库中的实体对应的实体拼音,确定所述准实体对应的准实体拼音;
确定所述实体拼音与所述准实体拼音的编辑距离;
根据所述编辑距离在所述实体拼音中确定目标拼音,并将所述目标拼音对应的实体作为所述预测主语。
6.根据权利要求5所述的方法,其特征在于,所述确定所述预测主语的第一分值,包括:
根据所述预测主语与所述准实体的拼音编辑距离确定所述第一分值。
7.根据权利要求1所述的方法,其特征在于,所述通过谓语预测模型确定所述预测谓语的第二分值,包括:
根据所述谓语语句确定语句向量,根据所述预测谓语确定谓语向量;
根据所述语句向量、所述谓语向量确定所述第二分值。
8.根据权利要求7所述的方法,其特征在于,所述根据所述谓语语句确定语句向量,包括:
根据字级别字典确定所述谓语语句对应的语句字级别向量,根据词级别字典确定所述谓语语句对应的语句词级别向量;
将所述语句字级别向量输入第一bilstm,将所述语句词级别向量输入第二bilstm;
将第一bilstm输出的具备前后关系的语句字级别向量,与第二bilstm输出的具备前后关系的语句词级别向量进行联合,得到所述语句向量。
9.根据权利要求7所述的方法,其特征在于,所述根据所述预测谓语确定谓语向量,包括:
根据字级别字典确定所述预测谓语对应的谓语字级别向量,根据词级别字典确定所述预测谓语对应的谓语词级别向量;
获取所述预测谓语的并列实体,并根据字级别字典确定所述并列实体对应的实体字级别向量,根据词级别字典确定所述并列实体对应的实体词级别向量;
根据所述谓语字级别向量、所述谓语词级别向量、所述实体字级别向量、所述实体词级别向量,确定所述谓语向量。
10.根据权利要求9所述的方法,其特征在于,所述根据所述谓语字级别向量、所述谓语词级别向量、所述实体字级别向量、所述实体词级别向量,确定所述谓语向量,包括:
根据所述谓语字级别向量、所述实体字级别向量确定字级别向量平均值;
根据所述谓语词级别向量、所述实体词级别向量确定词级别向量平均值;
将所述字级别向量平均值、所述词级别向量平均值进行联合,得到所述谓语向量。
11.根据权利要求7所述的方法,其特征在于,所述根据所述语句向量、所述谓语向量确定所述第二分值,包括:
将所述语句向量与所述谓语向量的余弦相似度作为所述第二分值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910521578.4/1.html,转载请声明来源钻瓜专利网。