[发明专利]一种数据处理方法及服务器有效
申请号: | 201811147486.6 | 申请日: | 2018-09-29 |
公开(公告)号: | CN109408811B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 金继民;金宝宝;杨帆;张成松 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F16/332;G06F16/36 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 服务器 | ||
1.一种数据处理方法,其特征在于,包括:
获得问题语句;
确定所述问题语句的句子成分;
基于所述问题语句的句子成分确定所述问题语句所属的问句类别;
若所述问句类别属于预定问句类别,则对所述问题语句进行依存句法分析,得到所述问题语句的各组成元素间的依存信息;并基于所述问题语句的各组成元素间的依存信息以及所述问题语句的句子成分,对所述问题语句进行结构化解析,得到所述问题语句的结构化信息;
所述问题语句所属的问句类别为简单关系型问题、简单属性型问题及复杂关系属性型问题中的任意一种;所述简单关系型问题中仅包括一条关系线;所述简单属性型问题中不包括关系线,只对实体或实体类别的属性进行提问;所述复杂关系属性型问题中包括不少于两条的关系线,或者包括不少于一条的关系线及实体属性;
其中,所述关系线,是指在利用一个谓词将一个实体/实体类别与另一个实体/实体类别进行衔接,使得两个实体/实体类别间产生谓词关系后所得的两个实体/实体类别与谓词间的对应关系。
2.根据权利要求1所述的方法,其特征在于,所述确定所述问题语句的句子成分,包括:
确定所述问题语句的各组成元素中的实体及实体类别。
3.根据权利要求2所述的方法,其特征在于,所述确定所述问题语句的句子成分,还包括:确定所述问题语句的各组成元素中的属性及疑问词,所述属性包括实体属性和/或实体类别属性;
所述确定所述问题语句的各组成元素中的实体、实体类别、属性及疑问词,具体包括:
利用预定的实体识别方法,识别所述问题语句的各组成元素中的实体;
利用预定的疑问词识别方法,识别所述问题语句的各组成元素中的疑问词;
将所述问题语句中未被识别的各组成元素分别与预定的实体类别库、属性库进行匹配,得到所述问题语句的各组成元素中的实体类别及属性;所述实体类别库及所述属性库为分别预先对知识图谱进行相对应的实体类别信息抽取以及实体属性和/或实体类别属性信息抽取后所得的信息库;所述知识图谱为一预先基于多个语句样本所构建的包括多个节点的有向图,图中的每个节点对应一个实体或实体类别,每个实体对应零个或以上的实体属性、每个实体类别对应零个或以上的实体类别属性,任意两个节点之间的有向边用于表示边所连接的两个节点之间的关系。
4.根据权利要求3所述的方法,其特征在于,所述若所述问句类别属于预定问句类别,则对所述问题语句进行依存句法分析,得到所述问题语句的各组成元素间的依存信息,包括:
若所述问句类别属于预定问句类别,则基于所述问题语句中各组成元素间的实际依存情况,生成所述问题语句对应的第一依存句法树;
其中,所述第一依存句法树中的每个节点包括所述问题语句的一组成元素,节点间的父子关系对应节点所包括的组成元素间的依存关系。
5.根据权利要求4所述的方法,其特征在于,所述基于所述问题语句的各组成元素间的依存信息以及所述问题语句的句子成分,对所述问题语句进行结构化解析,得到所述问题语句的结构化信息,包括:
根据所述第一依存句法树中各个节点对应的组成元素所属的句子成分,构建第二依存句法树;所述第二依存句法树中的相应节点至少包括相应组成元素所属的句子成分,节点间的父子关系对应节点所包括的句子成分间的依存关系;
对所述第二依存句法树进行搜索处理,得到所述问题语句的至少一个三元组;每个三元组包括所述问题语句的主体-谓词-宾语信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811147486.6/1.html,转载请声明来源钻瓜专利网。