[发明专利]基于目标语句的依存句法分析方法、装置及服务器有效
申请号: | 201410386389.8 | 申请日: | 2014-08-07 |
公开(公告)号: | CN105335348B | 公开(公告)日: | 2018-10-02 |
发明(设计)人: | 吴胜兰;董凡 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉 |
地址: | 英属开曼群岛大开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 目标 语句 依存 句法 分析 方法 装置 服务器 | ||
1.一种目标语句的依存句法分析方法,其特征在于,该方法包括:
获取待分析的目标语句的目标词序列;
将所述目标词序列中的前两个目标词作为当前目标词,判断所述当前目标词是否都是骨干词,如果都是,则采用预置的动作预测骨干模型确定所述两个目标词之间依存关系的指向,并根据所述指向确定所述两个目标词之间的依存关系,如果有一个不是或者两个都不是,则采用预置的动作预测完整模型确定所述两个目标词之间依存关系的指向,并根据所述指向确定所述两个目标词之间的依存关系;其中,所述骨干词包括产品词以及动词;
参考所述目标词序列组成语句的顺序和所述确定的依存关系获取下两个待处理的目标词作为当前目标词,并执行所述判断所述当前目标词是否都是骨干词的步骤,直至所述目标词序列中的所有目标词都分析完毕为止。
2.根据权利要求1所述的方法,其特征在于,所述动作预测骨干模型采用下述方式训练:
提取样本语句中的骨干词序列;
获取针对所述骨干词序列进行依存句法树标注得到的骨干依存树;
将获取到的骨干依存树转换成一系列的骨干动作序列,所述骨干动作序列中的骨干动作包括所述样本语句中目标词之间依存关系的指向;
针对所述骨干动作序列中的每个当前骨干动作,从所述当前骨干动作涉及的目标词的上下文和所述当前骨干动作前所有骨干动作中抽取当前骨干特征,并将当前骨干动作的动作内容确定为与所述当前骨干特征对应的当前骨干类,其中,所述目标词的上下文为:所述目标词本身及其前后的部分目标词以及所述部分目标词的属性信息;
针对大量的样本语句,依据所述骨干动作序列中所有骨干动作的骨干特征和骨干类的映射,利用特定的机器学习算法训练得到动作预测骨干模型。
3.根据权利要求2所述的方法,其特征在于,所述采用预置的动作预测骨干模型确定所述两个目标词之间依存关系的指向,并根据所述指向确定所述两个目标词之间的依存关系,包括:
参考所述两个目标词的上下文和所述目标语句的至少一个历史骨干动作,采用动作预测骨干模型确定所述两个目标词之间的依存关系;其中,所述目标语句的至少一个历史骨干动作包括距离当前动作为止对所述目标语句中骨干词实施的骨干动作,所述骨干动作包括所述目标语句中骨干词之间依存关系的指向。
4.根据权利要求1所述的方法,其特征在于,所述动作预测完整模型采用下述方式训练:
获取针对样本语句的完整词序列进行依存句法树标注得到的完整依存树;
将获取到的完整依存树转换成一系列的完整动作序列;
针对所述完整动作序列中的每个当前完整动作,从所述当前完整动作涉及的完整目标词的上下文和所述当前完整动作前所有完整动作中抽取当前完整特征,并将当前完整动作的动作内容确定为与所述当前完整特征对应的当前完整类;
针对大量的样本语句,依据所述完整动作序列中所有完整动作的完整特征和完整类的映射,利用特定的机器学习算法训练得到动作预测完整模型。
5.根据权利要求4所述的方法,其特征在于,所述采用预置的动作预测完整模型确定所述两个目标词之间依存关系的指向,并根据所述指向确定所述两个目标词之间的依存关系,包括:
参考所述两个目标词的上下文和所述目标语句的至少一个历史完整动作,采用动作预测完整模型确定所述两个目标词之间的依存关系;其中,所述目标语句的至少一个历史完整动作包括距离当前动作为止对所述目标语句中目标词实施的动作,所述动作包括所述目标语句中目标词之间依存关系的指向。
6.根据权利要求1所述的方法,其特征在于,还包括:
依据所述目标语句的各个目标词之间的依存关系,提取所述目标语句的目标核心产品词。
7.根据权利要求6所述的方法,其特征在于,还包括:
响应于用户输入的关键词,搜索其包含的核心产品词与所述关键词匹配的目标语句;
将所述匹配的目标语句所对应的产品信息发送至客户端进行展现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410386389.8/1.html,转载请声明来源钻瓜专利网。