[发明专利]语句分析及人机交互方法和装置、计算设备、存储介质有效
申请号: | 201710966498.0 | 申请日: | 2017-10-17 |
公开(公告)号: | CN110019704B | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 黄光远;牛也;徐巍越;冯伟国 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35;G06F40/211 |
代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 屠长存 |
地址: | 开曼群岛大开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语句 分析 人机交互 方法 装置 计算 设备 存储 介质 | ||
1.一种语句分析方法,包括:
提取语句中的第一元素;
确定所述语句中与所述第一元素具有依存关系的第二元素;以及
基于所述第二元素,确定被否定的第一元素,
其中,使用二分类模型来确定所述第一元素是否被否定,该方法还包括:基于训练语料生成分别针对所述训练语料中各个第一元素的训练样本,所述训练样本包括所述第一元素、所述第二元素、所述第一元素与第二元素之间的依存关系、所述第一元素是否被否定的标注;以及
使用所述训练样本对所述二分类模型进行训练。
2.根据权利要求1所述的语句分析方法,还包括:
识别所述语句所属的领域,每个领域分别涉及预定的第一元素项目,
其中,在所述提取语句中的第一元素的步骤中,提取与所述语句所属领域的第一元素项目对应的第一元素。
3.根据权利要求1所述的语句分析方法,其中,
通过对所述语句进行依存句法分析,来确定所述语句中与所述第一元素具有依存关系的第二元素。
4.根据权利要求1所述的语句分析方法,其中,
基于所述第二元素,并参考所述第一元素与第二元素之间的依存关系类型,来确定所述第一元素是否被否定。
5.根据权利要求1-4中任何一项所述的语句分析方法,其中,
所述第二元素包括所述第一元素的父节点元素和/或子节点元素。
6.根据权利要求1-4中任何一项所述的语句分析方法,其中,
使用标注模型来提取所述语句中的第一元素。
7.根据权利要求6所述的语句分析方法,其中,
所述标注模型是条件随机场(CRF)模型或循环神经网络(RNN)模型;并且/或者
所述二分类模型是逻辑回归(LR)模型或渐进梯度决策树(GBDT)模型。
8.根据权利要求6所述的语句分析方法,还包括:
按照BIEO标注法对训练语料进行标注,以标注语料中第一元素的开始部分(B)、中间部分(I)及结束部分(E),以及其它字词(O);以及
使用经过标注的训练语料对所述标注模型进行训练。
9.一种人机交互方法,包括:
使用根据权利要求1-8中任何一项所述的语句分析方法,对语句进行分析,提取语句中的第一元素,并确定其中被否定的第一元素;以及
基于从所述语句中提取的第一元素以及所述第一元素是否被否定,作出对应的响应。
10.一种语句分析装置,包括:
元素提取装置,用于提取语句中的第一元素;
节点分析装置,用于确定所述语句中与所述第一元素具有依存关系的第二元素;以及
确定装置,用于基于所述第二元素,确定被否定的第一元素,
其中,所述确定装置使用二分类模型来确定所述第一元素是否被否定,所述语句分析装置还包括关系标注装置,用于基于训练语料生成分别针对所述训练语料中各个第一元素的训练样本,所述训练样本包括所述第一元素、所述第二元素、所述第一元素与第二元素之间的依存关系、所述第一元素是否被否定的标注,所述训练样本用于对所述二分类模型进行训练。
11.根据权利要求10所述的语句分析装置,还包括:
领域划分装置,用于识别所述语句所属的领域,每个领域分别涉及预定的至少一个第一元素项目,
其中,元素提取装置提取与所述语句所属领域的第一元素项目对应的第一元素。
12.根据权利要求10所述的语句分析装置,其中,
所述节点分析装置通过对所述语句进行依存句法分析,来确定所述语句中与所述第一元素具有依存关系的第二元素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710966498.0/1.html,转载请声明来源钻瓜专利网。