[发明专利]用于确定语句意图的方法和装置有效

专利信息
申请号: 201710966728.3 申请日: 2017-10-17
公开(公告)号: CN107679039B 公开(公告)日: 2020-12-29
发明(设计)人: 戴祥鹰;林义明;郭辉;周辉;陈亮;罗雨 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: G06F40/30 分类号: G06F40/30;G06F40/284
代理公司: 北京英赛嘉华知识产权代理有限责任公司 11204 代理人: 王达佐;马晓亚
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 确定 语句 意图 方法 装置
【说明书】:

本申请实施例公开了用于确定语句意图的方法和装置。该方法的一具体实施方式包括:获取待确定意图的语句;生成主干词语序列,主干词语序列包括以下至少一项:语句中的主干词、由语句中相邻的主干词组成的词组、由语句中的相同词性的主干词中相邻的主干词组成的词组;确定候选意图词集合,候选意图词为与主干词语序列中的主干词语的相似度大于相似度阈值的预设意图词,预设意图词为预先从语句所属的领域的知识图谱中的词语中选取的用于表达意图的词;基于每个候选意图词在知识图谱中的扩展信息组成的扩展语句和语句的相似度关系,确定语句的意图词并将确定出的意图词对应的意图作为语句的意图。该实施方式提高了意图分析的效率。

技术领域

本申请实施例涉及计算机技术领域,具体涉及互联网技术领域, 尤其涉及用于确定语句意图的方法和装置。

背景技术

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开 发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的 一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解 智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的 智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语 言处理和专家系统等。

人工智能的目标是搭建一个通用的对话系统,而自动问答系统作 为与对话系统最接近的形态,一直是人工智能研究的重点方向。在自 动问答系统中,问题意图分析至关重要。

现有的问题分析通常需要标注预先定义的特定领域的意图词集 合,然后根据标注来构建提问语句中的实体与预定义的意图词集合的 映射词典。

发明内容

本申请实施例的目的在于提出一种用于确定语句意图的方法和装 置。

第一方面,本申请实施例提供了一种用于确定语句意图的方法, 该方法包括:获取待确定意图的语句;生成主干词语序列,主干词语 序列包括以下至少一项:待确定意图的语句中的主干词、由待确定意 图的语句中相邻的主干词组成的词组、由待确定意图的语句中的相同 词性的主干词中相邻的主干词组成的词组;基于预设意图词集合和主 干词语序列确定候选意图词集合,候选意图词为与主干词语序列中的 主干词语的相似度大于相似度阈值的预设意图词,预设意图词为预先 从待确定意图的语句所属的领域的知识图谱中的词语中选取的用于表 达意图的词;基于候选意图词集合中的每个候选意图词在知识图谱中 的扩展信息组成的扩展语句和待确定意图的语句的相似度关系,确定 待确定意图的语句的意图词并将确定出的意图词对应的意图作为待确 定意图的语句的意图。

在一些实施例中,生成主干词语序列包括:对待确定意图的语句 进行切分并去掉停用词;标注切分后的词的词性;基于标注的词性提 取主干词,生成候选主干词语序列,候选主干词语序列中主干词的顺 序与待确定意图的语句中主干词的顺序一致;对于由候选主干词语序 列中相邻的主干词组成的任一词组或者由候选主干词语序列的相同词 性的主干词中相邻的主干词组成的任一词组,将该词组与待确定意图 的语句所属领域的知识图谱中的词语进行匹配,响应于匹配成功,在 候选主干词语序列中将组成该词组的主干词替换成该词组;将替换后 的候选主干词语序列确定为主干词语序列。

在一些实施例中,基于预设意图词集合和主干词语序列确定候选 意图词集合包括:确定预设意图词集合中的预设意图词和主干词语序 列中的主干词语在预设词向量模型中对应的词向量,预设词向量模型 通过对待确定意图的语句所属领域的语料库中的词语预先进行训练而 生成;基于确定出的词向量,从预设意图词集合中查找与主干词语序列中的主干词语的相似度大于相似度阈值的预设意图词,将查找出的 预设意图词作为候选意图词。

在一些实施例中,基于候选意图词集合中的每个候选意图词在知 识图谱中的扩展信息组成的扩展语句和待确定意图的语句的相似度关 系确定待确定意图的语句的意图词包括:计算每个候选意图词对应的 扩展语句与待确定意图的语句之间的相似度;将与待确定意图的语句 相似度最高的扩展语句对应的候选意图词确定为待确定意图的语句的意图词。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710966728.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top