[发明专利]一种基于动态规划算法的知识图谱中文问答检索方法有效
申请号: | 201710858347.3 | 申请日: | 2017-09-21 |
公开(公告)号: | CN107679124B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 张日崇;王玥;许程;李建欣 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 动态 规划 算法 知识 图谱 中文 问答 检索 方法 | ||
1.一种基于动态规划算法的知识图谱中文问答检索方法,其特征在于,所述方法包括以下步骤:
步骤1,系统状态初始化,状态跳数设置为0,所述跳数为标记了从系统初始状态开始到当前状态共经历的状态转移次数;
步骤2,将自然语言问句经过分词处理得到词语序列,按顺序输入到系统中,每次输入一个词语;
步骤3,系统接收到词语后,对系统中所有存在的状态进行遍历,如果当前状态在以当前词语作为输入的情况下满足状态转移条件,则向下一个状态进行跳转,跳转后的状态跳数加1,并获取得分,如果不满足则原状态保持不变,等待下一个输入;
步骤4,重复步骤2到步骤3过程,直到整个序列输入完毕;
步骤5,选择最终得分最高的状态作为最终状态,其对应的内容作为系统输出返回给用户;
初始状态外的每个状态都代表了数据库中的一个实体,一个实体可以被多个状态所代表;
当系统接收到输入的词语之后,首先将输入词语加入到可用词列表,针对当前状态是否是初始状态有以下两种操作:如果是初始状态,将可用词列表中的词语组合起来成为新词语,到数据库内检索是否有以该词语命名的实体,如果有则进行状态转移,新状态所代表的实体即为被检索到的实体,得分设置为1,跳数设置为1,可用词列表清空,如果没有则结束等待下个词语输入;如果不是初始状态,则从数据库中提取中当前状态所代表实体的所有属性信息,再对属性信息一一遍历,获取与可用词列表的语义相似度。
2.如权利要求1所述的方法,其特征在于,在所述步骤3中,每一个状态维护一个可使用的词语列表,设定当前输入词语后,得到状态m的可使用词语列表,接着所述设定当前输入词语后状态m将这个词语加入到自己的可使用词语列表中得到新的列表,然后状态m再结合数据库使用所述新的列表进行检索与匹配,如果达到状态转移条件,则跳转到状态m+1,同时新状态的可使用词语列表变为空列表;如果未达到状态转移条件,则可使用词语列表维持原样,同时等待系统的下一个输入。
3.如权利要求1所述的方法,其特征在于,获取与可用词语义相似度的步骤为:预先使用从网络上搜集的大量中文语料训练中文语义向量模型,将中文词语转化成其在中文的语义空间中的向量表示形式,得到可用词列表中的所有词语的表征向量,将所述表征向量加和得到平均向量,再得到遍历到的属性名词语对应的语义向量,最后获得两个语义向量的余弦相似度;当所述相似度大于设定阈值时,则满足状态转移条件进行状态转移操作,转移后清空可用词列表,更新状态代表的实体,并获取得分,获取跳转后的得分β的处理规则如下:β=α×(1+γ-θ),其中,α为跳转之前的得分,γ为得到的语义相似度,θ为状态转移阈值。
4.如权利要求1所述的方法,其特征在于,在所述状态转移时,实体的状态可以由两条不同的路径经过多次状态转移达到,则此状态的得分由从一条路径中实体的状态所跳转得到的分数与从另一条路径中实体的状态所跳转得到分数相加而成,当问句序列输入完毕之后,在系统的所有状态中选择跳转次数最多且得分最高的状态作为输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710858347.3/1.html,转载请声明来源钻瓜专利网。