[发明专利]一种用于垂直领域的概念关系构建方法和装置有效
申请号: | 201510050050.5 | 申请日: | 2015-01-30 |
公开(公告)号: | CN104598613B | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 李婷婷;孙连生;王超越;赵世奇 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州三环专利商标代理有限公司44202 | 代理人: | 温旭,郝传鑫 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 垂直 领域 概念 关系 构建 方法 装置 | ||
1.一种用于垂直领域的概念关系构建方法,其特征在于,包括:
根据垂直领域知识中的概念层级关系和概念同位关系、用户的搜索行为、用户的点击行为中的一者或一者以上确定概念的紧密性关系,
其中,所述概念的紧密性关系用于描述垂直领域内同一属性下的两两概念之间在满足用户需求方面的关联度;
其中,所述根据垂直领域知识中的概念层级关系和概念同位关系、用户的搜索行为、用户的点击行为中的一者或一者以上确定概念的紧密性关系包括:
通过概念a和概念b之间的概念路径距离route_dis倒数的自然对数表述所述概念层级关系,进一步确定出与所述概念层级关系正相关的概念层级维度上的紧密性关系的取值,
其中,对于无转折路径,概念路径距离route_dis为单边距离e_dis的累加∑e_dis,对于带转折路径,概念路径距离route_dis为单边距离e_dis的累加∑e_dis与路径转折惩罚t_penalty的乘积,单边距离e_dis为概念细化距离g_dis与概念层级惩罚g_penalty的乘积或概念泛化距离r_dis与概念层级惩罚g_penalty的乘积,
其中,单边距离e_dis为一个属性层级关系树中两个直接相连的概念之间的路径距离,概念细化距离g_dis为按方向的上层概念到下层概念的路径距离,概念泛化距离r_dis为下层概念到上层概念的路径距离,概念层级惩罚g_penalty用于表征单边距离的概念细化和概念泛化程度,根据层级关系树中每层的概念数n确定,路径转折惩罚t_penalty用于表征概念间的转意程度,根据层级关系树深度H和路径最高层级节点深度h确定。
2.根据权利要求1所述的方法,其特征在于,根据垂直领域知识中的概念层级关系和概念同位关系、用户的搜索行为、用户的点击行为中的一者或一者以上确定概念的紧密性关系包括:
获取单个用户搜索行为的先后查询序列,形成一个或一个以上第一类二元组<查询1,查询2>,并将所述一个或一个以上第一类二元组合并形成第二类二元组<句子1,句子2>,确定所述第二类二元组中句子1包含概念a且不包含与a同一属性的其他概念、句子2包含概念b且不包含与b同一属性的其他概念的次数,作为概念a和概念b的在单用户搜索行为维度的紧密共现频次cp(a,b),并根据所述单用户搜索行为维度的紧密共现频次确定单用户搜索行为维度的紧密性关系的取值;和/或
获取多个用户搜索行为中多用户点击到同一检索结果的查询集合,将所述查询集合中的两两查询形成一个或一个以上的第三类二元组<查询3,查询4>,并将所述一个或一个以上第三类二元组合并形成第四类二元组<句子3,句子4>,确定所述第四类二元组中句子3包含概念a且不包含与a同一属性的其他概念、句子4包含概念b且不包含与b同一属性的其他概念的次数,作为概念a和概念b的在多用户搜索行为维度的紧密共现频次cp(a,b),并根据所述多用户搜索行为维度的紧密共现频次cp(a,b)计算多用户搜索行为维度的紧密性关系的取值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510050050.5/1.html,转载请声明来源钻瓜专利网。