[发明专利]实体库生成方法及装置在审
申请号: | 201710916101.7 | 申请日: | 2017-09-30 |
公开(公告)号: | CN107807957A | 公开(公告)日: | 2018-03-16 |
发明(设计)人: | 余晓龙;张华泉;王浩;张向征;邬小鹏 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京智汇东方知识产权代理事务所(普通合伙)11391 | 代理人: | 康正德,孙晓芳 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 生成 方法 装置 | ||
1.一种实体库生成方法,包括:
基于垂直搜索类网站数据建立实体知识图谱;
根据用户的搜索历史记录解析出所述用户的历史搜索行为所涉及的需求实体的相关信息;
以需求实体作为关键词,结合所述实体知识图谱与所述用户的历史搜索行为所涉及的需求实体的相关信息生成实体库。
2.根据权利要求1所述的方法,其中,所述根据用户的搜索历史记录解析出所述用户的历史搜索行为所涉及的需求实体的相关信息,包括:
获取所述用户的搜索日志和/或点击日志,基于所述搜索日志和/或点击日志对所述用户的历史点击信息做实体链接和/或主题分类,解析出所述历史点击信息所涉及的需求实体的相关信息。
3.根据权利要求1或2所述的方法,其中,所述以需求实体作为关键词,结合所述实体知识图谱与所述用户的历史搜索行为所涉及的需求实体的相关信息生成实体库,包括:
以需求实体作为关键词,结合所述实体知识图谱以及所述用户的历史搜索行为所涉及的需求实体和/或与该需求实体对应的需求类型建立用户需求点击模型,生成包括所述用户需求点击模型的实体库。
4.根据权利要求1-3任一项所述的方法,其中,所述以需求实体作为关键词,结合所述实体知识图谱以及所述用户的历史搜索行为所涉及的需求实体和/或与该需求实体对应的需求类型建立用户需求点击模型,生成包括所述用户需求点击模型的实体库,包括:
以需求实体作为关键词,对所述用户的历史搜索行为所涉及的需求实体和/或与该需求实体对应的需求类型进行聚合,生成实体需求队列;
根据所述用户的历史点击信息计算需求强度,将所述需求强度添加至所述实体需求队列中,生成包括所述用户需求点击模型的实体库。
5.根据权利要求1-4任一项所述的方法,其中,所述以需求实体作为关键词,结合所述实体知识图谱以及所述用户的历史搜索行为所涉及的需求实体和/或与该需求实体对应的需求类型建立用户需求点击模型,生成包括所述用户需求点击模型的实体库之后,还包括:
以预设周期更新所述用户需求点击模型。
6.根据权利要求1-5任一项所述的方法,其中,所述以预设周期更新所述用户需求点击模型,包括:
通过在线学习方法建立实时点击反馈模型,以所述预设周期监测用户的实体需求变化,通过在线反馈机制调整所述用户需求点击模型中的实体需求队列的排序。
7.一种实体库生成装置,包括:
建立模块,配置为基于垂直搜索类网站数据建立实体知识图谱;
解析模块,配置为根据用户的搜索历史记录解析出所述用户的历史搜索行为所涉及的需求实体的相关信息;
实体库生成模块,配置为以需求实体作为关键词,结合所述实体知识图谱与所述用户的历史搜索行为所涉及的需求实体的相关信息生成实体库。
8.根据权利要求7所述的装置,其中,所述解析模块还配置为:
获取所述用户的搜索日志和/或点击日志,基于所述搜索日志和/或点击日志对所述用户的历史点击信息做实体链接和/或主题分类,解析出所述历史点击信息所涉及的需求实体的相关信息。
9.一种计算机程序,包括计算机可读代码,当所述计算机可读代码在计算设备上运行时,导致所述计算设备执行如权利要求1至6任一项所述的实体库生成方法。
10.一种计算机可读介质,其中存储了如权利要求9所述的计算机程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710916101.7/1.html,转载请声明来源钻瓜专利网。