[发明专利]可拓展的用户意图挖掘方法及其系统在审
申请号: | 201511026505.6 | 申请日: | 2015-12-29 |
公开(公告)号: | CN105677780A | 公开(公告)日: | 2016-06-15 |
发明(设计)人: | 商玥;郭立帆;丁婉莹;宋晓利;刘梦雯;汪灏泓 | 申请(专利权)人: | TCL集团股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/04 |
代理公司: | 深圳市君胜知识产权代理事务所 44268 | 代理人: | 王永文 |
地址: | 516006 广东省惠州市仲恺高*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 拓展 用户 意图 挖掘 方法 及其 系统 | ||
1.一种可拓展的用户意图挖掘方法,其特征在于,包括如下步 骤:
在公共搜索日志数据集的若干搜索日志中检测第一命名实体;
基于所述第一命名实体,生成与所述第一命名实体对应的若干 搜索日志的第一特征;
在所述第一特征上应用所述多模型的限制玻尔兹曼机从而训 练公共多模型限制玻尔兹曼机;
生成公共搜索项目的表示;
获取用户的搜索项目;
判断是否存在用户的搜索历史;
当不存在用户的搜索历史时,使用所述公共多模型限制玻尔兹 曼机来预测用户意图,并且当存在用户的搜索历史时,在所述搜索历 史上应用所述公共多模型限制玻尔兹曼机从而训练个人多模型限制 玻尔兹曼机,并使用所述个人多模型限制玻尔兹曼机来预测用户意图。
2.根据权利要求1所述的可拓展的用户意图挖掘方法,其特征 在于,所述用户的搜索历史具体为:在预定的时间段内,所述用户的 前M个搜索项目;其中M为大于1的整数。
3.根据权利要求1所述的可拓展的用户意图挖掘方法,其特征 在于,所述“在所述搜索历史上应用所述公共多模型限制玻尔兹曼机 从而训练个人多模型限制玻尔兹曼机”的步骤具体包括:
检测用户的搜索历史的第二命名实体;基于所述第二命名实体, 生成与用户搜索历史相对应的第二特征;
使用所述公共多模型限制玻尔兹曼机,生成至少一个用户搜索 历史的个人搜索项目的表示基于所述至少一个个人搜索项目的表示, 比较所述个人搜索项目的表示与公共搜索项目的表示从而寻找一个 或者多个与所述用户具有至少一个相类似特征的相类似用户,并且 使用所述一个或者多个的相类似用户的数据训练所述公共多模型限 制玻尔兹曼机来生成所述个人多模型限制玻尔兹曼机。
4.根据权利要求1所述的可拓展的用户意图挖掘方法,其特征 在于,所述方法还包括:
基于所述预测的用户意图,向用户展示至少一个搜索结果。
5.根据权利要求3所述的可拓展的用户意图挖掘方法,其特征 在于,所述“比较所述个人搜索项目的表示与公共搜索项目的表示从 而寻找一个或者多个与所述用户具有至少一个相类似特征的相类似 用户”的步骤具体包括:
基于所述至少一个个人搜索项目的表示,计算与其相似的,在 公共搜索日志数据集中的搜索项目的第一命名实体;
基于相似的第一命名实体,收集相似的第一命名实体的搜索项 的ID,其中所述ID表示具有至少一个与所述用户相类似的兴趣的相 类似用户,并且
基于收集获得的ID,建立包括用户的搜索历史以及一个或多 个相类似用户的若干搜索项目的新数据库。
6.根据权利要求3所述的可拓展的用户意图挖掘方法,其特征 在于,所述“检测用户的搜索历史的第二命名实体”的步骤具体包括: 使用点互信息优化公共搜索日志数据集的n-gram模型;其中,n为 小于等于7的整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于TCL集团股份有限公司,未经TCL集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511026505.6/1.html,转载请声明来源钻瓜专利网。