[发明专利]可拓展的用户意图挖掘方法及其系统在审
申请号: | 201511026505.6 | 申请日: | 2015-12-29 |
公开(公告)号: | CN105677780A | 公开(公告)日: | 2016-06-15 |
发明(设计)人: | 商玥;郭立帆;丁婉莹;宋晓利;刘梦雯;汪灏泓 | 申请(专利权)人: | TCL集团股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/04 |
代理公司: | 深圳市君胜知识产权代理事务所 44268 | 代理人: | 王永文 |
地址: | 516006 广东省惠州市仲恺高*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 拓展 用户 意图 挖掘 方法 及其 系统 | ||
技术领域
本发明涉及数据处理及用户交互技术领域,尤其涉及一种可拓展 的用户意图挖掘方法及其系统。
背景技术
如今,遍及全世界,每秒都能生成成百上万个搜索结果的搜索引 擎已经成为现代人生活中不可或缺的一部分。随着网络信息的爆炸性 增长,网络搜索服务的关键之处在于通过简短的搜索条件来尽可能的 匹配用户偏好从而更好的理解用户的需求。所述搜索引擎在人类生活 中扮演着重要的角色,并且通过向用户提供信息极大的促进了日常生 活的便利。
但是,对于计算机而言,理解人类的搜索意图是很困难的。由于 缺乏在某些场景中的个人信息以及当寻找相类似用户群时所需要的 大量计算,个性化的搜索是一个很有挑战性的问题。
不同的人均有不同的爱好。即使是对于一个用户,其爱好也有可 能随时间而改变。因此,能够满足个性化搜索需求和适应用户意图随 时间的变化的在线搜索服务是非常必要的。因此,特定的用户信息(例 如,用户文档、用户搜索历史、在先观看的内容等等)可以作为定义 用户意图的标识。
本发明公开的方法及其系统用于解决现有技术中的一个或者多 个问题。
发明概述
本发明的一方面公开了一种可拓展的用户意图挖掘方法。所述方 法包括:在公共搜索日志数据集的若干搜索日志中检测第一命名实体 并且基于所述第一命名实体,生成与所述第一命名实体对应的若干搜 索日志的第一特征。还包括在所述第一特征上应用所述多模型的限制 玻尔兹曼机从而训练公共多模型限制玻尔兹曼机,生成公共搜索项目 的表示;获取用户的搜索项目,判断是否存在用户的搜索历史。当不 存在用户的搜索历史时,使用所述公共多模型限制玻尔兹曼机来预测 用户意图,并且当存在用户的搜索历史时,在所述搜索历史上应用所 述公共多模型限制玻尔兹曼机从而训练个人多模型限制玻尔兹曼机, 并使用所述个人多模型限制玻尔兹曼机来预测用户意图。
本发明另一方面公开了可拓展的用户意图挖掘系统。所述系统包 括:第一命名实体检测单元,用于在公共搜索日志数据集的若干搜索 日志中检测第一命名实体;第一特征生成单元,用于基于所述第一命 名实体,生成与所述第一命名实体对应的搜索日志的第一特征;公共 多模型限制玻尔兹曼机学习单元,用于在所述第一特征中应用多模型 的限制玻尔兹曼机从而生成公共搜索项目的表示;个人模型学习模块, 用于在用户的搜索历史中应用多模型的限制玻尔兹曼机从而训练个 人多模型限制玻尔兹曼机;以及意图挖掘模块,用于使用所述公共多 模型限制玻尔兹曼机和个人多模型玻尔兹曼机预测用户意图。
本发明的再一方面公开了一个存储有用于执行可拓展的用户意 图挖掘的操作的计算机可执行指令的计算机可读存储模块。所述计算 机可执行指令包括:在公共搜索日志数据集的搜索日志中检测第一命 名实体;基于所述第一命名实体,生成与所述第一命名实体对应的若 干搜索日志的第一特征;在所述第一特征上应用所述多模型的限制玻 尔兹曼机从而训练公共模型限制玻尔兹曼机;生成公共搜索项目的表 示;获取用户的搜索项目;判断是否存在用户的搜索历史;当不存在 用户的搜索历史时,使用所述公共多模型限制玻尔兹曼机来预测用户 意图,并且当存在用户的搜索历史时,在所述搜索历史上应用所述公 共多模型限制玻尔兹曼机从而训练个人多模型限制玻尔兹曼机,并使 用所述个人多模型限制玻尔兹曼机来预测用户意图。
本发明的其他方面,所属技术领域技术人员能够依据本发明的权 利要求书,说明书,以及附图有效实施并充分公开。
附图简要说明
图1为本发明具体实施方式的工作环境示意图。
图2本发明具体实施方式的计算系统的结构框图。
图3为本发明具体实施方式的可拓展的多模型学习系统的结构框 图。
图4为本发明具体实施方式的可拓展的用户意图挖掘方法的流程 图。
图5为本发明具体实施方式的限制玻尔兹曼机的示意图。
图6为本发明具体实施方式的使用URL数据训练限制玻尔兹曼机的 示意图。
图7为本发明具体实施方式的使用搜索文本数据训练限制玻尔兹 曼机的示意图。
图8为本发明具体实施方式的用于多类型输入数据的多模型学习 系统的示意图。
图9为本发明具体实施方式的多模型限制玻尔兹曼机预测用户意 图的示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于TCL集团股份有限公司,未经TCL集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511026505.6/2.html,转载请声明来源钻瓜专利网。