[发明专利]基于实体检索词的用户行为意图挖掘方法有效
申请号: | 201911395464.6 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111159348B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 丁俊;王勇;石佳;戴岳;郭锐;谭文韬;周佳威;周震海;钮佳伟;陆超;唐智敏;崔鲁;周仰东 | 申请(专利权)人: | 苏州电力设计研究院有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33 |
代理公司: | 苏州创元专利商标事务所有限公司 32103 | 代理人: | 孙仿卫 |
地址: | 215000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 实体 检索 用户 行为 意图 挖掘 方法 | ||
1.一种基于实体检索词的用户行为意图挖掘方法,用于根据用户提供的实体检索词分析挖掘用户的行为意图并得到用户的潜在行为列表,其特征在于:所述基于实体检索词的用户行为意图挖掘方法包括以下步骤:
步骤1:基于所述实体检索词,通过多渠道获得与所述实体检索词相关的若干行为文本并将所述行为文本作为行为样本来构建行为样本池,所述行文文本由动词和动词的修饰短语构成;
步骤2:分析所述行为样本池中所述行为样本的特征;基于所述行为样本的特征,通过迭代得到若干所述行为样本排序构成的所述用户的潜在行为列表。
2.根据权利要求1所述的基于实体检索词的用户行为意图挖掘方法,其特征在于:所述步骤1中,通过个人社交网络上的推文和/或检索引擎检索得到的文本获得若干所述行为文本。
3.根据权利要求2所述的基于实体检索词的用户行为意图挖掘方法,其特征在于:通过所述个人社交网络上的推文获得所述行为文本的方法包括基于历史推文检索获得所述行为文本、基于随机推文检索获得所述行为文本和基于与所述实体检索词相关的个人社交网络用户的推文检索获得所述行为文本。
4.根据权利要求1所述的基于实体检索词的用户行为意图挖掘方法,其特征在于:所述步骤2中,所述行为样本的特征包括显著性、代表性和多样性;所述显著性表征所述行为样本在所述行为样本池中的使用频率和用例频率,所述代表性表征所述行为样本池中所述行为样本所处空间的行为样本密度,所述多样性表征所述行为样本与其他所述行为样本之间的差异度,分别分析所述行为文本的动词和动词的修饰短语的特征。
5.根据权利要求4所述的基于实体检索词的用户行为意图挖掘方法,其特征在于:所述行为样本中动词的显著性为所述行为样本的使用频率和用例频率的比值。
6.根据权利要求5所述的基于实体检索词的用户行为意图挖掘方法,其特征在于:所述行为样本中动词的使用频率为所述行为样本中动词的使用频次与全部所述行为样本中动词的使用总频次的比率;所述行为样本中动词的用例频率为行为样本中动词的用例数与全部所述行为样本中动词的总用例数的比率的对数。
7.根据权利要求4所述的基于实体检索词的用户行为意图挖掘方法,其特征在于:所述行为样本中动词的代表性为所述行为样本中动词和其他所述行为样本中动词在多维语义空间中的余弦相似度之和与归一化参数的比值。
8.根据权利要求4所述的基于实体检索词的用户行为意图挖掘方法,其特征在于:所述行为样本中动词的多样性为所述行为样本中动词与迭代过程中已选择的行为样本的动词在语义空间中的最短距离。
9.根据权利要求4所述的基于实体检索词的用户行为意图挖掘方法,其特征在于:所述行为样本中动词的修饰短语的代表性为所述行为样本中动词的修饰短语和其他所述行为样本中动词的修饰短语在多维语义空间中的余弦相似度的平均值。
10.根据权利要求4所述的基于实体检索词的用户行为意图挖掘方法,其特征在于:所述行为样本中动词的修饰短语的多样性为所述行为样本中动词的修饰短语与迭代过程中已选择的行为样本的动词的修饰短语在语义空间中的最短距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州电力设计研究院有限公司,未经苏州电力设计研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911395464.6/1.html,转载请声明来源钻瓜专利网。