[发明专利]产品的偏好区域识别方法和装置有效
申请号: | 201710022878.9 | 申请日: | 2017-01-12 |
公开(公告)号: | CN106875213B | 公开(公告)日: | 2018-01-19 |
发明(设计)人: | 张强;王安宁;杨善林;彭张林;倪鑫;任明仑;陆效农 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/02 |
代理公司: | 北京路浩知识产权代理有限公司11002 | 代理人: | 汤财宝 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 产品 偏好 区域 识别 方法 装置 | ||
1.一种产品的偏好区域识别方法,其特征在于,包括:
获取不同区域的用户对待分析产品的评论文本,并从获取的各条评论文本中提取出所述待分析产品的产品特征,其中的区域为用户所属城市的等级或用户的所属地区;
根据在每一条评论文本中的每一个产品特征的观点词,确定在该条评论文本中用户对该产品特征的情感极性;
根据每一个产品特征在包含该产品特征的各条评论文本中的情感极性以及包含该产品特征的各条评论文本的用户的所属区域,计算该产品特征的情感倾向与区域之间的关联程度;
根据各个产品特征的情感倾向与区域之间的关联程度,从各个产品特征中提取出具有区域偏好的产品特征;
对于提取出的具有区域偏好的每一个产品特征,根据在不同区域中包含该产品特征且该产品特征的情感极性相同的评论文本的数量的统计值与期望值之间的差值,确定该产品特征针对该情感极性的偏好区域。
2.根据权利要求1所述的方法,其特征在于,所述从获取的各条评论文本中提取出所述待分析产品的产品特征,包括:
对各条评论文本进行中文分词,从分词结果中提取出名词和名词短语;
利用关联规则从提取出的名词和名词短语中提取出频繁项集;
对所述频繁项集中的名词和/或名词短语进行同义词聚合,并剔除所述频繁项集中的非产品特征词。
3.根据权利要求1所述的方法,其特征在于,所述根据在每一条评论文本中的每一个产品特征的观点词,确定在该条评论文本中用户对该产品特征的情感极性,包括:
确定所述观点词所属的情感词库的类型;
根据所述情感词库的类型,确定该条评论文本中用户对该产品特征的情感极性。
4.根据权利要求1所述的方法,其特征在于,所述每一条评论文本中的每一个产品特征的观点词为在该条评论文本中与该产品特征邻近的预设数量的字符中的形容词。
5.根据权利要求1所述的方法,其特征在于,采用下式计算每一个产品特征的情感倾向与区域之间的关联程度:
式中,χ2为该产品特征的情感倾向与区域之间的关联程度,nkj为在第k个区域中包含该产品特征且该产品特征的情感极性为j的评论文本的数量的统计值,Ekj为在第k个区域中包含该产品特征且该产品特征的情感极性为j的评论文本的数量的期望值。
6.根据权利要求5所述的方法,其特征在于,采用下式计算所述期望值Ekj:
式中,n为获取的所有评论文本的数量,Cj为包含该产品特征且该产品特征的情感极性为j为评论文本的数量的统计值,Rk为包含该产品特征且用户所属第k个区域的评论文本的数量的统计值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710022878.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种评吸用卷烟及评吸方法
- 下一篇:一种基于朋友圈分享的广告推送方法和系统