[发明专利]一种产品特征的挖掘与评价方法有效

专利信息
申请号: 201610903523.6 申请日: 2016-10-17
公开(公告)号: CN106649519B 公开(公告)日: 2020-11-27
发明(设计)人: 孙鹏飞;吴国仕;许可 申请(专利权)人: 北京邮电大学
主分类号: G06F16/35 分类号: G06F16/35;G06F40/242;G06F40/253;G06F40/289;G06F40/216;G06Q30/02
代理公司: 北京风雅颂专利代理有限公司 11403 代理人: 李阳;于洁
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 产品 特征 挖掘 评价 方法
【说明书】:

发明公开了一种产品特征的挖掘与评价方法包括:随机抓取多条消费者对于产品的文本评论信息训练感情词典与产品特征词典;确定目标产品,并从电子商务平台上抓取多条不同消费者对于目标产品的文本评论信息;根据感情词典与产品特征词典,依次从每条文本评论信息中抽取出产品特征‑感情词语对,并使用产品特征‑感情词语对迭代更新感情词典与产品特征词典,直到多条文本评论信息均被处理;对所有被抽取出的产品特征‑感情词语对进行统计,获得该产品的产品特征与感情评价。本发明能够在中文领域上挖掘与评价产品的特征并进行统计分析,为中文电子商务的综合评价提供数据支持。

技术领域

本发明涉及电子商务领域,特别地,涉及一种产品特征的挖掘与评价方法。

背景技术

随着Web2.0应用的出现和快速发展,电子商务正在发展成一个繁荣的商业模式,这样更加容易获取到对商品的反馈,客户可以在消费之后留下他们的评论,之后的客户就可以根据评论来决定是否购买该商品。对消费者来说,如果他们能够对商品的正面和负面评论的百分比有一个清晰的认识,对于是否购买商品会更好地做出选择。把人们评价最多的那些商品的特征提供给消费者也是很有帮助的。同时,这些结果也可以报告给制造商和电子商务销售商,可以用来帮助改进他们的商品和服务。于是整合网络上的信息并进行统计分析,然后给消费者提供一个综合评价就变得非常重要。

在获取市场信息方面,现有技术把Twitter作为挖掘市场信息的语料库,包括了主题探测和情感分类。然而,汉语中,包含了大量用户产生的内容信息的微博有太多的虚假评论和广告,难以创建合适的数据集。同时,情感分析常常被当做文本分类问题,与新闻文章和学术论文形式的正式格式文本不一样,UGC有时候并不会严格按照语法,但也会有一些附加的信息。Twitter中使用像“:-)”这样的表情符号作为极性探测的特征;说话方式等也可以作为正面和负面情绪的指示。另外,怎样从商品的评论中抽取它们的特征是现有技术的主要问题。英文产品特征挖掘的作者们使用常用名词和名词短语来进行特征抽取,以及Apriori算法生成频繁特征集并修剪初步的集合,但这个手段不适用于中文。

针对现有技术中对英文评论进行挖掘与评价的方法在中文领域不适用的问题,目前尚未有有效的解决方案。

发明内容

有鉴于此,本发明的目的在于提出一种产品特征的挖掘与评价方法,能够在中文领域上挖掘与评价产品的特征并进行统计分析,为中文电子商务的综合评价提供数据支持。

基于上述目的,本发明提供的技术方案如下:

本发明提供了一种产品特征的挖掘与评价方法,包括:

随机抓取多条消费者对于产品的文本评论信息训练感情词典与产品特征词典;

确定目标产品,并从电子商务平台上抓取多条不同消费者对于目标产品的文本评论信息;

根据感情词典与产品特征词典,依次从每条文本评论信息中抽取出产品特征-感情词语对,并使用产品特征-感情词语对迭代更新感情词典与产品特征词典,直到多条文本评论信息均被处理;

对所有被抽取出的产品特征-感情词语对进行统计,获得该产品的产品特征与感情评价。

其中,随机抓取多条消费者对于产品的文本评论信息训练感情词典包括:

确定每条随机抓取的文本评论信息为正面评价或负面评价;

对每条随机抓取的文本评论信息进行分词处理,并对分词处理得到的每个词进行词性标注;

使用朴素贝叶斯方法将分词处理得到的每个形容词按照该形容词的出现次数计算该形容词的在正面评价与负面评价中的先验概率;

根据该形容词的在正面评价与负面评价中的先验概率将该形容词归为正面词语或负面词语,并加入感情词典中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610903523.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top