[发明专利]网购评论的分析处理方法有效
申请号: | 201310198515.2 | 申请日: | 2013-05-24 |
公开(公告)号: | CN103279460B | 公开(公告)日: | 2017-02-08 |
发明(设计)人: | 许大伦;毛颖;张立群 | 申请(专利权)人: | 北京尚友通达信息技术有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京国昊天诚知识产权代理有限公司11315 | 代理人: | 许志勇 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评论 分析 处理 方法 | ||
1.一种网购评论的分析处理方法,其特征在于,包括:
从某商品的网购评论中提取出的观点词和特征词,将所述观点词和特征词组成特征观点对;
根据提取出的所述观点词确定所述观点词的情感倾向;
根据所述情感倾向和所述特征观点对,计算出每个特征在该商品上的情感分布函数v,以及每个特征在该商品所属小类上的情感分布函数vC;
根据v和vC的偏差得到该商品上不同特征词的分数,将分数值最高和/或最低的多个特征词作为该商品的优缺点评论。
2.如权利要求1所述的网购评论的分析处理方法,其特征在于,所述从某商品的网购评论中提取出的观点词和特征词,进一步为:对某商品的网购评论中以形容词为主出现的词汇的比例和频率进行统计,将统计值最高的一个或多个词汇作为观点词,以及通过设置的条件从某商品的网购评论中选取出以名词为主的词汇进行统计,将统计值最高的一个或多个词汇作为特征词。
3.如权利要求2所述的网购评论的分析处理方法,其特征在于,所述通过设置的条件从某商品的网购评论中选取出以名词为主的词汇进行统计,将统计值最高的一个或多个词汇作为特征词,进一步为:从某商品的网购评论中的选取出名词或词组为主的词汇,计算每个词汇在该商品所在小类的支持度值,以及该小类所属大类的支持度值;通过设置的条件将符合条件的名词或词组为主的词汇作为特征词。
4.如权利要求3所述的网购评论的分析处理方法,其特征在于,所述通过设置的条件将符合条件的名词或词组为主的词汇作为特征词,进一步包括:通过设置的最低小类的支持度的阈值、最低大类的支持度的阈值、以及停用词表,判断选取出的名词或词组为主的词汇在该商品所在小类的支持度值是否大于最低小类的支持度的阈值,或者,判断选取出的名词或词组为主的词汇在该商品所在小类所属大类的支持度值是否大于最低大类的支持度的阈值,当上述条件之一满足时,判断该名词或词组为主的词汇是否出现在所述停用词表中,如没有出现,则将该名词或词组为主的词汇作为特征词。
5.如权利要求1所述的网购评论的分析处理方法,其特征在于,所述根据提取出的所述观点词确定所述观点词的情感倾向,进一步为:根据设置所述观点词的情感倾向向量,对提取出的所述观点词确定其情感倾向值,如该观点词的情感倾向值高于设置的判断方向值,且通过否定词表中的否定词并没有出现在该观点词前/后时,则该观点词的情感倾向为正向;
如低于设置的的判断方向值,或通过否定词表中的否定词判断出在该观点词前/后出现时,则该观点词的情感倾向为负向。
6.如权利要求1所述的网购评论的分析处理方法,其特征在于,所述根据v和vC的偏差得到该商品上不同特征词的分数,进一步为:根据v和vC的偏差通过1-cos(v,vC)的方式得到该商品上不同特征词的分数。
7.如权利要求6所述的网购评论的分析处理方法,其特征在于,进一步为:根据v和vC的偏差通过(1-cos(v,vC))*log2(pos+neu+neg+1)的方式得到该商品上不同特征词的分数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京尚友通达信息技术有限公司,未经北京尚友通达信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310198515.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:离心压缩机
- 下一篇:用于海上风机导管架基础安装灌浆的定位、调平方法