[发明专利]一种对短评论文本进行方面分类方法在审
申请号: | 201610056103.9 | 申请日: | 2016-01-27 |
公开(公告)号: | CN105740382A | 公开(公告)日: | 2016-07-06 |
发明(设计)人: | 温远;印鉴 | 申请(专利权)人: | 中山大学;广州中大南沙科技创新产业园有限公司;广州智海纵横信息科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 评论 文本 进行 方面 分类 方法 | ||
1.一种对短评论文本进行方面分类方法,其特征在于,包括以下步骤:
S1:对短评论文本集进行预处理,得到短评论文本集中各个词的词向量;
S2:利用短评论文本集中各个词的词向量来计算方面类别相关的标准词向量,并计算各个短评论文本的特征;
S3:计算各个短评论文本评论对象实体的特征;
S4:根据各个短评论文本的特征及其评论对象实体的特征来训练分类器来进行短评论文本方面分类。
2.根据权利要求1所述的对短评论文本进行方面分类方法,其特征在于,所述步骤S3中采用前馈型神经网络模型来计算各个短评论文本评论对象实体的特征。
3.根据权利要求1所述的对短评论文本进行方面分类方法,其特征在于,所述短评论文本包括餐馆、数码产品的评论数据集,所述短评论文本所属方面分类由评论对象实体和评论对象的属性构成。
4.根据权利要求1所述的对短评论文本进行方面分类方法,其特征在于,对短评论文本集进行预处理的过程包括对短评论文本的分词、去停词,并对不在词典中的词向量进行随机初始化。
5.根据权利要求1所述的对短评论文本进行方面分类方法,其特征在于,所述标准词向量为方面类别关键词的词向量平均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学;广州中大南沙科技创新产业园有限公司;广州智海纵横信息科技有限公司,未经中山大学;广州中大南沙科技创新产业园有限公司;广州智海纵横信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610056103.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种分类方法及装置
- 下一篇:一种在线Web新闻内容抽取系统