[发明专利]信息处理方法和装置有效
申请号: | 201510892230.8 | 申请日: | 2015-12-07 |
公开(公告)号: | CN106844403B | 公开(公告)日: | 2020-04-14 |
发明(设计)人: | 刘嘉;钦滨杰 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/28;G06F16/951 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 王书彪;刘艳芬 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 装置 | ||
1.一种信息处理方法,其特征在于,包括:
基于预先设置的爬取规则,从互联网爬取指定产品的用户评述信息;
根据预先获得的信息判断模型,分别针对爬取到的各用户评述信息,获取用户评述信息对应的评价等级并对用户评论信息标注获取到的评价等级;
在信息系统中存储所述指定产品及其标注评价等级的用户评价信息;
其中,所述爬取规则为爬取包括用户设定的关键词的用户评述信息,所述关键词包括反映用户体验、影响指定产品口碑的词汇和所述指定产品的指标参数,根据所述指定产品的产品特点设置所述指标参数;
所述获取用户评述信息对应的评价等级并对用户评论信息标注获取到的评价等级包括:
获取用户评述信息中各特征对应的评价等级,所述特征包括关键词和/或关键句型;
响应于所述用户评述信息中包含同时对应多个不同评价等级的无效特征,去除同时对应多个不同评价等级的无效特征;
对所述用户评述信息中特征去除无效特征后得到的各有效特征分别标注相应的评价等级。
2.根据权利要求1所述的方法,其特征在于,还包括获取所述爬取规则的操作;
所述爬取规则具体为基于用户对互联网上指定产品的用户评述信息进行分析后设定的关键词设置的爬取标准。
3.根据权利要求1所述的方法,其特征在于,所述从互联网爬取指定产品的用户评述信息包括:
利用网络爬虫,对第三方平台网站的口碑专栏里的任意一个或多个版块进行定向爬取,获得用户评述信息;所述口碑专栏里的版块包括:车型、空间、动力、操控性、舒适度、外观、内饰、性价比、配置、油耗。
4.根据权利要求1所述的方法,其特征在于,还包括:
响应于检测到新建语料包,对新建语料包进行学习,形成所述信息判断模型;所述语料包基于对各种评价等级的特征的总结形成,所述特征包括关键词和/或关键句型;或者
响应于检测到语料包被更新,对更新后的语料包进行学习,并对所述信息判断模型进行更新。
5.根据权利要求1所述的方法,其特征在于,所述将标注评价等级的用户评价信息存储到信息系统中之前,还包括:
根据分类要素对用户评述信息进行分类,获得用户评述信息的类别;所述指定产品为汽车时,所述分类要素包括车型、空间、动力、操控性、舒适度、外观、内饰、性价比、配置与油耗中的任意一种或多种;
所述在信息系统中存储所述指定产品及其标注评价等级的用户评价信息包括:根据用户评述信息的类别,在信息系统中的相应位置存储所述指定产品及其标注评价等级的用户评价信息。
6.根据权利要求1所述的方法,其特征在于,所述获取用户评述信息对应的评价等级之后,还包括:
判断是否获取到用户评述信息对应的评价等级;
响应于获取到用户评述信息对应的评价等级,执行所述对用户评论信息标注获取到的评价等级的操作;
否则,响应于未获取到用户评述信息对应的评价等级,输出未获取到评价等级的用户评述信息,并接收用户针对未获取到评价等级的用户评述信息反馈的评价等级;对未获取到评价等级的用户评述信息标注用户反馈的评价等级。
7.根据权利要求1至6任意一项所述的方法,其特征在于,基于预先设置的爬取周期或用户输入的爬取指令,执行所述基于预先设置的爬取规则,从互联网爬取指定产品的用户评述信息的操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510892230.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:药物组合物及其制备方法
- 下一篇:用于滋补安神的中药组合物及其制备方法