[发明专利]信息处理方法和装置有效
申请号: | 201510892230.8 | 申请日: | 2015-12-07 |
公开(公告)号: | CN106844403B | 公开(公告)日: | 2020-04-14 |
发明(设计)人: | 刘嘉;钦滨杰 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/28;G06F16/951 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 王书彪;刘艳芬 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 装置 | ||
本发明实施例公开了一种信息处理方法和装置,其中,方法包括:基于预先设置的爬取规则,从互联网爬取指定产品的用户评述信息;根据预先获得的信息判断模型,分别针对爬取到的各用户评述信息,获取用户评述信息对应的评价等级并对用户评论信息标注获取到的评价等级;在信息系统中存储所述指定产品及其标注评价等级的用户评价信息。本发明实施例可以使用户可以全面了解汽车的评价信息。
技术领域
本发明涉及互联网技术,尤其是一种信息处理方法和装置。
背景技术
当前,汽车已成为大众出行、货物运输的主要运载工具。针对各种品牌、型号的汽车,互联网上存在并不断涌现海量的评价信息,如何快速获取这些互联网上对汽车的评价信息并对其进行分析研究,对汽车生产厂商和行业研究人员而言,都是一项具有巨大挑战、但却非常有价值的工作。对汽车厂商而言,可以从用户的评论信息中掌握其产品的使用优缺点、以及在市场上的评价排序。同时,汽车口碑对消费者也非常重要,为消费者选择汽车品牌、型号提供了参考。
在实现本发明的过程中,发明人发现,现有技术中,尚不存在一种全面了解汽车口碑的方式,汽车厂商、行业研究人员、消费者只能针对特定品牌、型号的汽车,从各汽车论坛搜索其评价信息,信息了解不全面,信息获取效率低下。
发明内容
本发明实施例所要解决的一个技术问题是:提供一种信息处理方法和装置,以使用户可以全面了解汽车的评价信息。
根据本发明实施例的一个方面,提供的一种信息处理方法,包括:
基于预先设置的爬取规则,从互联网爬取指定产品的用户评述信息;
根据预先获得的信息判断模型,分别针对爬取到的各用户评述信息,获取用户评述信息对应的评价等级并对用户评论信息标注获取到的评价等级;
在信息系统中存储所述指定产品及其标注评价等级的用户评价信息。
在本发明另一实施例的信息处理方法中,还包括获取所述爬取规则的操作;
所述爬取规则具体为基于用户对互联网上指定产品的用户评述信息进行分析后设定的关键词设置的爬取标准;所述关键词包括指定产品的指标参数。
在本发明另一实施例的信息处理方法中,所述从互联网爬取指定产品的用户评述信息包括:
利用网络爬虫,对第三方平台网站的口碑专栏里的任意一个或多个版块进行定向爬取,获得用户评述信息;
所述口碑专栏里的版块包括:车型、空间、动力、操控性、舒适度、外观、内饰、性价比、配置、油耗。
在本发明另一实施例的信息处理方法中,还包括:
响应于检测到新建语料包,对新建语料包进行学习,形成所述信息判断模型;所述语料包基于对各种评价等级的特征的总结形成,所述特征包括关键词和/或关键句型;或者
响应于检测到语料包被更新,对更新后的语料包进行学习,并对所述信息判断模型进行更新。
在本发明另一实施例的信息处理方法中,所述获取用户评述信息对应的评价等级并对用户评论信息标注获取到的评价等级包括:
获取用户评述信息中各特征对应的评价等级,所述特征包括关键词和/或关键句型;
响应于所述用户评述信息中包含同时对应多个不同评价等级的无效特征,去除同时对应多个不同评价等级的无效特征;
对所述用户评述信息中特征去除无效特征后得到的各有效特征分别标注相应的评价等级。
在本发明另一实施例的信息处理方法中,所述将标注评价等级的用户评价信息存储到信息系统中之前,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510892230.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:药物组合物及其制备方法
- 下一篇:用于滋补安神的中药组合物及其制备方法