[发明专利]信息挖掘方法、装置及电子设备在审

专利信息
申请号: 202010750413.7 申请日: 2020-07-30
公开(公告)号: CN111859146A 公开(公告)日: 2020-10-30
发明(设计)人: 郝雷光;常永炷;汪硕芃;张聪;毛晓曦;范长杰;胡志鹏 申请(专利权)人: 网易(杭州)网络有限公司
主分类号: G06F16/9535 分类号: G06F16/9535;G06F40/295
代理公司: 北京超成律师事务所 11646 代理人: 张芮
地址: 310052 浙江省杭州*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 信息 挖掘 方法 装置 电子设备
【说明书】:

本申请实施例提供一种信息挖掘方法、装置及电子设备,其中,该方法包括:确定业务方的网络数据对应的评价实体,所述评价实体为业务方关注的评价主对象;根据所述评价实体所属的实体类别确定评价项的集合,其中,所述评价项为所述评价实体对应的评价子对象;应用序列标注模型从所述网络数据中提取观点词;根据所述评价项的集合,从所述网络数据中提取目标评价项;根据所述目标评价项和所述观点词,确定所述评价实体对应的情感倾向。该方式能够提升信息挖掘的有效性和准确性。

技术领域

本申请涉及自然语言处理技术领域,尤其是涉及一种信息挖掘方法、装置及电子设备。

背景技术

随着互联网的高速发展,一些大规模的社交媒体也得到迅速发展,以微博、豆瓣、贴吧等代表的社会化媒体逐渐成为人们表达想法的工具和平台。广大网络用户已经从单纯的信息获取者变成了网络内容的主要制造者。越来越多的人开始在社交网络上发表自己对某个物品,某件事的看法,网络媒体上的观点信息越来越具有参考价值,例如:可以利用这些观点信息进行产品的市场反馈分析,以及为业务方提供针对于产品各个方面的网络评价报告等。

目前的细粒度情感分析技术中,能够针对于包含某个特定实体的某个方面的情感倾向给出粗略的分析结论,如“这家饭店太贵了”,则得出的结论为(饭店,价格,负向)。这种技术根据大量的相似的用户评论,可以得到对于某个实体的情感分布,即可能80%的人认为这家饭店的价格不好,该方式只能笼统地得出这家饭店好或不好的情感倾向,准确性较差。

发明内容

本申请的目的在于提供一种信息挖掘方法、装置及电子设备,以提升信息挖掘的有效性和准确性。

本申请实施例提供一种信息挖掘方法,上述方法包括:确定业务方的网络数据对应的评价实体,评价实体为业务方关注的评价主对象;根据评价实体所属的实体类别确定评价项的集合,其中,评价项为评价实体对应的评价子对象;应用序列标注模型从网络数据中提取观点词;根据评价项的集合,从网络数据中提取目标评价项;根据上述目标评价项和观点词,确定评价实体对应的情感倾向。

上述方法还包括:根据上述观点词检索预先配置的观点词标准表述表,得到观点词对应的标准化观点词;将评价实体、目标评价项、标准化观点词和情感倾向组成网络数据对应的挖掘信息。

根据上述观点词检索预先配置的观点词标准表述表的步骤,包括:将所述业务方、所述评价实体和所述目标评价项中至少一项与所述观点词组成第一检索要素,应用所述第一检索要素检索预先配置的观点词标准表述表;如果未检索到与所述第一检索要素匹配的表项,以所述观点词作为第二检索要素,应用所述第二检索要素检索所述观点词标准表述表。

上述方法还包括:汇总指定时间段内业务方的网络数据对应的挖掘信息集合;基于评价实体和目标评价项,对挖掘信息集合中的挖掘信息进行聚类;根据聚类结果生成业务方的分析报告。

上述情感倾向包括:正向、负向和其它;聚类结果包括:同一个评价实体对应的挖掘信息条数;根据聚类结果生成业务方的分析报告的步骤,包括:根据同一个评价实体对应的挖掘信息条数,确定评价实体集合;对评价实体集合中的评价实体,分别统计同一目标评价项对应的情感倾向的占比值;在业务方的分析报告中,展示评价实体集合中的评价实体对应的每个目标评价项对应的情感倾向的占比值。

上述根据聚类结果生成业务方的分析报告的步骤,还包括:将评价实体集合中的评价实体分别作为评价对象,对于评价对象均执行以下操作:根据该评价对象的每个目标评价项对应的情感倾向的占比值,确定该评价对象对应的情感倾向;基于各个评价对象对应的情感倾向确定业务方的情感倾向。

上述基于各个评价对象对应的情感倾向确定业务方的情感倾向的步骤,包括:基于各个评价对象对应的权重和每个情感倾向对应的预设值,对各个评价对象对应的情感倾向进行权重求和计算,得到业务方的情感得分;根据业务方的情感得分确定业务方的情感倾向。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010750413.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top