[发明专利]观点分析方法、装置、设备及存储介质有效
申请号: | 202010785575.4 | 申请日: | 2020-08-06 |
公开(公告)号: | CN111914536B | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 孙铭阳 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/289;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;臧建明 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 观点 分析 方法 装置 设备 存储 介质 | ||
本公开的实施例提供一种观点分析方法、装置、设备及存储介质。该方法包括:获取针对目标对象的多个评论文本;对多个评论文本进行第一聚类;根据第一聚类得到的多个簇,在多个评论文本中获得多个评论观点句;对多个评论观点句进行第二聚类;根据第二聚类得到的多个簇,在多个评论观点句中获得针对目标对象的评论观点。本公开的实施例的方法,提高了观点分析的准确度。
技术领域
本公开的实施例涉及计算机领域中的自然语言领域、大数据领域,尤其涉及一种观点分析方法、装置、设备及存储介质。
背景技术
在互联网时代,网络为人们提供了发表个人观点的开放平台。
针对一个公司或者产品,网络上每天可能产生数以万计的评论数据,人工一条条阅读这些评论数据来得知人们观点的方式,时间和经济成本太高。为提高观点分析效率,通常采用神经网络模型进行观点分析。
神经网络模型的性能表现依赖于大量的先验知识或者训练数据,在有限的自然语言文本分类任务上表现较好。然而,观点分析任务是挖掘海量的自然语言文本中的未知观点,且观点具有时效性,因此,神经网络模型在观点分析任务上的观点分析准确度不高。
发明内容
本公开的实施例提供一种观点分析方法、装置、设备及存储介质,用以解决观点分析准确度不高的问题。
第一方面,本公开的实施例提供一种观点分析方法,包括:
获取针对目标对象的多个评论文本;
对所述多个评论文本进行第一聚类;
根据所述第一聚类得到的多个簇,在所述多个评论文本中获得多个评论观点句;
对所述多个评论观点句进行第二聚类;
根据所述第二聚类得到的多个簇,在所述多个评论观点句中获得针对所述目标对象的评论观点。
第二方面,本公开的实施例提供一种观点分析装置,包括:
获取模块,用于获取针对目标对象的多个评论文本;
第一聚类模块,用于对所述多个评论文本进行第一聚类,根据所述第一聚类得到的多个簇,在所述多个评论文本中获得多个评论观点句;
第二聚类模块,用于对所述多个评论观点句进行第二聚类,根据所述第二聚类得到的多个簇,在所述多个评论观点句中获得针对所述目标对象的评论观点。
第三方面,本公开的实施例提供了一种电子设备,包括:
存储器和处理器;
所述存储器用于存储程序指令;
所述处理器用于调用所述存储器中的程序指令执行如上述第一方面所述的方法。
第四方面,本公开的实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被执行时,实现如上述第一方面所述的方法。
第五方面,本公开的实施例提供了一种包含指令的程序产品,所述程序产品包括计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的方法。
本公开的实施例提供的观点分析方法、装置、设备及存储介质,对针对目标对象的多个评论文本进行第一聚类,得到多个评论观点句,再对多个评论观点句进行第二聚类,得到针对目标对象的评论观点。因此,通过对评论文本进行聚类的方式,在不依赖于先验知识或者训练数据的前提下,对海量的评论文本进行无监督的观点聚类,聚类得到的评论观点能够体现评论文本的时效性。此外,还通过包括第一聚类和第二聚类的两级聚类,有效地提高观点聚类效果。因此,本公开的实施例有效地提高了观点分析的准确度。
本公开的各种可行实施例及其技术优势将在下文详述。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010785575.4/2.html,转载请声明来源钻瓜专利网。