[发明专利]意见信息的提取方法、装置、设备及存储介质在审
申请号: | 202211397210.X | 申请日: | 2022-11-09 |
公开(公告)号: | CN115795031A | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 陈鹏;张蒙豪;耿标 | 申请(专利权)人: | 中国农业银行股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 赵迎迎 |
地址: | 100005 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 意见 信息 提取 方法 装置 设备 存储 介质 | ||
本申请公开了一种意见信息的提取方法、装置、设备及存储介质,涉及互联网技术领域,可以提高筛选意见信息的效率和准确率。该方法包括:获取原始意见语句;通过预设意见信息提取模型,确定原始意见语句中的M个分词对应的M个目标编码向量,从M个目标编码向量中筛选出至少一个评价属性向量,基于至少一个评价属性向量和M个目标编码向量,从M个目标编码向量中筛选出至少一个评价属性向量对应的至少一个评价信息向量,并根据至少一个评价属性向量和至少一个评价信息向量确定至少一个情感极性向量,且基于至少一个评价属性向量、至少一个评价信息向量和至少一个情感极性向量确定原始意见语句的至少一个意见三元组。
技术领域
本申请涉及互联网技术领域,尤其涉及一种意见信息的提取方法、装置、设备及存储介质。
背景技术
随着互联网技术的不断发展,金融业、电子商务业及自媒体业等行业的应用程序(application,APP)的用户访问量快速增长,产生了海量的客户评论数据,比如,用户投诉单、满意度调查问卷等等。这些客户评论数据可以反映出客户使用APP期间的用户体验,对这些客户评论数据进行意见信息提取可以给改善APP提供的产品或服务提供针对性意见。
现有的,一般由工作人员人工逐条对客户评论数据进行审阅,从而筛选出有效的意见信息。然而,人工筛选意见信息的方式不仅效率低,而且准确率也低。所以,亟待提出一种新的意见信息的提取方法,以提高筛选意见信息的效率和准确率。
发明内容
本申请提供一种意见信息的提取方法、装置、设备及存储介质,可以提高筛选意见信息的效率和准确率。
为达到上述目的,本申请采用如下技术方案:
第一方面,本申请提供一种意见信息的提取方法,包括:获取原始意见语句;通过预设意见信息提取模型,确定原始意见语句中的M个分词对应的M个目标编码向量,从M个目标编码向量中筛选出至少一个评价属性向量,基于至少一个评价属性向量和M个目标编码向量,从M个目标编码向量中筛选出至少一个评价属性向量对应的至少一个评价信息向量,并根据至少一个评价属性向量和至少一个评价信息向量确定至少一个情感极性向量,且基于至少一个评价属性向量、至少一个评价信息向量和至少一个情感极性向量确定原始意见语句的至少一个意见三元组;其中,目标编码向量为N维向量,N和M均为正整数;一个评价属性向量对应一个评价信息向量,且对应一个情感极性向量,并对应一个意见三元组;评价属性向量对应的分词为评价属性分词,评价信息向量对应的分词为评价信息分词,情感极性向量用于表征情感极性类别。
本申请提供的技术方案中,在获取到原始意见语句后,可以调用事先得到的预设意见信息提取模型对该原始意见语句进行处理。首先,可以从该原始意见语句中的M个分词对应的M个目标编码向量中确定出至少一个评价属性向量,并基于该至少一个评价属性向量和M个目标编码向量对应筛选出至少一个评价信息向量。之后,可以根据至少一个评价属性向量和至少一个评价信息向量确定出对应的至少一个情感极性向量,然后可以根据至少一个评价属性向量、至少一个评价信息向量和至少一个情感极性向量得到该原始意见语句的至少一个意见三元组。由于评价属性向量对应的分词为评价属性分词,评价信息向量对应的分词为评价信息分词,情感极性向量用于表征情感极性类别,所以,本申请中的每个意见三元组可以表示三种信息:评价属性、评价信息及情感极性类别,这三种信息基本可以完整的概况一条意见信息。因此,本申请提供的通过预设意见信息提取模型提取原始意见语句可以表征用户的意见信息,该方案适用于对意见信息进行快速筛选的场景。显然,这种通过预设意见信息提取模型自动筛选有效意见信息的方式相比现有人工筛选意见信息的方式,可以提高筛选意见信息的效率和准确率。另外,本申请在提取意见三元组的过程中,充分考虑到了评价属性、评价信息及情感极性类别三种信息之间的层级关系,先提取评价属性,再根据对评价属性的提取结果提取评价信息,之后结合对评价属性的提取结果和对评价信息的提取结果预测情感极性类别,这种层级提取的方式可以更好的利用评价属性、评价信息及情感极性类别之间的语义关联,从而可以提高确定出的意见三元组的准确率,进一步提高筛选意见信息的准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业银行股份有限公司,未经中国农业银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211397210.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种页面展示方法、装置、系统、设备和存储介质
- 下一篇:一种屏幕压合机台
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置