[发明专利]一种文本处理方法及装置有效
申请号: | 202010559552.1 | 申请日: | 2020-06-18 |
公开(公告)号: | CN111709226B | 公开(公告)日: | 2023-10-13 |
发明(设计)人: | 严洁 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/247;G06F40/295 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 冯柳伟 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 处理 方法 装置 | ||
本申请公开了一种文本处理方法及装置,所述方法包括:获取手机银行的评论文本;对评论文本进行切词,获得评论文本的切词结果;基于预先构建的评论对象集合,提取切词结果中的评论对象;根据评论对象,利用依存语法获取评论对象对应的评论结果。采用本申请实施例的技术方案,通过预先构建的评论对象集合,能够获得手机银行评论文本中的评论对象及其评论内容,且手机银行的评论文本可以随时从应用商店获得,从而可以及时获得用户对于手机银行评论对象及其评论内容。无需再通过传统的方式获得用户的反馈,降低了评测成本,缩短了评测周期。
技术领域
本发明涉及计算机技术领域,尤其是涉及一种文本处理方法及装置。
背景技术
近年来,手机银行的用户量在不断的增加,银行越来越重视手机银行用户的体验感。例如,精准定位用户的需求,挖掘用户体验痛点,完备手机银行功能和服务,及时有效地为用户提供便捷服务等。
目前,主要通过两种方式获得用户体验感的反馈。第一种:问卷调查,即整理一些关于手机银行的问题,然后以问卷的形式随机找用户进行填写,最后回收问卷并统计整理出结果。第二种:产品体验官,即聘请专业的产品体验官对手机银行进行评测,然后生成评测报告进行分析。
然而,上述两种方式评测成本高,且评测周期长。
发明内容
针对上述问题,本申请提供一种评论分析方法及装置,能够降低评测成本,缩短评测周期。
本申请实施例第一方面提供一种文本处理方法,包括:
获取手机银行的评论文本;
对所述评论文本进行切词,获得所述评论文本的切词结果;
基于预先构建的评论对象集合,提取所述切词结果中的评论对象;
根据所述评论对象,利用依存语法获取所述评论对象对应的评论结果。
可选的,预先构建评论对象集合,包括:
获取所述手机银行的历史评论文本;
对所述历史评论文本进行切词,获得所述历史评论文本的基础词;
计算每一个所述基础词在所述评论文本中的第一出现频率;
计算所述基础词的词频-逆文本频率;
通过词性标注获得所述基础词中的名词和所述分词中的动词;
将第一出现频率大于第一频率阈值的基础词添加至第一候选词集合,将所述词频-逆文本频率大于词频-逆文本频率阈值的基础词添加至第二候选词集合,将所述基础词中的名词和所述基础词中的动词添加至第三候选词集合;
将所述第一候选词集合、所述第二候选词集合和所述第三候选词集合的交集作为评论对象集合。
可选的,所述将所述第一候选词集合、所述第二候选词集合和所述第三候选词集合的交集作为评论对象集合,包括:
将所述第一候选词集合、所述第二候选词集合和所述第三候选词集合的交集作为候选评论对象集合;
将所述候选评论对象集合输入至Word2vec模型中,获得评论对象词义向量集合;
通过聚类算法将所述评论对象词义向量集合中的同义词划分为一类;
将划分为一类的评论对象词义向量按类构成所述评论对象词集合。
可选的,在所述根据所述评论对象,利用依存语法获取所述评论对象对应的评论结果,之后还包括:
获取多个评论文本中的评论对象与所述评论对象对应的评论结果;
通过聚类算法将多个所述评论结果中的同义词划分为一类;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010559552.1/2.html,转载请声明来源钻瓜专利网。