[发明专利]文本数据处理方法及装置在审
申请号: | 202111027835.2 | 申请日: | 2021-09-02 |
公开(公告)号: | CN113723110A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 朱逸麟;周良;闫继忠;金燕;虞海春 | 申请(专利权)人: | 中国建设银行股份有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06Q10/10;G06F16/33 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李伟 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 数据处理 方法 装置 | ||
1.一种文本数据处理方法,其特征在于,包括:
获取退单原因描述文本;
确定所述退单原因描述文本的类型;所述类型为第一类型和第二类型中的一种,所述第一类型表示所述退单原因描述文本为所述用户填写的开放型文本,所述第二类型表示所述退单原因描述文本为所述用户在预先设置的退单选项集合中选取的文本;
在所述退单原因描述文本的类型为所述第一类型的情况下,对所述退单原因描述文本进行语义识别,获得所述退单原因描述文本的语义识别结果;
若确定出所述语义识别结果满足预先设置的文本补充条件,则将所述语义识别结果添加至所述退单选项集合中。
2.根据权利要求1所述的方法,其特征在于,还包括:
在所述退单原因描述文本的类型为所述第二类型的情况下,确定所述退单原因描述文本所属的分类维度;
接收到用户针对所述分类维度的筛选指令后,基于所述退单原因描述文本生成所述分类维度的归纳分析报告。
3.根据权利要求1所述的方法,其特征在于,确定所述语义识别结果满足预先设置的文本补充条件的过程,包括:
确定所述语义识别结果当前的累计出现次数;
若所述语义识别结果的累计出现次数大于预先设置的出现次数阈值,则确定所述语义识别结果满足所述文本补充条件。
4.根据权利要求1所述的方法,其特征在于,确定所述语义识别结果满足预先设置的文本补充条件的过程,包括:
确定所述语义识别结果当前的累计出现次数,以及各个预先存储的候选语义识别结果的累计出现次数;
按所述语义识别结果当前的累计出现次数和各个所述候选语义识别结果的累计出现次数由大至小的顺序,对所述语义识别结果和各个所述候选语义识别结果进行排序;
若所述语义识别结果的排序值小于或等于预先设置的排序阈值,则确定所述语义识别结果满足所述文本补充条件。
5.根据权利要求1所述的方法,其特征在于,所述将所述语义识别结果添加至所述退单选项集合之后,还包括:
响应于用户的退单原因选取指令,显示已添加所述语义识别结果的所述退单选项集合。
6.一种文本数据处理装置,其特征在于,包括:
获取单元,用于获取退单原因描述文本;
第一确定单元,用于确定所述退单原因描述文本的类型;所述类型为第一类型和第二类型中的一种,所述第一类型表示所述退单原因描述文本为所述用户填写的开放型文本,所述第二类型表示所述退单原因描述文本为所述用户在预先设置的退单选项集合中选取的文本;
识别单元,用于在所述退单原因描述文本的类型为所述第一类型的情况下,对所述退单原因描述文本进行语义识别,获得所述退单原因描述文本的语义识别结果;
执行单元,用于若确定出所述语义识别结果满足预先设置的文本补充条件,则将所述语义识别结果添加至所述退单选项集合中。
7.根据权利要求6所述的装置,其特征在于,还包括:
第二确定单元,用于在所述退单原因描述文本的类型为所述第二类型的情况下,确定所述退单原因描述文本所属的分类维度;
生成单元,用于接收到用户针对所述分类维度的筛选指令后,基于所述退单原因描述文本生成所述分类维度的归纳分析报告。
8.根据权利要求6所述的装置,其特征在于,所述执行单元,包括:
第一确定子单元,用于确定所述语义识别结果当前的累计出现次数;
第二确定子单元,用于若所述语义识别结果的累计出现次数大于预先设置的出现次数阈值,则确定所述语义识别结果满足所述文本补充条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111027835.2/1.html,转载请声明来源钻瓜专利网。