[发明专利]质检例句挖掘方法、装置、设备及计算机可读存储介质在审
申请号: | 202010123426.1 | 申请日: | 2020-02-26 |
公开(公告)号: | CN111291162A | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 黄研洲;余远铭;鲍志强;杨海军;徐倩;杨强 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/335;G06F40/169 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 陈思凡 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 质检 例句 挖掘 方法 装置 设备 计算机 可读 存储 介质 | ||
1.一种质检例句挖掘方法,其特征在于,所述质检例句挖掘方法包括以下步骤:
获取各个质检项对应的各个质检例句,并基于各个质检例句,在多个质检录音文本中查找多个质检句子;
在接收到各个所述质检句子对应的标注信息时,基于所述标注信息,在各个所述质检句子中确定目标质检例句。
2.如权利要求1所述的质检例句挖掘方法,其特征在于,所述基于各个质检例句,在多个质检录音文本中查找多个质检句子的步骤包括:
获取各个质检例句中的第一关键词的有向图转移向量,并基于所述有向图转移向量确定各个所述质检项对应的有向图转移矩阵;
基于所述有向图转移矩阵,在多个质检录音文本中查找各个所述质检句子。
3.如权利要求2所述的质检例句挖掘方法,其特征在于,所述基于所述有向图转移矩阵,在多个质检录音文本中查找各个所述质检句子的步骤包括:
获取多个质检录音文本对应的文本片段中的第二关键词;
基于所述第二关键词,确定各个所述文本片段中是否存在与所述有向图转移矩阵匹配的目标文本片段;
若存在,则将所述目标文本片段作为所述质检句子。
4.如权利要求1所述的质检例句挖掘方法,其特征在于,所述在接收到各个所述质检句子对应的标注信息时,基于所述标注信息,在各个所述质检句子中确定目标质检例句的步骤包括:
对所述质检句子进行过滤操作,以获得过滤后的质检句子;
在接收到过滤后的质检句子对应的标注信息时,基于所述标注信息,在过滤后的质检句子对中确定所述目标质检例句。
5.如权利要求4所述的质检例句挖掘方法,其特征在于,所述对所述质检句子进行过滤操作,以获得过滤后的质检句子的步骤包括:
基于所述质检例句对应的第一关键词,确定各个所述质检句子对应的权重分值;
基于所述权重分值,对所述各个质检句子进行排序,将排序结果中前预设个数的质检句子作为目标质检句子;
基于质检例句对所述目标质检句子进行过滤操作,以获得过滤后的质检句子。
6.如权利要求5所述的质检例句挖掘方法,其特征在于,所述基于所述质检项对应的第一关键词,确定各个所述质检句子对应的权重分值的步骤包括:
获取所述第一关键词对应的权重,并基于所述第一关键词以及所述权重,确定各个所述质检句子对应的权重分值。
7.如权利要求5所述的质检例句挖掘方法,其特征在于,所述基于质检例句对所述目标质检句子进行过滤操作,以获得过滤后的质检句子的步骤包括:
获取各个所述质检例句与所述目标质检句子之间的相似度;
基于所述相似度对所述目标质检句子进行过滤操作,以获得过滤后的质检句子。
8.如权利要求7所述的质检例句挖掘方法,其特征在于,所述基于所述相似度对所述目标质检句子进行过滤操作,以获得过滤后的质检句子的步骤包括:
确定各个所述相似度中,是否存在大于预设相似度的目标相似度;
若存在,则在所述目标质检句子中,剔除所述目标相似度对应的质检句子,以获得过滤后的质检句子。
9.如权利要求1至8任一项所述的质检例句挖掘方法,其特征在于,所述基于所述标注信息确定目标质检例句的步骤之后,所述质检例句挖掘方法还包括:
基于所述目标质检例句更新所述质检例句,得到更新后的质检例句;
基于更新后的质检例句,确定质检模型是否收敛;
若所述质检模型未收敛,则将更新后的质检例句作为所述质检例句,并返回执行确定各个所述质检例句对应的有向图转移矩阵的步骤,直至所述质检模型收敛。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010123426.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种测试方法、装置、计算机设备及存储介质
- 下一篇:记录及查找log的方法