[发明专利]文本定位方法、装置、终端及存储介质在审
申请号: | 201910742420.X | 申请日: | 2019-08-09 |
公开(公告)号: | CN110442853A | 公开(公告)日: | 2019-11-12 |
发明(设计)人: | 张超;汤耀华 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06F17/24 | 分类号: | G06F17/24;G06F17/27;G10L15/26 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 薛福玲 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 矩阵 编辑距离 标准文本 存储介质 文本数据 客服 回溯 自然语言 录音 终端 文本相似度 标准处理 关系计算 科技领域 快速定位 路径确定 语音识别 预设标准 质检内容 评估 金融 | ||
本发明涉及金融科技领域,本发明公开了一种文本定位方法、装置、终端及存储介质,所述文本定位方法包括:获取客服录音,对所述客服录音进行语音识别处理,以获得文本数据;对所述文本数据进行自然语言标准处理,以获得标准文本数据;根据所述标准文本数据和所述预设标准话术文本建立编辑距离矩阵,并确定所述编辑距离矩阵中的目标回溯路径;根据所述目标回溯路径确定文本对应关系,并基于所述文本对应关系计算文本相似度。本发明解决了现有技术中无法快速定位到要评估的文本质检内容的技术问题。
技术领域
本发明涉及金融科技技术领域,尤其涉及一种文本定位方法、装置、终端及存储介质。
背景技术
随着计算机技术的发展,越来越多的技术(大数据、分布式、区块链Blockchain、人工智能等)应用在金融领域,传统金融工业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出了更高的要求。
目前客服行业的质检考核过程通常需要靠人工抽查客服录音,而人为操作往往具有一定的主观性和局限性,无法全面客观的对客服服务质量进行之间评估;同时,人工抽查可能一直抽查到服务质量差的录音,引起质检失衡,造成抽查不精准;并且人工抽查需要质检人员一字一句进行评估,而语音录音中可能包含有大量其他无关信息,导致无法快速定位到要评估的文本质检内容,从而造成质检人员无法快速定位到要评估的文本内容,即现有技术文本定位功能的定位精确度低,文本定位效率低下,间接降低了质检工作质量和质检效率。
因此,如何实现高精度的文本定位,提高文本定位效率,是当前亟待解决的技术问题。
发明内容
本发明的主要目的在于提供一种文本定位方法、装置、终端及存储介质,旨在解决无法快速定位到要评估的文本质检内容的技术问题。
为实现上述目的,本发明实施例提供一种文本定位方法,所述文本定位方法包括:
获取客服录音,对所述客服录音进行语音识别处理,以获得文本数据;
对所述文本数据进行自然语言标准处理,以获得标准文本数据;
根据所述标准文本数据和所述预设标准话术文本建立编辑距离矩阵,并确定所述编辑距离矩阵中的目标回溯路径;
根据所述目标回溯路径确定文本对应关系,并基于所述文本对应关系计算文本相似度。
可选地,所述根据所述标准文本数据和所述预设标准话术文本建立编辑距离矩阵,并确定所述编辑距离矩阵中的目标回溯路径的步骤包括:
根据所述标准文本数据和所述预设标准话术文本建立编辑距离矩阵,并获取所述编辑距离矩阵中的编辑距离;
确定所述编辑距离中的最小编辑距离,并根据所述最小编辑距离确定目标回溯路径。
可选地,所述根据所述标准文本数据和所述预设标准话术文本建立编辑距离矩阵的步骤包括:
获取预设标准话术文本的质检要素文本,并根据所述预设标准话术文本确定所述标准文本数据中的待检测文本;
获取所述质检要素文本的第一文本长度,并获取所述待检测文本的第二文本长度;
根据所述质检要素文本、所述第一文本长度、所述待检测文本和所述第二文本长度建立编辑距离矩阵。
可选地,所述根据所述最小编辑距离确定目标回溯路径的步骤包括:
获取所述最小编辑距离对应的待检测文本的字符坐标编号,以及所述质检要素文本的字符定位编号;
根据所述字符坐标编号和所述字符定位编号确定目标回溯路径。
可选地,所述基于所述文本对应关系计算文本相似度的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910742420.X/2.html,转载请声明来源钻瓜专利网。