[发明专利]语义识别方法、装置、存储介质及处理器有效

专利信息
申请号: 202010514884.8 申请日: 2020-06-08
公开(公告)号: CN111739537B 公开(公告)日: 2023-01-24
发明(设计)人: 王晨晖 申请(专利权)人: 北京灵蚌科技有限公司;北京互连众信科技有限公司
主分类号: G10L15/26 分类号: G10L15/26;G10L15/18;G10L15/16;G10L15/06;G10L15/30
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 黄海英
地址: 100125 北京市朝阳区农*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语义 识别 方法 装置 存储 介质 处理器
【说明书】:

本申请公开了一种语义识别方法、装置、存储介质及处理器。该方法包括:将待识别的目标音频数据转化为目标字符串,其中,目标音频数据为通话发起对象和通话接收对象之间的通话音频数据;将目标字符串输入语义分析模型,得到多个标签,其中,语义分析模型包括多个子模型,每个子模型用于预测目标字符串是否归属于子模型描述的标签,每个标签用于表征一种类型的目标语义信息;根据多个标签识别目标音频数据中包含的目标语义信息。通过本申请,解决了相关技术中对语音通话进行语义识别的准确率较低的问题。

技术领域

本申请涉及债务催收语音识别技术领域,具体而言,涉及一种语义识别方法、装置、存储介质及处理器。

背景技术

随着互联网金融的高速发展,消费金融类业务大量涌现,业务监管也越来越重要,例如,在贷款类业务中,贷后监管必不可少。在贷后监管过程中,催收行业是关键,在催收流程中,电话催收任务往往占据较大的比重,具体地,根据催收员的电话录音,对债务人和催收员的话术进行语义识别,从而进一步分析债务人还款意愿、分析催收员行为画像等。

相关技术中对债务人和催收员的话术进行语义识别时存在一些缺陷:第一,在对催收文本进行分析之前,通常是要将音频进行语音转写,并基于转写后的文字进行分析,由于催收员或欠款人的通话中可能存在方言、咬字不清、背景嘈杂等情况,转写后的文字表述不准确。第二,相关技术中在进行语义识别时,大多利用关键词、依存句法分析,或LSTM(Long Short-Term Memery,长短期记忆网络)等循环神经网络进行识别。利用关键词进行语义识别的方式,识别准确率较低,且没有真正意义上理解语句;依存句法分析进行语义识别的方式,由于催收对话文本与书面语言不同,较为口语化,难以达到准确识别的效果;根据循环神经网络进行识别的方式,虽然在长文本分析方面效果显著,但在催收场景下,催收员与债务人之前的对话经常是问答式,且每句长度一般不超过100字,甚至只有几个字,该方式在对短文本识别的效果不佳。此外,循环神经网络模型训练的时间较为漫长,在庞大的数据样本下,模型迭代时间较长。

针对相关技术中对语音通话进行语义识别的准确率较低的问题,目前尚未提出有效的解决方案。

发明内容

本申请提供一种语义识别方法、装置、存储介质及处理器,以解决相关技术中对语音通话进行语义识别的准确率较低的问题。

根据本申请的一个方面,提供了一种语义识别方法。该方法包括:将待识别的目标音频数据转化为目标字符串,其中,目标音频数据为通话发起对象和通话接收对象之间的通话音频数据;将目标字符串输入语义分析模型,得到多个标签,其中,语义分析模型包括多个子模型,每个子模型用于预测目标字符串是否归属于子模型描述的标签,每个标签用于表征一种类型的目标语义信息;根据多个标签识别目标音频数据中包含的目标语义信息。

可选地,将待识别的目标音频数据转化为目标字符串包括:将待识别的目标音频数据转化为目标文字字符串;将目标文字字符串转化为目标拼音字符串,并将目标拼音字符串作为目标字符串。

可选地,在将目标字符串输入语义分析模型,得到多个标签之前,该方法还包括:判断目标字符串是否为脏数据;在目标字符串不属于脏数据的情况下,执行将目标字符串输入语义分析模型,得到多个标签的步骤。

可选地,通话接收对象为第一类对象或第二类对象,语义分析模型包括第一子模型、第二子模型和第三子模型,其中,第一子模型用于描述第一类对象和第二类对象均适用的标签,第二子模型用于描述仅适用于第一类对象的标签,第三子模型用于描述仅适用于第二类对象的标签,将目标字符串输入语义分析模型,得到多个标签包括:将目标字符串输入第一子模型,得到第一标签;基于目标音频数据判断通话接收对象是第一类对象还是第二类对象;在通话接收对象是第一类对象的情况下,将目标字符串输入第二子模型,得到第二标签;在通话接收对象是第二类对象的情况下,将目标字符串输入第三子模型,得到第三标签。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京灵蚌科技有限公司;北京互连众信科技有限公司,未经北京灵蚌科技有限公司;北京互连众信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010514884.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top