[发明专利]语义识别方法、装置、存储介质及处理器有效
申请号: | 202010514884.8 | 申请日: | 2020-06-08 |
公开(公告)号: | CN111739537B | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | 王晨晖 | 申请(专利权)人: | 北京灵蚌科技有限公司;北京互连众信科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/18;G10L15/16;G10L15/06;G10L15/30 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 黄海英 |
地址: | 100125 北京市朝阳区农*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 识别 方法 装置 存储 介质 处理器 | ||
本申请公开了一种语义识别方法、装置、存储介质及处理器。该方法包括:将待识别的目标音频数据转化为目标字符串,其中,目标音频数据为通话发起对象和通话接收对象之间的通话音频数据;将目标字符串输入语义分析模型,得到多个标签,其中,语义分析模型包括多个子模型,每个子模型用于预测目标字符串是否归属于子模型描述的标签,每个标签用于表征一种类型的目标语义信息;根据多个标签识别目标音频数据中包含的目标语义信息。通过本申请,解决了相关技术中对语音通话进行语义识别的准确率较低的问题。
技术领域
本申请涉及债务催收语音识别技术领域,具体而言,涉及一种语义识别方法、装置、存储介质及处理器。
背景技术
随着互联网金融的高速发展,消费金融类业务大量涌现,业务监管也越来越重要,例如,在贷款类业务中,贷后监管必不可少。在贷后监管过程中,催收行业是关键,在催收流程中,电话催收任务往往占据较大的比重,具体地,根据催收员的电话录音,对债务人和催收员的话术进行语义识别,从而进一步分析债务人还款意愿、分析催收员行为画像等。
相关技术中对债务人和催收员的话术进行语义识别时存在一些缺陷:第一,在对催收文本进行分析之前,通常是要将音频进行语音转写,并基于转写后的文字进行分析,由于催收员或欠款人的通话中可能存在方言、咬字不清、背景嘈杂等情况,转写后的文字表述不准确。第二,相关技术中在进行语义识别时,大多利用关键词、依存句法分析,或LSTM(Long Short-Term Memery,长短期记忆网络)等循环神经网络进行识别。利用关键词进行语义识别的方式,识别准确率较低,且没有真正意义上理解语句;依存句法分析进行语义识别的方式,由于催收对话文本与书面语言不同,较为口语化,难以达到准确识别的效果;根据循环神经网络进行识别的方式,虽然在长文本分析方面效果显著,但在催收场景下,催收员与债务人之前的对话经常是问答式,且每句长度一般不超过100字,甚至只有几个字,该方式在对短文本识别的效果不佳。此外,循环神经网络模型训练的时间较为漫长,在庞大的数据样本下,模型迭代时间较长。
针对相关技术中对语音通话进行语义识别的准确率较低的问题,目前尚未提出有效的解决方案。
发明内容
本申请提供一种语义识别方法、装置、存储介质及处理器,以解决相关技术中对语音通话进行语义识别的准确率较低的问题。
根据本申请的一个方面,提供了一种语义识别方法。该方法包括:将待识别的目标音频数据转化为目标字符串,其中,目标音频数据为通话发起对象和通话接收对象之间的通话音频数据;将目标字符串输入语义分析模型,得到多个标签,其中,语义分析模型包括多个子模型,每个子模型用于预测目标字符串是否归属于子模型描述的标签,每个标签用于表征一种类型的目标语义信息;根据多个标签识别目标音频数据中包含的目标语义信息。
可选地,将待识别的目标音频数据转化为目标字符串包括:将待识别的目标音频数据转化为目标文字字符串;将目标文字字符串转化为目标拼音字符串,并将目标拼音字符串作为目标字符串。
可选地,在将目标字符串输入语义分析模型,得到多个标签之前,该方法还包括:判断目标字符串是否为脏数据;在目标字符串不属于脏数据的情况下,执行将目标字符串输入语义分析模型,得到多个标签的步骤。
可选地,通话接收对象为第一类对象或第二类对象,语义分析模型包括第一子模型、第二子模型和第三子模型,其中,第一子模型用于描述第一类对象和第二类对象均适用的标签,第二子模型用于描述仅适用于第一类对象的标签,第三子模型用于描述仅适用于第二类对象的标签,将目标字符串输入语义分析模型,得到多个标签包括:将目标字符串输入第一子模型,得到第一标签;基于目标音频数据判断通话接收对象是第一类对象还是第二类对象;在通话接收对象是第一类对象的情况下,将目标字符串输入第二子模型,得到第二标签;在通话接收对象是第二类对象的情况下,将目标字符串输入第三子模型,得到第三标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京灵蚌科技有限公司;北京互连众信科技有限公司,未经北京灵蚌科技有限公司;北京互连众信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010514884.8/2.html,转载请声明来源钻瓜专利网。