[发明专利]一种基于录音对话的自然语言理解模型的建立方法有效

申请号：	201910960980.2	申请日：	2019-10-11
公开（公告）号：	CN110728145B	公开（公告）日：	2023-08-29
发明（设计）人：	崔晶晶;左琦	申请（专利权）人：	集奥聚合（北京）人工智能科技有限公司
主分类号：	G06F40/289	分类号：	G06F40/289;G06F16/35;G06F18/214;G06F18/241;G06N3/0464;G06N3/08
代理公司：	北京瑞盛铭杰知识产权代理事务所(普通合伙) 11617	代理人：	李绩
地址：	100024 北京市朝***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于录音对话自然语言理解模型建立方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提出了一种基于录音对话的自然语言理解模型的建立方法，包括：获取针对一个拨叫方的多组对话录音的音频数据，将所述对话录音的音频数据转换为文字数据；向所述拨叫方和多个接听方分配对应的ID，将每组对话的文字数据根据ID进行划分；然后根据文字内容设置标签；将设置标签后的文字数据进行数据清洗，划分数据集为训练集和测试集；将训练集放入预设训练模型中进行训练，输出模型。本发明通过调节隐层和神经元的参数提高了预测的准确性。本发明可以适用于贷款逾期以后的场景下的自然语言理解模型。

技术领域

本发明涉及自然语音处理技术领域，特别涉及一种基于录音对话的自然语言理解模型的建立方法。

背景技术

当前，虽然许多公司都有设计了的自然语言理解模型，但都是通用场景下的技术方案，针对特定场景下的自然语言理解模型目前还没有，尤其是针对贷款逾期以后的场景下的自然语言理解模型。

发明内容

本发明的目的旨在至少解决所述技术缺陷之一。

为此，本发明的目的在于提出一种基于录音对话的自然语言理解模型的建立方法。

为了实现上述目的，本发明的实施例提供一种基于录音对话的自然语言理解模型的建立方法，包括如下步骤：

步骤S1，获取针对一个拨叫方的多组对话录音的音频数据，将所述对话录音的音频数据转换为文字数据；

步骤S2，向所述拨叫方和多个接听方分配对应的ID，将每组对话的文字数据根据ID进行划分；

步骤S3，然后根据文字内容设置标签；

步骤S4，将设置标签后的文字数据进行数据清洗，划分数据集为训练集和测试集；