[发明专利]一种基于智能语音的话术训练方法有效
申请号: | 202110013643.X | 申请日: | 2021-01-06 |
公开(公告)号: | CN112668664B | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 刘静文;杨训武;李欢;吴福全;王淋淋 | 申请(专利权)人: | 安徽迪科数金科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/289;G06F16/35;G10L15/06 |
代理公司: | 合肥正则元起专利代理事务所(普通合伙) 34160 | 代理人: | 刘生昕 |
地址: | 230000 安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 智能 语音 的话 训练 方法 | ||
本发明公开了一种基于智能语音的话术训练方法,获取用户信息,将用户信息与预设的数据库进行匹配筛选,得到样本筛选数据;获取语音文本数据,将语音文本数据进行预处理,得到文本向量数据;将文本向量数据与样本筛选数据进行匹配,得到第一匹配数据;将文本向量数据与数据库进行匹配,得到第二匹配数据;获取第一匹配数据和第二匹配数据的初匹相似度,将初匹相似度与预设的相似阈值进行对比,得到相似结果;本发明用于解决只对匹配的数据进行匹配训练导致训练的准确性不佳,对不匹配的数据不能进行有效筛选导致数据训练的完整性不佳的问题。
技术领域
本发明涉及数据训练技术领域,尤其涉及一种基于智能语音的话术训练方法。
背景技术
数据挖掘是用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发现模式的计算过程。训练数据是指数据挖掘过程中用于训练数据挖掘模型的数据,一般要求数据样本尽可能大、数据多样化,数据样本质量较高;
训练数据即数据挖掘过程中用于数据挖掘模型构建的数据,在数据挖掘过程中,除了训练数据还有测试数据,即用于检测模型构建,此数据只在模型检验时使用,用于评估模型的准确率,绝对不允许用于模型构建过程,否则会导致过渡拟合。验证数据:可选,用于辅助模型构建,可以重复使用。当数据集较小,会采用一些方法来来弥补这个缺点。
现有的话术训练方法在的缺陷是:只对匹配的数据进行匹配训练导致训练的准确性不佳,对不匹配的数据不能进行有效筛选导致数据训练的完整性不佳的问题。
发明内容
本发明的目的在于提供一种基于智能语音的话术训练方法,本发明所要解决的技术问题为:
如何解决现有方案中只对匹配的数据进行匹配训练导致训练的准确性不佳,对不匹配的数据不能进行有效筛选导致数据训练的完整性不佳的问题。
本发明的目的可以通过以下技术方案实现:一种基于智能语音的话术训练方法,该话术训练方法的步骤包括:
S1:获取用户信息,将用户信息与预设的数据库进行匹配筛选,得到样本筛选数据;
S2:获取语音文本数据,将语音文本数据进行预处理,得到文本向量数据;
S3:将文本向量数据与样本筛选数据进行匹配,得到第一匹配数据;将文本向量数据与数据库进行匹配,得到第二匹配数据;
S4:获取第一匹配数据和第二匹配数据的初匹相似度,将初匹相似度与预设的相似阈值进行对比,得到相似结果,利用相似结果将样本筛选数据根据第二匹配数据进行迭代筛选,得到样本迭代筛选数据;
S5:将文本向量数据与样本迭代筛选数据进行匹配,得到迭代匹配数据,获取迭代匹配数据与第二匹配数据的迭代相似度,将迭代相似度与预设的相似阈值进行对比,直至根据最大的迭代相似度将其对应的样本迭代筛选数据进行删除或存储。
优选的,将用户信息与预设的数据库进行匹配筛选,得到样本筛选数据,具体的步骤包括:
S21:获取用户信息中的职业数据、公司类型数据、专业数据和咨询类型数据;
S22:设定不同的职业对应一个不同的职业预设值,设定不同的公司类型对应一个不同的公司预设值,设定不同的专业对应一个不同的专业预设值,设定不同的咨询类型对应一个不同的咨询预设值;
S23:将职业数据、公司类型数据、专业数据和咨询类型数据分别与所有的职业、公司类型、专业和咨询类型进行匹配,获取职业数据对应的职业匹配值、公司类型数据对应的公司匹配值、专业数据对应的专业匹配值和咨询类型数据对应的咨询匹配值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽迪科数金科技有限公司,未经安徽迪科数金科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110013643.X/2.html,转载请声明来源钻瓜专利网。