[发明专利]一种获取多轮语音通话最大可能意图的方法和智能设备在审
申请号: | 201811608701.8 | 申请日: | 2018-12-27 |
公开(公告)号: | CN109461440A | 公开(公告)日: | 2019-03-12 |
发明(设计)人: | 邓从健;江晓锋;朱栩 | 申请(专利权)人: | 广州云趣信息科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/14;G10L15/22;G10L15/26;G10L25/24;G10L25/45 |
代理公司: | 厦门原创专利事务所(普通合伙) 35101 | 代理人: | 徐东峰 |
地址: | 510000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能设备 语音通话 最大可能 多轮 用户意图 转写 高效获取 连续语音 算法模型 业务参数 业务场景 意图识别 用户语音 语音特征 短语音 文本流 最优解 截断 槽位 引擎 语音 采集 文本 协商 优化 学习 | ||
本发明公开了一种获取多轮语音通话最大可能意图的方法和智能设备,该方法包括:步骤1,智能设备开始采集用户语音;步骤2,智能设备根据语音特征对连续语音截断;步骤3,智能设备把短语音流发给语音转写引擎;步骤4,智能设备接收转写后的文本流,把获取的文本进行意图识别,定义为第一意图状态。该获取多轮语音通话最大可能意图的方法和智能设备,通过多轮语音通话最大可能意图模型的设置,很大程度上解决了目前大部分的算法模型都是主要处理独立的单句意图,或者根据槽位来获取业务参数,无法处理复杂意图的业务场景的问题,并且能够计算最优解,精确获取用户意图,通过意图函数的学习对协商值进行优化,更高效获取用户意图。
技术领域
本发明涉及智能语音和人工智能技术领域,具体为一种获取多轮语音通话最大可能意图的方法和智能设备。
背景技术
随着智能语音识别和人工智能技术的成熟,越来越多语音机器系统的产品出现,语音机器系统最重要的任务就是通过采集到的语音识别用户需求,能捕捉潜在意义和关系的词组和语句的算法模型正在迅速发展,目前大部分的算法模型都是主要处理独立的单句意图,或者根据槽位来获取业务参数,无法处理复杂意图的业务场景,而多轮语音通话最大可能意图模型,很大程度上解决了这些问题,通过多轮的通话逐步逼近用户真正意图,上述技术方案里的模型初始参数是预设在该智能设备上,不同业务场景的初始参数是不同的,如何确定合适的模型初始参数是一个需要解决问题。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种获取多轮语音通话最大可能意图的方法和智能设备,具备处理多伦语音通话意图等优点,解决了目前大部分的算法模型都是主要处理独立的单句意图,或者根据槽位来获取业务参数,无法处理复杂意图的业务场景的问题。
(二)技术方案
为实现上述处理多伦语音通话意图的目的,本发明提供如下技术方案:一种获取多轮语音通话最大可能意图的方法和智能设备,所述方法包括:
步骤1:智能设备采集语音,并对语音进行编码,得到编码后的连续语音数据流,根据语音特征断句算法把连续语音流截断为有序的短语音流;
步骤2:利用语音转写引擎,短语音流转换为文本流,文本流作为意图识别的输入计算出状态-意图以及状态-意图概率;
步骤3:状态-意图概率如果大于约定值,则该状态为最大可能意图;
步骤4:如果状态概率如果小于约定值,就循环步骤1-3,计算每一轮次状态-意图概率,直到该概率大于约定值。
优选的,使用有效时长、单位时长语音能量值、单位时长过零率和频谱特征,计算语音特征,把等到的语音特征跟预设的断句语音特征比较,如果两者相符就认为符合断句条件。
优选的,语音特征是一个包含16个元素的一维数组。前面三个分别是语音的有效时长、单位时长语音能量值、单位时长过零率,后面13个是通过梅尔频率倒谱系数计算得到的前13个低频分量。
优选的,每一轮次通话定义为一个状态,状态的输入是文本流,每个状态的输出只能是-1、0和1其中之一,状态输出的概率就是状态-意图概率。
优选的,a)N个意图状态,使用Q=q1q2…qNQ=q1q2…qN来表示;
b)转移概率矩阵An×n={aij},i,j∈{1,2,…,N},其中aijaij表示从状态ii转移到状态jj的概率;
c)T个观测结果的序列,用O=o1o2…oT来表示;
d)一系列生成概率,记作B={bi(ot)},i∈{1,2,…,N},t∈{1,2,…,T},表示状态ii产生观测结果ot的概率;
e)状态-意图概率为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州云趣信息科技有限公司,未经广州云趣信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811608701.8/2.html,转载请声明来源钻瓜专利网。