[发明专利]用户语音数据处理方法、装置及电子设备在审
申请号: | 202111567987.1 | 申请日: | 2021-12-21 |
公开(公告)号: | CN114333809A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 郑渊中;叶峰;朱小波;疏北平 | 申请(专利权)人: | 上海淇玥信息技术有限公司 |
主分类号: | G10L15/197 | 分类号: | G10L15/197;G10L15/22;G10L15/06 |
代理公司: | 北京清诚知识产权代理有限公司 11691 | 代理人: | 何怀燕 |
地址: | 201500 上海市崇明*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 语音 数据处理 方法 装置 电子设备 | ||
本申请涉及一种用户语音数据处理方法、装置、电子设备及计算机可读介质。该方法包括:获取来自用户的语音数据;将所述语音数据输入声学模型中,生成多个音素数据;将所述音素数据输入发音模型中,生成多维字符查询矩阵,所述多维字符查询矩阵中包括多个维度,每个维度均包括多个字符和其对应的概率值;将所述多维字符查询矩阵输入语言模型中,生成语义文本;基于所述语义文本生成响应数据以反馈给所述用户。本申请涉及的用户语音数据处理方法、装置、电子设备及计算机可读介质,能够快速准确的对用户的语音数据进行识别,从而更加顺畅的和用户进行交互,快速响应用户的指令,提升用户整体满意度、提升业务处理效率。
技术领域
本申请涉及计算机信息处理领域,具体而言,涉及一种用户语音数据处理方法、装置、电子设备及计算机可读介质。
背景技术
智能语音机器人基于语音识别与合成、机器学习和自然语言理解等技术,根据业务场景自动发起智能语音机器人电话外呼任务,通过人与机器人的语音对话交互收集业务结果,并对数据加以统计处理,获取用户反馈。智能语音机器人是面向开发者的会话智能语音机器人,可在不同的消息端上实现基于自然语言处理的智能会话,如网站、APP及实体机器人等。用户可以配置自己特有的知识库实现智能问答,也可以通过多轮对话与第三方API集成实现自助服务,如:订单查询,物流跟踪,自助退货机器人等。智能语音机器人能实现从对话录音或者对话文本中,基于智能规则,分析对话内容,挖掘对话中可能存在的问题和机会。能帮助企业提升服务质量、监控舆情风险、优化服务策略,典型应用场景有智能客服质检、销售机会分析等。
智能语音机器技术落地商业用途时,往往是针对某一个场景仿真训练,进而生成语义识别类的机器学习模型解决问题。而在落地时,现实生活往往会使机器学习模型出现长尾问题。长尾问题的出现一部分原因是模型训练数据的覆盖不完整,另一部分原因是模型设计之初并未考虑到某种场景,这些场景可以包括识别环境的噪声非常大,亦或是多人讨论,再或者是待识别场景出现大量不常见的专用名词(例如原发性高草尿酸症1型,诺西那生钠等)等。针对第一部分原因,研究者可以采取扩充数据集的做法来解决,这往往是解决长尾问题的首选方案,但过多数据往往会使得模型计算复杂度增加;针对第二方面原因,更多是从业务逻辑和业务场景去解决,并没有一个很好的解决方案。
因此,需要一种新的用户语音数据处理方法、装置、电子设备及计算机可读介质。
在所述背景技术部分公开的上述信息仅用于加强对本申请的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
有鉴于此,本申请提供一种用户语音数据处理方法、装置、电子设备及计算机可读介质,能够快速准确的对用户的语音数据进行识别,从而更加顺畅的和用户进行交互,快速响应用户的指令,提升用户整体满意度、提升业务处理效率。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请的一方面,提出一种用户语音数据处理方法,该方法包括:获取来自用户的语音数据;将所述语音数据输入声学模型中,生成多个音素数据;将所述音素数据输入发音模型中,生成多维字符查询矩阵,所述多维字符查询矩阵中包括多个维度,每个维度均包括多个字符和其对应的概率值;将所述多维字符查询矩阵输入语言模型中,生成语义文本;基于所述语义文本生成响应数据以反馈给所述用户。
可选地,还包括:基于多个历史语音数据对语音识别模型进行训练以生成所述声学模型;基于多个历史音素数据对3-gram模型进行训练以生成所述发音模型;基于多个历史多维字符查询矩阵对GRU模型进行训练以生成所述语言模型。
可选地,将所述音素数据输入发音模型中,生成多维字符查询矩阵,包括:将所述音素数据输入发音模型;所述发音模型将所述音素数据切分为多个短音频;对所述多个短音频的出现频率进行统计,生成多组统计结果;根据多组统计结果为多维初始查询矩阵中的字符赋值以生成所述多维字符查询矩阵;其中所述多维初始查询矩阵中的字符值为0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海淇玥信息技术有限公司,未经上海淇玥信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111567987.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种内螺纹精密磨削方法
- 下一篇:一种高纯度的维生素B6的制备方法