[发明专利]一种实现智能语音对话的方法、装置及系统有效
申请号: | 201810105481.0 | 申请日: | 2018-02-02 |
公开(公告)号: | CN110136719B | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 翁翔坚;林晖;刘翔;韩旭 | 申请(专利权)人: | 上海流利说信息技术有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26 |
代理公司: | 北京信远达知识产权代理有限公司 11304 | 代理人: | 魏晓波 |
地址: | 200092 上海市杨浦区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实现 智能 语音 对话 方法 装置 系统 | ||
1.一种实现智能语音对话的方法,其特征在于,所述方法包括:
接收客户端录制的语音信号;
将所述语音信号转化为语音文本;
确定所述语音文本对应的语义;
确定所述语义对应的语言逻辑;
确定所述语言逻辑对应的对话文本;
合成所述对话文本对应的音频文件;
向客户端发送所述音频文件;
其中,所述确定所述语言逻辑对应的对话文本包括:
基于语言信号的语言文本确定预设作答规则;基于所述预设作答规则,结合上下文对所述语言逻辑选取出具体场景下合适的对话文本;
或者,基于语言信号的得分确定预设作答规则;基于所述预设作答规则,针对得分高低不同的语言信号,选取出难易程度不同的对话文本;
其中,所述预设作答规则为基于语言逻辑确定对话文本时的确定原则。
2.根据权利要求1所述的方法,其特征在于,所述确定所述语音文本对应的语义包括:
基于第一预设选取规则,选取所述语音文本中的至少一个关键词;
基于所述至少一个关键词确定语义。
3.根据权利要求1所述的方法,其特征在于,所述确定所述语义对应的语言逻辑包括:
确定所述语义对应的至少一个预设逻辑配置;
基于第二预设选取规则,从所述至少一个预设逻辑配置中确定语言逻辑。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
判断所述对话文本是否与预设目标文本一致;
若所述对话文本与所述预设目标文本一致时,则结束对话。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于预设评分标准,确定所述语音信号的至少一个维度的分值。
6.根据权利要求1-5任一所述的方法,其特征在于,所述方法还包括:
当接收到求助指令时,基于当前对话文本确定至少一个参考对话文本;
向客户端发送所述至少一个参考对话文本。
7.一种实现智能语音对话的装置,其特征在于,所述装置包括:
语音接收模块,用于接收客户端录制的语音信号;
文本转化模块,用于将所述语音信号转化为语音文本;
语义确定模块,用于确定所述语音文本对应的语义;
逻辑确定模块,用于确定所述语义对应的语言逻辑;
文本确定模块,用于确定所述语言逻辑对应的对话文本;
音频合成模块,用于合成所述对话文本对应的音频文件;
音频发送模块,用于向客户端发送所述音频文件;
其中,所述确定所述语言逻辑对应的对话文本包括:
基于语言信号的语言文本确定预设作答规则;基于所述预设作答规则,结合上下文对所述语言逻辑选取出具体场景下合适的对话文本;
或者,基于语言信号的得分确定预设作答规则;基于所述预设作答规则,针对得分高低不同的语言信号,选取出难易程度不同的对话文本;
其中,所述预设作答规则为基于语言逻辑确定对话文本时的确定原则。
8.根据权利要求7所述的装置,其特征在于,所述语义确定模块包括:
关键词选取子模块,用于基于第一预设选取规则,选取所述语音文本中的至少一个关键词;
第一确定子模块,用于基于所述至少一个关键词确定语义。
9.一种实现智能语音对话的系统,其特征在于,所述系统包括:客户端、服务器;其中,
所述客户端,用于接收场景指令,向服务器发送该场景指令;
所述服务器,用于基于所述场景指令开启智能语音对话的功能,并基于该场景指令对应的场景向客户端发起首轮对话,当接收到客户端录制的语音信号时,将所述语音信号转化为语音文本,确定所述语音文本对应的语义,确定所述语义对应的语言逻辑,确定所述语言逻辑对应的对话文本,合成所述对话文本对应的音频文件,向客户端发送所述音频文件;
所述客户端,还用于接收所述音频文件,播放所述音频文件;
其中,所述确定所述语言逻辑对应的对话文本包括:
基于语言信号的语言文本确定预设作答规则;基于所述预设作答规则,结合上下文对所述语言逻辑选取出具体场景下合适的对话文本;
或者,基于语言信号的得分确定预设作答规则;基于所述预设作答规则,针对得分高低不同的语言信号,选取出难易程度不同的对话文本;
其中,所述预设作答规则为基于语言逻辑确定对话文本时的确定原则。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海流利说信息技术有限公司,未经上海流利说信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810105481.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:语音控制的方法和装置
- 下一篇:编辑支援装置、编辑支援方法以及程序