[发明专利]一种语音交互方法、设备及存储介质在审
申请号: | 201810789292.X | 申请日: | 2018-07-18 |
公开(公告)号: | CN110164411A | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | 罗俊;陈敏;黄归;龙振海 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/04 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音交互设备 文本 反馈 语音交互 预置 原始语音信息 播放格式 存储介质 语音信息 存储 通信技术领域 用户输入语音 网络流量 用户触摸 语音播放 高频率 后台 储存 采集 应用 | ||
本发明实施例公开了语音交互方法、设备及存储介质,应用于通信技术领域。在本实施例的方法中,在语音交互设备的本地存储中事先储存预置类型的文本对应的原始语音信息和/或播放格式语音信息,这样,当语音交互设备采集到用户输入语音或接收到用户触摸信息,确定对应的反馈文本,如果该反馈文本为预置类型的文本,直接从本地存储中即可获取到对应的原始语音信息和/或播放格式语音信息,以进行语音播放,可以省去语音交互设备与语音交互后台之间的网络流量,进而减少了语音交互设备向用户的反馈时间。且如果预置类型的文本是高频率的反馈文本,可以进一步地减少语音交互设备向用户的反馈时间。
技术领域
本发明涉及通信技术领域,特别涉及一种语音交互方法、设备及存储介质。
背景技术
现有很多应用都具有语音交互功能,比如,苹果操作系统(iphone operationsystem,IOS)中的siri,这样可以给用户带来很多趣味,这些语音交互功能主要通过如下的方法来实现:
用户操作语音交互设备后,语音交互设备会用户操作确定反馈给用户的文本,并向语音交互后台获取该文本对应的语音信息进行播放,其中,语音交互后台会按照文字转语音(text-to-speech,TTS)算法得到对应的语音信息。
在上述语音交互过程中,当用户操作语音交互设备后,为了减少用户等待语音交互设备反馈的时间,一般都是对语音交互后台的TTS算法进行优化,但是这种方法的难度较大,需要对TTS算法有一定研究的用户才能实现。
发明内容
本发明实施例提供一种语音交互方法、设备及存储介质,实现了可以直接从本地存储中获取预置类型的文本的原始语音信息和/或播放格式语音信息。
本发明实施例第一方面提供一种语音交互方法,包括:
采集语音交互设备的用户输入语音或接收对所述语音交互设备的用户触摸信息;
根据所述用户输入语音或用户触摸信息确定对应的反馈文本;
如果所述反馈文本为预置类型的文本,从所述语音交互设备的本地存储中获取所述反馈文本对应的原始语音信息和/或播放格式语音信息;
根据所述原始语音信息和/或播放格式语音信息进行语音播放。
本发明实施例第二方面提供一种语音交互设备,包括:
用户信息获取单元,用于采集语音交互设备的用户输入语音或接收对所述语音交互设备的用户触摸信息;
文本确定单元,用于根据所述用户输入语音或用户触摸信息确定对应的反馈文本;
语音获取单元,用于如果所述反馈文本为预置类型的文本,从所述语音交互设备的本地存储中获取所述反馈文本对应的原始语音信息和/或播放格式语音信息;
播放单元,用于根据所述原始语音信息和/或播放格式语音信息进行语音播放。
本发明实施例第三方面提供一种存储介质,所述存储介质储存多条指令,所述指令适于由处理器加载并执行如本发明实施例第一方面所述的语音交互方法。
本发明实施例第四方面提供一种终端设备,包括处理器和存储介质,所述处理器,用于实现各个指令;
所述存储介质用于储存多条指令,所述指令用于由处理器加载并执行如本发明实施例第一方面所述的语音交互方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810789292.X/2.html,转载请声明来源钻瓜专利网。