[发明专利]语音交互方法和装置有效

申请号：	201810568760.0	申请日：	2018-06-05
公开（公告）号：	CN108766429B	公开（公告）日：	2020-08-21
发明（设计）人：	路华;黄世维;黄硕	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L13/02;G06F16/65
代理公司：	北京英赛嘉华知识产权代理有限责任公司 11204	代理人：	王达佐;马晓亚
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音交互方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例公开了语音交互方法和装置。该方法的一具体实施方式包括：提取包含目标词语音片段的第一语音信息；在该目标词语音片段处叠加提示音，语音输出叠加提示音后的第一语音信息，该提示音用于提示当前所播报的内容为目标词；响应于采集到用户反馈的第二语音信息，将该第二语音信息与该目标词进行匹配；响应于确定该第二语音信息与该目标词相匹配，语音输出与该目标词相关联的第三语音信息。该实施方式提高了语音交互的效率。

技术领域

本申请实施例涉及计算机技术领域，具体涉及语音交互方法和装置。

背景技术

随着计算机技术的发展，语音交互产品的种类越来越丰富。在纯语音交互的产品中，用户表达不受图形界面限制，自由度极高，通常需要对用户的回答进行限制。因此，在纯语音交互环境下，高效且低成本地告知用户有那些限制尤为重要。

现有的方式，通常是通过图形界面给予用户相应提示，用户在阅读说明或者教程后，了解可以使用的语音指令。现有的另一方式，可以通过语音输出的方式，告知用户可使用的语音指令。

发明内容

本申请实施例提出了语音交互方法和装置。

第一方面，本申请实施例提供了一种语音交互方法，该方法包括：提取包含目标词语音片段的第一语音信息；在目标词语音片段处叠加提示音，语音输出叠加提示音后的第一语音信息，提示音用于提示当前所播报的内容为目标词；响应于采集到用户反馈的第二语音信息，将第二语音信息与目标词进行匹配；响应于确定第二语音信息与目标词相匹配，语音输出与目标词相关联的第三语音信息。

在一些实施例中，在目标词语音片段处叠加提示音，语音输出叠加提示音后的第一语音信息，包括：在目标词语音片段的起始处叠加脉冲型的提示音，语音输出叠加提示音后的第一语音信息，其中，提示音在目标词语音片段的结束处之前结束。

在一些实施例中，在目标词语音片段处叠加提示音，语音输出叠加提示音后的第一语音信息，包括：在目标词语音片段的起始处叠加持续型的提示音，语音输出叠加提示音后的第一语音信息，其中，提示音在目标词语音片段结束时结束。

在一些实施例中，响应于确定第二语音信息与目标词相匹配，语音输出与目标词相关联的第三语音信息，包括：响应于确定第二语音信息与目标词相匹配，确定第一语音信息的类型，基于第一语音信息的类型，确定与目标词相关联的第三语音信息，语音输出第三语音信息。

在一些实施例中，基于第一语音信息的类型，确定与目标词相关联的第三语音信息，语音输出第三语音信息，包括：响应于确定第一语音信息的类型为新闻播报类，生成包含目标词的信息搜索请求；向服务器发送信息搜索请求，接收服务器返回的搜索结果；将搜索结果所对应的语音信息作为第三语音信息，语音输出第三语音信息。

在一些实施例中，基于第一语音信息的类型，确定与目标词相关联的第三语音信息，语音输出第三语音信息，包括：响应于确定第一语音信息的类型为业务查询类，生成包含目标词的业务查询请求；向服务器发送业务查询请求，接收服务器返回的查询结果；将查询结果所对应的语音信息作为第三语音信息，语音输出第三语音信息。

在一些实施例中，基于第一语音信息的类型，确定与目标词相关联的第三语音信息，语音输出第三语音信息，包括：响应于确定第一语音信息的类型为信息确认类，生成用于指示跳转至预设的下一条语音信息的跳转指令，将下一条语音信息确定为第三语音信息。

在一些实施例中，提示音的音量小于目标词语音片段的音量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司，未经北京百度网讯科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810568760.0/2.html，转载请声明来源钻瓜专利网。

上一篇：一种语音播报控制方法及系统
下一篇：一种基于巴氏距离的语音特征映射方法及系统

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音交互方法和装置有效

专利文献下载