[发明专利]利用言语合成对话语进行响应的方法及装置有效

申请号：	201480031099.X	申请日：	2014-06-02
公开（公告）号：	CN105247609B	公开（公告）日：	2019-04-12
发明（设计）人：	松原弘明;浦纯也;川原毅彦;久凑裕司;吉村克二	申请（专利权）人：	雅马哈株式会社
主分类号：	G10L13/00	分类号：	G10L13/00;G10L13/033;G10L13/10;G10L15/22
代理公司：	北京天昊联合知识产权代理有限公司 11112	代理人：	李铭;崔利梅
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	利用言语成对话语进行响应技术
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明设置有：语音输入单元(102)，其经由语音信号接收话语(询问)；响应产生单元(110)，其创建针对所述话语的响应(回答)的语音序列；音高分析单元(106)，其对所述话语的第一区间(例如，句尾)的音高进行分析；以及语音产生单元(语音合成单元(112)等)，其经由语音产生由所述语音序列表示的响应。所述语音产生单元以如下方式控制整个响应的音高：使所述响应的第二区间(例如，句尾)的音高相对于所述话语的第一区间的音高实现规定的音高(例如，向下五度)。由此实现对能够给用户自然感觉的响应语音的合成。

技术领域

本发明涉及言语或语音合成设备和系统，其响应于通过语音输入产生的话语、询问或说话，提供答复输出，还涉及与语音合成有关的编码/解码装置。

背景技术

近年来，提出了以下语音合成技术。所提出的语音合成技术的示例包括：合成和输出与用户的说话音调和语音质量对应的语音，从而以更类似于人的方式产生语音的技术(例如，参见专利文献1)；以及分析用户的语音以诊断该用户的心理和健康状态等的技术(例如，参见专利文献2)。

近年来还提出了一种语音交互或对话系统，其通过在识别由用户输入的语音的同时以合成的语音输出由场景所指定的内容来实现与用户的语音交互(例如，参见专利文献3)。

现有文献：

专利文献1：日本专利申请特许公开No.2003-271194

专利文献2：日本专利No.4495907

专利文献3：日本专利No.4832097

假设这样一种对话系统，其将上述语音合成技术和语音交互或对话系统结合，并响应于用户的语音给出的询问(用户的口头提问) 而搜索数据并以合成的语音来输出回答或答复。但是，在这种情况下，将出现如下问题：通过语音合成输出的语音给用户不自然的感觉，更具体地，好似机器在说话的感觉。

发明内容

鉴于上述问题，本发明的一个目的是以一种用于通过使用语音合成来响应询问或话语的技术实现对能够给用户自然感觉的响应或答复语音的合成。更具体地，本发明寻求提供一种技术，其能够容易且可控制地实现给用户良好印象的答复语音、给出不好印象的答复语音等。

在研究用以合成对用户所给出的询问(或话语)进行答复的语音的人机系统时，本发明的发明人等首先考虑人与人之间实际进行的是何种对话，关注于非语言信息(即，不同于言语信息或语言信息的非言语信息)，特别是对对话进行表征的音高(频率)。

这里，考虑人与人之间的对话，其中一个人(下文为“人b”) 对另一个人(下文为“人a”)给出的询问返回答复。通常，在这种情况下，当人a讲出询问时，不仅人a而且将要答复该询问的人b 都对该询问中给定区间的音高印象深刻。在对该询问返回具有同意、赞同、肯定等意义的答复时，人b以如下方式讲出答复语音：答复中对答复进行表征的部分(诸如词尾或词首)的音高与(相对于)使人印象深刻的询问的音高呈现预定关系，更具体地，协和音程 (consonant interval)关系。发明人等认为，由于给人a对他或她的询问留下印象的音高与对人b的答复进行表征的部分的音高处于上述关系，因此人a将对人b的答复有舒服和舒适的良好印象。

此外，自从不存在语言的远古时代起的很长时间，人们彼此之间就已经进行了交流。据推测在这种环境下人类语音的音高和音量在人类交流中扮演了非常重要的角色。还据推测，虽然在已经发展了语言的现代基于语音音高的交流被遗忘了，但是自远古时代使用的“预定的音高关系”能够给予“某种舒服的”感觉，因为这种预定的音高关系已经铭记在人类的DNA中并流传至今。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于雅马哈株式会社，未经雅马哈株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201480031099.X/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]利用言语合成对话语进行响应的方法及装置有效

专利文献下载