[发明专利]有声读物的语音合成方法和装置在审
申请号: | 201510412370.0 | 申请日: | 2015-07-14 |
公开(公告)号: | CN105096932A | 公开(公告)日: | 2015-11-25 |
发明(设计)人: | 刘孟;王道龙;李军;刘晓伟;李华明;袁艺;张钰;燕宇飞;易敏文;吕文玉;袁正沧;方驰 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆;胡彬 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 有声读物 语音 合成 方法 装置 | ||
技术领域
本发明实施例涉及语音合成技术领域,尤其涉及一种有声读物的语音合成方法和装置。
背景技术
近年来,听书成为一种时尚潮流,越来越多的人开始接触有声读物,听书成为在公交车上打发时间,在睡觉前放松心情,在做家务时添加情趣的全新娱乐方式。有调查显示,在2008年的暑假中,排在大中学生的假期娱乐活动的前三甲是:看奥运、听书、玩网游。听书在我国作为一种新的娱乐方式,已经开始崭露头角。
在听书平台上,有声读物是这些平台上最为重要的数据资源。有声读物的制作方式可以分为人工方式和自动方式。人工的有声读物制作方式为不同的小说著作,单独的录制有声读物。显然,这种制作方式的重复工作量较大。而现有的采用文本解析和语音合成的自动有声读物制作方式并不针对不同的人物,或者不同的场景输出不同类型的语音,造成制作的有声读物的逼真度不高,难以受到听众的欢迎。
发明内容
针对上述技术问题,本发明实施例提供了一种有声读物的语音合成方法和装置,以提高自动合成的有声读物的逼真度。
第一方面,本发明实施例提供了一种有声读物的语音合成方法,所述方法包括:
提取所述有声读物中文本片段的属性标签;
根据所述属性标签,从语音库中调取与所述属性标签对应的声音,形成所述有声读物的语音。
第二方面,本发明实施例还提供了一种有声读物的语音合成装置,所述装置包括:
标签提取模块,用于提取所述有声读物中文本片段的属性标签;
语音输出模块,用于根据所述属性标签,从语音库中调取与所述属性标签对应的声音,形成所述有声读物的语音。
本发明实施例提供的有声读物的语音合成方法和装置通过提取所述有声读物中文本片段的属性标签,根据所述属性标签,从所述语音库中调取与属性对应的声音,形成所述有声读物的语音,从而使得制作的有声读物针对不同的人物输出不同类型的语音,提高了自动制作的有声读物的逼真度。
附图说明
图1是本发明实施例一提供的有声读物的语音合成方法的流程图;
图2是本发明实施例三提供的有声读物的语音合成方法中语音输出的流程图;
图3是本发明实施例四提供的有声读物的语音合成方法的流程图;
图4是本发明实施例五提供的有声读物的语音合成方法的流程图;
图5是本发明实施例六提供的有声读物的语音合成方法的流程图;
图6是本发明实施例七提供的有声读物的语音合成装置的结构图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
本实施例提供了有声读物的语音合成方法的一种技术方案。在该技术方案中,所述有声读物的语音合成方法包括:提取所述有声读物中文本片段的属性标签;根据所述属性标签,从语音库中调取与所述属性标签对应的声音,形成所述有声读物的语音。
参见图1,所述有声读物的语音合成方法包括:
S11,提取所述有声读物中文本片段的属性标签。
所述文本片段是通过对需要制作有声读物的文本进行分析而得到的文本的片段。所述文本片段是通过上述分析而划分得到的。优选的,所述分析是对原始文本的分段操作。进一步优选的,所述分析是依据原始文本中的标点符号以及敏感词语而执行的分段操作。具体的,所述分析可以是依据原始文本中的双引号而执行的分段操作。并且,所述文本片段可以是语句或者语段。
通过对所述文本的语义分析,可以得到所述文本片段的不同的属性标签。所述属性标签可以是说话人的基本属性标签、场景属性标签或者场景图像属性标签。
所述说话人的基本属性标签中记录了所述文本片段对应的说话人的基本属性。比如,所述说话人的基本属性标签可以是说话人的性别标签、说话人的年龄段标签和/或说话人的口音标签。而不同类型的说话人的基本属性标签的取值,可以通过对原始文本的语义分析而获得。比如,原始文本中出现:“小美这个小妮子很聪明”,则可以确定说话人“小美”的性别标签的取值是女性,并且她的年龄段标签的取值是15岁到25岁之间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510412370.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于语音激活检测的唤醒装置及方法
- 下一篇:垫体的支承结构