[发明专利]语音合成的方法和装置有效
申请号: | 201510282063.5 | 申请日: | 2015-05-28 |
公开(公告)号: | CN104882139B | 公开(公告)日: | 2017-03-15 |
发明(设计)人: | 李秀林 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 方法 装置 | ||
技术领域
本发明涉及文语转换技术领域,尤其涉及一种语音合成的方法和装置。
背景技术
语音合成,又称文语转换技术,是一种能够将文字信息转化为语音并进行朗读的技术。随着科技的不断进步,语音合成的应用越来越广泛,如新闻与信息的播报、有声小说等。在日常生活中,也可通过语音合成,将短信、邮件等信息合成为语音,为用户多提供一种获取信息的方式。
目前,语音合成主要是将人工输入或OCR扫描获得的文字信息转换为语音。
但是,在获得文字信息时,可能会出现文字信息输入错误的情况。例如:文字录入人员在使用拼音输入法输入文字信息时,可能会产生拼写错误,也可能因为相同的拼音对应多个不同的汉字,造成文字信息选择错误。再例如:通过OCR扫描获得文字信息,由于汉字相似字过多,对文字进行识别时具有一定的误差,可能使获取的文字信息错误。进一步地,在语音合成时,对错误的文字信息直接进行转换,会导致输出的语音信息与应该输入的文字信息不一致,不易于理解,从而降低了语音信息接收用户的使用体验。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的在于提出一种语音合成的方法,该方法能够对输入文本进行纠错,进而在根据输入文本进行语音合成时,更加准确,使生成的语音信息自然流畅,易于理解。
本发明的第二个目的在于提出一种语音合成的装置。
为了实现上述目的,本发明第一方面实施例提出了一种语音合成的方法,包括:S1、获取输入文本,并获取所述输入文本对应的输入类型;S2、根据所述输入类型确定纠错模型,并根据所述纠错模型对所述输入文本进行纠错处理;以及S3、将纠错后的所述输入文本合成为语音。
本发明实施例的语音合成的方法,通过获取输入文本,并获取输入文本对应的输入类型,根据输入类型确定纠错模型,并根据纠错模型对输入文本进行纠错处理,以及将纠错后的输入文本合成为语音,可利用纠错模型对输入文本进行纠错,提升了文本输入时的准确性,进而在语音合成时,生成的语音信息更加自然流畅,易于理解,符合语言习惯,最终提升用户使用体验。
本发明第二方面实施例提出了一种语音合成的装置,包括:获取模块,用于获取输入文本,并获取所述输入文本对应的输入类型;纠错模块,用于根据所述输入类型确定纠错模型,并根据所述纠错模型对所述输入文本进行纠错处理;以及合成模块,用于将纠错后的所述输入文本合成为语音。
本发明实施例的语音合成的装置,通过获取输入文本,并获取输入文本对应的输入类型,根据输入类型确定纠错模型,并根据纠错模型对输入文本进行纠错处理,以及将纠错后的输入文本合成为语音,可利用纠错模型对输入文本进行纠错,提升了文本输入时的准确性,进而在语音合成时,生成的语音信息更加自然流畅,易于理解,符合语言习惯,最终提升用户使用体验。
附图说明
图1是根据本发明一个实施例的语音合成的方法的流程图。
图2是根据本发明一个具体实施例的语音合成的方法的流程图。
图3是根据本发明一个实施例的语音合成的装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的语音合成的方法和装置。
图1是根据本发明一个实施例的语音合成的方法的流程图。
如图1所示,语音合成的方法可包括:
S101,获取输入文本,并获取输入文本对应的输入类型。
其中,输入类型可包括拼音输入、五笔输入、OCR输入等。
举例来说,输入文本为“2015年3月全国平斤气温是5.8℃。”,对应的输入类型为拼音输入。
S102,根据输入类型确定纠错模型,并根据纠错模型对输入文本进行纠错处理。
在本发明的实施例中,可根据输入类型确定纠错模型。当输入类型为拼音输入时,可根据第一纠错模型对输入文本进行纠错处理,第一纠错模型是基于拼音序列数据训练得到的模型。当输入类型为五笔输入或OCR输入时,可根据第二纠错模型对输入文本进行纠错处理,第二纠错模型是基于字根序列数据训练得到的模型。其中,以上纠错模型可包括N-GRAM模型、HMM模型、CRF模型、深度神经网络模型中的一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510282063.5/2.html,转载请声明来源钻瓜专利网。