[发明专利]语音处理方法、装置和介质在审
申请号: | 202010763575.4 | 申请日: | 2020-07-31 |
公开(公告)号: | CN112037756A | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 叶一川 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G10L13/04 | 分类号: | G10L13/04;G10L13/047;G10L13/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 处理 方法 装置 介质 | ||
本发明实施例提供了一种语音处理方法和装置、一种用于语音处理的装置,其中的方法具体包括:展示文本中多音字当前的读音信息;所述文本用于语音合成处理;所述当前的读音信息为依据所述多音字及其上下文得到;依据用户针对所述当前的读音信息的纠正操作,展示所述多音字对应的读音输入接口,以供用户输入修正后的读音信息;依据修正后的读音信息,对所述文本进行语音合成。本发明实施例能够提高读音纠错的效率。
技术领域
本发明涉及通信技术领域,特别是涉及一种语音处理方法和装置、一种机器可读介质。
背景技术
随着通信技术的发展,蓝牙耳机、智能音箱等音频设备的普及,音频内容消费在近年持续增长,包括无线电台、网络播客、有声读物、知识节目等。随时随地以“听”的方式获取声音陪伴成为了更多用户的选择,在驾驶、通勤、睡前等场景中能够轻松获得沉浸式的新闻、学习、娱乐、音乐等有声体验。
目前,可以将用户指定的文本,转换为音频内容,并支持音频内容的试听。在音频内容的试听过程中,若用户发现读音的错误,可以支持用户提供正确的读音,以依据正确的读音对音频内容进行修正。
发明人在实施本发明实施例的过程中发现,用户需要通过试听的方式完成读音纠错,使得语音纠错花费较多的时间成本,进而使得语音纠错的效率较低。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的语音处理方法、语音处理装置及用于语音处理的装置,本发明实施例可以提高读音纠错的效率。
为了解决上述问题,本发明公开了一种语音处理方法,包括:
展示文本中多音字当前的读音信息;所述文本用于语音合成处理;所述当前的读音信息为依据所述多音字及其上下文得到;
依据用户针对所述当前的读音信息的纠正操作,展示所述多音字对应的读音输入接口,以供用户输入修正后的读音信息;
依据修正后的读音信息,对所述文本进行语音合成。
另一方面,本发明实施例公开了一种语音处理装置,包括:
第一展示模块,用于展示文本中多音字当前的读音信息;所述文本用于语音合成处理;所述当前的读音信息为依据所述多音字及其上下文得到;
第二展示模块,用于依据用户针对所述当前的读音信息的纠正操作,展示所述多音字对应的读音输入接口,以供用户输入修正后的读音信息;
第一语音合成模块,用于依据修正后的读音信息,对所述文本进行语音合成。
再一方面,本发明实施例公开了一种用于语音处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
展示文本中多音字当前的读音信息;所述文本用于语音合成处理;所述当前的读音信息为依据所述多音字及其上下文得到;
依据用户针对所述当前的读音信息的纠正操作,展示所述多音字对应的读音输入接口,以供用户输入修正后的读音信息;
依据修正后的读音信息,对所述文本进行语音合成。
本发明实施例还公开了一个或多个机器可读介质,其特征在于,其上存储有指令,当由一个或多个处理器执行时,使得装置执行前述的方法。
本发明实施例包括以下优点:
本发明实施例依据文本中多音字及其上下文,得到多音字当前的读音信息。多音字及其上下文可以对应词、或短语、或句子、或段落等语言单元,由于在确定当前的读音信息的过程中采用了更为语言单元表征的更为丰富的语言信息,因此能够提高当前的读音信息的准确度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010763575.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽轮机汽封齿的铆齿装置及其方法
- 下一篇:一种自动刮鱼鳞的装置