[发明专利]电子书语音音频的生成方法、装置及可读存储介质有效
申请号: | 201810783023.2 | 申请日: | 2018-07-17 |
公开(公告)号: | CN110797001B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 苏云琳 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/08;G10L15/04;G10L15/26 |
代理公司: | 上海知锦知识产权代理事务所(特殊普通合伙) 31327 | 代理人: | 潘彦君 |
地址: | 310052 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子书 语音 音频 生成 方法 装置 可读 存储 介质 | ||
本发明提供的电子书语音音频的生成方法、装置及可读存储介质,通过接收各用户上传的音频片段,确定与每个音频片段对应的电子书的文本段落;所述音频片段为用户朗读所述文本段落生成的;根据接收的每个音频片段的试听反馈信息,在每个文本段落对应的多个音频片段中选出优选音频片段;根据各文本段落的段落顺序,对各优选音频片段进行整合生成电子书语音音频,从而使得用户可将自己朗读录制的音频片段上传,并通过对从中选出的优选音频片段进行整合,获得语气生动的、能够体现电子书感情色彩的,符合大众视听审美的电子书语音音频,提高了用户体验。
技术领域
本发明涉及电子书领域,尤其涉及一种电子书语音音频的生成方法、装置及可读存储介质。
背景技术
随着互联网技术应用越来越广泛,传统的纸质阅读方式已逐渐被电子书取代,为了使得用户在阅读时不受身体原因或光线原因的影响,具备音频功能的电子书也应运而生。
现有电子书的音频功能中的语音音频一般是通过语音合成系统获得的。语音合成系统可根据电子书的文本内容,将其转换为与文本内容相应的机械语音,以生成电子书文本所对应的语音音频。
但是,采用现有方式获得的电子书的语音音频的语气较为生硬,也无法体现电子书文本所具备的感情色彩,用户在收听时感受不佳。
发明内容
针对上述提及的在现有技术的电子书的语音音频语气生硬,无法体现电子书文本所具备的感情色彩的技术问题,本发明提供了一种电子书语音音频的生成方法、装置及可读存储介质。
一方面,本发明提供了一种电子书语音音频的生成方法,包括:
接收各用户上传的音频片段,确定与每个音频片段对应的电子书的文本段落;所述音频片段为用户朗读所述文本段落生成的;
根据接收的每个音频片段的试听反馈信息,在每个文本段落对应的多个音频片段中选出优选音频片段;
根据各文本段落的段落顺序,对各优选音频片段进行整合生成电子书语音音频。
在其中一种可选的实施方式中,所述接收各用户上传的音频片段,确定与每个音频片段对应的电子书的文本段落之前,包括:
对电子书的文本进行拆分,获得至少一个文本段落;
针对于电子书中每个文本段落设置相应的音频上传端口;
相应的,所述接收各用户上传的音频片段,确定与每个音频片段对应的电子书的文本段落,包括:
接收各用户在音频上传端口上传的音频片段;
根据音频片段对应的音频上传端口,确定电子书的文本段落。
在其中一种可选的实施方式中,所述接收各用户上传的音频片段,确定与每个音频片段对应的电子书的文本段落,包括:
对音频片段进行语音识别,获得音频片段对应的文本信息;
根据所述文本信息,在所述电子书中确定与所述文本信息对应的文本段落。
在其中一种可选的实施方式中,所述试听反馈信息包括评分信息,和/或评论信息,和/或试听热度;
相应的,所述根据接收的每个音频片段的试听反馈信息,在每个文本段落对应的多个音频片段中选出优选音频片段,包括:
根据所述评分信息,和/或评论信息,和/或试听热度,对每个文本段落对应的各音频片段进行排序,以确定优选音频文件。
在其中一种可选的实施方式中,所述根据各文本段落的段落顺序,对各优选音频片段进行整合生成电子书语音音频,包括:
根据各文本段落在电子书中的段落顺序,对各优选音频片段进行排序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810783023.2/2.html,转载请声明来源钻瓜专利网。