[发明专利]一种基于手持智能终端的场景化朗读音频制作方法及系统在审
申请号: | 201711414780.4 | 申请日: | 2017-12-21 |
公开(公告)号: | CN108536655A | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | 孙仉茂;纪德财 | 申请(专利权)人: | 广州市讯飞樽鸿信息技术有限公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22;G06F17/30;G06K9/20;G10L13/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510665 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于手持智能终端的场景化朗读音频制作方法及系统。通过OCR识别、语音合成等新技术的应用,提出了基于手持智能终端的场景化朗读音频制作解决方案,提高信息内容的转换效率,降低信息与知识传播的成本,减少人们对获取信息与知识的代价,提升人们的用户体验。通过对OCR识别、语音合成等新技术的应用,对手持智能终端的展示内容进行采集并形成文字内容,通过对文字内容进行场景化识别,自动选择或手动设置背景音(如新闻播报的严谨、军事节目的激昂、故事文摘的轻快、校园的欢快等),设置音频朗读速度,利用播音员音库的声音音色与背景音交叉融合生成音频文件,并提供给使用者进行保存与分享。 | ||
搜索关键词: | 智能终端 场景化 音频制作 朗读 文字内容 语音合成 背景音 获取信息 手动设置 新闻播报 信息内容 音频朗读 音频文件 用户体验 展示内容 知识传播 转换效率 自动选择 音库 音色 应用 采集 保存 融合 校园 节目 故事 军事 | ||
【主权项】:
1.一种基于手持智能终端的场景化朗读音频制作方法,其特征在于,包括以下步骤:S1:使用手持智能终端获取信息内容,并转化为文字格式;S2:对文字内容进行格式化处理,包括自动分段、删除无效字符,最终获得有效的纯文本格式的内容;S3:对文字内容的关键字进行自动识别,预判该内容的使用场景;S4:根据预判的使用场景选择播音员音库、背景音、语速和语调;S5:生成场景化音频文件:根据所选择的播音员音库、语速和语调,通过语音合成技术将文字内容转化为音频,并加入背景音,生成音频文件;S6:将生成的音频文件提供给用户保存与分享。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市讯飞樽鸿信息技术有限公司,未经广州市讯飞樽鸿信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711414780.4/,转载请声明来源钻瓜专利网。
- 上一篇:识别文本展示方法及装置
- 下一篇:基于WFST的文本正则化方法及系统