[发明专利]一种基于手持智能终端的场景化朗读音频制作方法及系统在审

申请号：	201711414780.4	申请日：	2017-12-21
公开（公告）号：	CN108536655A	公开（公告）日：	2018-09-14
发明（设计）人：	孙仉茂;纪德财	申请（专利权）人：	广州市讯飞樽鸿信息技术有限公司
主分类号：	G06F17/22	分类号：	G06F17/22;G06F17/30;G06K9/20;G10L13/08
代理公司：	广州粤高专利商标代理有限公司 44102	代理人：	林丽明
地址：	510665 广东省广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供一种基于手持智能终端的场景化朗读音频制作方法及系统。通过OCR识别、语音合成等新技术的应用，提出了基于手持智能终端的场景化朗读音频制作解决方案，提高信息内容的转换效率，降低信息与知识传播的成本，减少人们对获取信息与知识的代价，提升人们的用户体验。通过对OCR识别、语音合成等新技术的应用，对手持智能终端的展示内容进行采集并形成文字内容，通过对文字内容进行场景化识别，自动选择或手动设置背景音(如新闻播报的严谨、军事节目的激昂、故事文摘的轻快、校园的欢快等)，设置音频朗读速度，利用播音员音库的声音音色与背景音交叉融合生成音频文件，并提供给使用者进行保存与分享。
搜索关键词：	智能终端场景化音频制作朗读文字内容语音合成背景音获取信息手动设置新闻播报信息内容音频朗读音频文件用户体验展示内容知识传播转换效率自动选择音库音色应用采集保存融合校园节目故事军事
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于手持智能终端的场景化朗读音频制作方法，其特征在于，包括以下步骤：S1：使用手持智能终端获取信息内容，并转化为文字格式；S2：对文字内容进行格式化处理，包括自动分段、删除无效字符，最终获得有效的纯文本格式的内容；S3：对文字内容的关键字进行自动识别，预判该内容的使用场景；S4：根据预判的使用场景选择播音员音库、背景音、语速和语调；S5：生成场景化音频文件：根据所选择的播音员音库、语速和语调，通过语音合成技术将文字内容转化为音频，并加入背景音，生成音频文件；S6：将生成的音频文件提供给用户保存与分享。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广州市讯飞樽鸿信息技术有限公司，未经广州市讯飞樽鸿信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201711414780.4/，转载请声明来源钻瓜专利网。

上一篇：识别文本展示方法及装置
下一篇：基于WFST的文本正则化方法及系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于手持智能终端的场景化朗读音频制作方法及系统在审

专利文献下载