[发明专利]一种基于手持智能终端的场景化朗读音频制作方法及系统在审

专利信息
申请号: 201711414780.4 申请日: 2017-12-21
公开(公告)号: CN108536655A 公开(公告)日: 2018-09-14
发明(设计)人: 孙仉茂;纪德财 申请(专利权)人: 广州市讯飞樽鸿信息技术有限公司
主分类号: G06F17/22 分类号: G06F17/22;G06F17/30;G06K9/20;G10L13/08
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 林丽明
地址: 510665 广东省广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种基于手持智能终端的场景化朗读音频制作方法及系统。通过OCR识别、语音合成等新技术的应用,提出了基于手持智能终端的场景化朗读音频制作解决方案,提高信息内容的转换效率,降低信息与知识传播的成本,减少人们对获取信息与知识的代价,提升人们的用户体验。通过对OCR识别、语音合成等新技术的应用,对手持智能终端的展示内容进行采集并形成文字内容,通过对文字内容进行场景化识别,自动选择或手动设置背景音(如新闻播报的严谨、军事节目的激昂、故事文摘的轻快、校园的欢快等),设置音频朗读速度,利用播音员音库的声音音色与背景音交叉融合生成音频文件,并提供给使用者进行保存与分享。
搜索关键词: 智能终端 场景化 音频制作 朗读 文字内容 语音合成 背景音 获取信息 手动设置 新闻播报 信息内容 音频朗读 音频文件 用户体验 展示内容 知识传播 转换效率 自动选择 音库 音色 应用 采集 保存 融合 校园 节目 故事 军事
【主权项】:
1.一种基于手持智能终端的场景化朗读音频制作方法,其特征在于,包括以下步骤:S1:使用手持智能终端获取信息内容,并转化为文字格式;S2:对文字内容进行格式化处理,包括自动分段、删除无效字符,最终获得有效的纯文本格式的内容;S3:对文字内容的关键字进行自动识别,预判该内容的使用场景;S4:根据预判的使用场景选择播音员音库、背景音、语速和语调;S5:生成场景化音频文件:根据所选择的播音员音库、语速和语调,通过语音合成技术将文字内容转化为音频,并加入背景音,生成音频文件;S6:将生成的音频文件提供给用户保存与分享。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市讯飞樽鸿信息技术有限公司,未经广州市讯飞樽鸿信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711414780.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top