[发明专利]一种面向参会者同步语音转写文字的智能方法在审

专利信息
申请号: 201910263845.2 申请日: 2019-04-03
公开(公告)号: CN110010130A 公开(公告)日: 2019-07-12
发明(设计)人: 汪丹 申请(专利权)人: 安徽阔声科技有限公司
主分类号: G10L15/26 分类号: G10L15/26;G10L15/20;G10L17/00;G10L17/02
代理公司: 暂无信息 代理人: 暂无信息
地址: 230088 安徽省合肥市合肥市高新区习友路33*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种面向参会者同步语音转写文字的智能方法,包括以下步骤:参会者通过签到话筒向控制中心以语音的方式录入自己的职位、姓名信息,控制中心按输入的顺序对输入的语音信息进行存储,控制中心对录入的语音信息进行预处理;预处理后的语音信息转换成频谱图和文字信息,并将频谱图和文字信息存入该参会者的信息库;控制中心频谱图分割成若干组分帧频谱;控制中心对分帧频谱进行特征提取;存储参会者频谱能量值差分DelN;识别发言者身份;计算频谱能量值差分DelNf,并比对;形成形成会议记录文档。本发明能够实现会议全过程记录,别能够识别出参会发言者的身份。
搜索关键词: 控制中心 频谱图 预处理 频谱能量 同步语音 文字信息 语音信息 频谱 转写 录入 存储 语音信息转换 发言者身份 全过程记录 智能 会议记录 特征提取 姓名信息 信息库 比对 文档 话筒 语音 职位 分割 身份 会议
【主权项】:
1.一种面向参会者同步语音转写文字的智能方法,其特征在于:包括以下步骤:1)参会者通过签到话筒向控制中心以语音的方式录入自己的职位、姓名信息,控制中心按输入的顺序对输入的语音信息进行存储,控制中心对录入的语音信息进行预处理;2)预处理后的语音信息转换成频谱图和文字信息,并将频谱图和文字信息存入该参会者的信息库;3)控制中心将每个参会者的频谱图按固定的时间间隔进行分帧,将频谱图分割成若干组分帧频谱;4)控制中心对分帧频谱进行特征提取,特征提取的项目包括:分帧频谱的质心Ci(i=1、2、…n)、频谱能量值Ni(i=1、2、…n)、频谱能量值差分DelNd;5)将参会者频谱能量值差分DelN存入该参会者的信息库;6)参会者发言时,通过坐席上的话筒向控制中心按输入发言语音,发言语音信息经控制中心进行预处理,预处理后的发言语音信息转换成发言频谱图和发言文字信息,发言文字信息存储入会议记录文档;7)控制中心按步骤3)、4)计算频谱能量值差分DelNf;8)控制中心将DelNf与存储在参会者信息库中的DelNd进行比对,DelNf与参会者信息库中的DelNd之间的阈值小于设定值时,确定该发言者身份,并在会议记录文档的前部增加发言者姓名;9)完成会议后,形成会议记录文档,并打印、签字。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽阔声科技有限公司,未经安徽阔声科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910263845.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top