[发明专利]一种面向参会者同步语音转写文字的智能方法在审
申请号: | 201910263845.2 | 申请日: | 2019-04-03 |
公开(公告)号: | CN110010130A | 公开(公告)日: | 2019-07-12 |
发明(设计)人: | 汪丹 | 申请(专利权)人: | 安徽阔声科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/20;G10L17/00;G10L17/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 230088 安徽省合肥市合肥市高新区习友路33*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向参会者同步语音转写文字的智能方法,包括以下步骤:参会者通过签到话筒向控制中心以语音的方式录入自己的职位、姓名信息,控制中心按输入的顺序对输入的语音信息进行存储,控制中心对录入的语音信息进行预处理;预处理后的语音信息转换成频谱图和文字信息,并将频谱图和文字信息存入该参会者的信息库;控制中心频谱图分割成若干组分帧频谱;控制中心对分帧频谱进行特征提取;存储参会者频谱能量值差分DelN;识别发言者身份;计算频谱能量值差分DelNf,并比对;形成形成会议记录文档。本发明能够实现会议全过程记录,别能够识别出参会发言者的身份。 | ||
搜索关键词: | 控制中心 频谱图 预处理 频谱能量 同步语音 文字信息 语音信息 频谱 转写 录入 存储 语音信息转换 发言者身份 全过程记录 智能 会议记录 特征提取 姓名信息 信息库 比对 文档 话筒 语音 职位 分割 身份 会议 | ||
【主权项】:
1.一种面向参会者同步语音转写文字的智能方法,其特征在于:包括以下步骤:1)参会者通过签到话筒向控制中心以语音的方式录入自己的职位、姓名信息,控制中心按输入的顺序对输入的语音信息进行存储,控制中心对录入的语音信息进行预处理;2)预处理后的语音信息转换成频谱图和文字信息,并将频谱图和文字信息存入该参会者的信息库;3)控制中心将每个参会者的频谱图按固定的时间间隔进行分帧,将频谱图分割成若干组分帧频谱;4)控制中心对分帧频谱进行特征提取,特征提取的项目包括:分帧频谱的质心Ci(i=1、2、…n)、频谱能量值Ni(i=1、2、…n)、频谱能量值差分DelNd;5)将参会者频谱能量值差分DelN存入该参会者的信息库;6)参会者发言时,通过坐席上的话筒向控制中心按输入发言语音,发言语音信息经控制中心进行预处理,预处理后的发言语音信息转换成发言频谱图和发言文字信息,发言文字信息存储入会议记录文档;7)控制中心按步骤3)、4)计算频谱能量值差分DelNf;8)控制中心将DelNf与存储在参会者信息库中的DelNd进行比对,DelNf与参会者信息库中的DelNd之间的阈值小于设定值时,确定该发言者身份,并在会议记录文档的前部增加发言者姓名;9)完成会议后,形成会议记录文档,并打印、签字。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽阔声科技有限公司,未经安徽阔声科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910263845.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于六足机器人的语音交互系统
- 下一篇:一种语音信息处理的方法和装置