[发明专利]一种面向参会者同步语音转写文字的智能方法在审

申请号：	201910263845.2	申请日：	2019-04-03
公开（公告）号：	CN110010130A	公开（公告）日：	2019-07-12
发明（设计）人：	汪丹	申请（专利权）人：	安徽阔声科技有限公司
主分类号：	G10L15/26	分类号：	G10L15/26;G10L15/20;G10L17/00;G10L17/02
代理公司：	暂无信息	代理人：	暂无信息
地址：	230088 安徽省合肥市合肥市高新区习友路33***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种面向参会者同步语音转写文字的智能方法，包括以下步骤：参会者通过签到话筒向控制中心以语音的方式录入自己的职位、姓名信息，控制中心按输入的顺序对输入的语音信息进行存储，控制中心对录入的语音信息进行预处理；预处理后的语音信息转换成频谱图和文字信息，并将频谱图和文字信息存入该参会者的信息库；控制中心频谱图分割成若干组分帧频谱；控制中心对分帧频谱进行特征提取；存储参会者频谱能量值差分DelN；识别发言者身份；计算频谱能量值差分DelNf，并比对；形成形成会议记录文档。本发明能够实现会议全过程记录，别能够识别出参会发言者的身份。
搜索关键词：	控制中心频谱图预处理频谱能量同步语音文字信息语音信息频谱转写录入存储语音信息转换发言者身份全过程记录智能会议记录特征提取姓名信息信息库比对文档话筒语音职位分割身份会议
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种面向参会者同步语音转写文字的智能方法，其特征在于：包括以下步骤：1）参会者通过签到话筒向控制中心以语音的方式录入自己的职位、姓名信息，控制中心按输入的顺序对输入的语音信息进行存储，控制中心对录入的语音信息进行预处理；2）预处理后的语音信息转换成频谱图和文字信息，并将频谱图和文字信息存入该参会者的信息库；3）控制中心将每个参会者的频谱图按固定的时间间隔进行分帧，将频谱图分割成若干组分帧频谱；4）控制中心对分帧频谱进行特征提取，特征提取的项目包括：分帧频谱的质心Ci（i=1、2、…n）、频谱能量值Ni（i=1、2、…n）、频谱能量值差分DelNd；5）将参会者频谱能量值差分DelN存入该参会者的信息库；6）参会者发言时，通过坐席上的话筒向控制中心按输入发言语音，发言语音信息经控制中心进行预处理，预处理后的发言语音信息转换成发言频谱图和发言文字信息，发言文字信息存储入会议记录文档；7）控制中心按步骤3）、4）计算频谱能量值差分DelNf；8）控制中心将DelNf与存储在参会者信息库中的DelNd进行比对，DelNf与参会者信息库中的DelNd之间的阈值小于设定值时，确定该发言者身份，并在会议记录文档的前部增加发言者姓名；9）完成会议后，形成会议记录文档，并打印、签字。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于安徽阔声科技有限公司，未经安徽阔声科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910263845.2/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种面向参会者同步语音转写文字的智能方法在审

专利文献下载