[发明专利]基于智能语音鼠标的字幕实现方法、装置、系统和存储介质在审
申请号: | 201910923592.7 | 申请日: | 2019-09-27 |
公开(公告)号: | CN110648653A | 公开(公告)日: | 2020-01-03 |
发明(设计)人: | 冯海洪;毛德平;许成亮;朱国冉 | 申请(专利权)人: | 安徽咪鼠科技有限公司 |
主分类号: | G10L13/04 | 分类号: | G10L13/04;G10L15/02;G10L15/06;G10L15/14;G10L15/18;G10L15/22;G10L15/26;G06F3/0354 |
代理公司: | 53113 昆明合众智信知识产权事务所 | 代理人: | 叶春娜 |
地址: | 230088 安徽省合肥市高新区习友路33*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预处理 智能语音 多设备 局域网 字幕 鼠标 语音识别技术 语音信号处理 存储介质 共享数据 会议演讲 结合硬件 模型训练 实时录音 实时显示 数据共享 数据通过 用户意图 语音采集 语音内容 语音文件 语音字幕 设备间 移动端 智能化 互连 存储 采集 自由 发言 展示 会议 管理 | ||
本发明涉及语音信号处理领域,尤其涉及一种基于智能语音鼠标的字幕实现方法、装置、系统和存储介质,该方法包括:在智能语音鼠标端实现语音采集,然后,将采集的语音文件进行预处理,并且将预处理后的文件进行存储及管理,接下来,将得到的数据通过模型训练得出用户意图,通过多个移动端自由共享数据到局域网内,局域网内多设备实时互连,接收多设备的数据,最后,通过字幕展示用户的语音内容,本发明利用语音识别技术,结合硬件设备,实现在不同设备间完成数据共享,实时录音及语音字幕实时显示,使人们的会议进行的更加的智能化与便捷化,避免因为会议演讲人的发言不清楚,导致参会人员听错,无法正确理解其意思的情况。
技术领域
本发明涉及语音信号处理领域,尤其涉及一种基于智能语音鼠标的字幕实现方法、装置、系统和存储介质。
背景技术
目前人们在进行会议时,大多还是依赖于主讲人的ppt与主讲人的讲解内容,大多数内容都是靠主讲人的陈述,但是很多情况下,参会人员无法及时准确的听懂理解主讲人的意思。通过利用机器学习技术进行自然语言的深度理解,语音识别领域将快速实现商业化部署,这一直是工业和学术界关注的焦点。在人工智能的各项领域中,自然语言处理是最为成熟的技术,由此引来各大企业纷纷进军布局。在未来3年内,成熟化的语音产品将通过云平台和智能硬件平台快速实现商业化部署,前景十分广阔。
本发明提供一种基于智能语音鼠标的字幕实现方法、装置、系统和存储介质,实现在不同设备间完成数据共享,建立应用级的连接,实现实时录音,同步将录音、语音识别、语音翻译的结果共享给局域网内计算机设备,在显示终端上展示字幕内容,使人们更加清楚的理解会议内容。
发明内容
针对上述存在的问题,本发明的目的是为了开发一种基于智能语音鼠标的字幕实现方法,使人们的会议进行的更加的智能化与便捷化,为了解决上述现有技术中存在的问题,本发明提供一种基于智能语音鼠标的字幕实现方法,包括以下步骤:
步骤S1:在智能语音鼠标端通过指定键开启录音和结束录音,实现语音采集;
步骤S2:将采集的语音文件进行预处理,完成语音识别和结果的自动修正,同步完成语音翻译和语音合成,并且将预处理后的文件进行存储及管理;
步骤S3:将步骤S2中得到的数据通过模型训练得出用户意图;
步骤S4:多个移动端自由共享数据到局域网内;
步骤S5:局域网内多设备的实时互连,实时接收多设备的数据,并通过字幕展示用户的语音内容。
优选的,步骤S2中所述预处理过程包括:
步骤S21:使用jieba与HanLp为开源中文分词工具进行分词,将一个汉字序列切分成一个个单独的词;
步骤S22:使用MITIE作为特征提取和实体识别的工具将一段文本序列中包含的实体识别出来;
步骤S23:采用多种方案结合的方式提供意图判定服务,使用sklearn作为意图判定的工具,标注句子所属的类别;
优选的,步骤S3中所述模型训练包括以下步骤:
步骤S31:使用HMM模型、平均感知机、和CRF++进行特征提取;
步骤S32:将已经准备好的语料进行训练;
步骤S33:对模型进行裁剪;
步骤S34:保存训练后的模型。
优选的,步骤S5中所述字幕通过计算机端字幕界面个性化修改功能进行修改。
优选的,所述多设备实行分别管理进行数据统计与分析,并且多设备包含对多客户端软件更新的功能。
为达上述目的,本发明还提供一种基于智能语音鼠标的字幕实现装置,包括
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽咪鼠科技有限公司,未经安徽咪鼠科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910923592.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能互动玩具
- 下一篇:一种引入语言向量的语音识别增强方法和装置