[发明专利]一种语音点播方法及装置无效
申请号: | 200710111291.1 | 申请日: | 2007-06-21 |
公开(公告)号: | CN101329867A | 公开(公告)日: | 2008-12-24 |
发明(设计)人: | 王珩 | 申请(专利权)人: | 西门子(中国)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100102北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 点播 方法 装置 | ||
技术领域
本发明涉及语音识别领域,特别涉及语音点播技术,具体的讲是一种语音点播方法及装置。
背景技术
现在的人们由于生活工作的紧张,大部分时间都奔波在上下班的路上,回到家后很少有时间完整地观看自己喜欢的电视节目,如体育节目,娱乐节目等,通常只是大概地回顾一下广播新闻的内容,通过逐帧或者时间的方式对录像进行检索,只观看自己喜欢的运动员的那部分比赛录像,或者只观看自己关心体育比赛的上半场或下半场。同样,在火车或者飞机上人们可以观看电视节目录像或者听广播录音,或者观看自己携带的电影光盘或CD来消磨时光,而在很多者电影录像、CD或广播录音中选择出自己喜欢的节目是件很困难的事情,一般都是随便挑选一个电影或者音乐来欣赏;或者通过搜索电影或者音乐的名称来获得媒体内容,在存储介质中存储的媒体和媒体的名称存在对应关系,当用户按照名称进行检索时,找到了一致的名称也就找到了该媒体的播放位置,从而可以根据媒体名称进行检索;如果是想观看某一部分的内容还是必须通过录像的逐帧或者时间进行检索。但是逐帧或按照时间的这两种检索方式不能满足人们对特定感兴趣的媒体内容的检索要求,很耽误用户时间,并且检索效果也很差,例如,人们可能只记得某个电影的某一段情景或广播的某个片段,而要根据这些片段从成千上万的媒体中找出想要的内容是很困难的。对于现在海量的媒体内容来说,这两种检索手段显示出了不足,特别是对于现在移动通信终端在网络上观看电视节目等应用来说,现有的检索方式使网络中产生不必要的负载,并且造成使用者流量通信费用的上升。
在2000年第八届国际多媒体大会的会议论文集的第105至115页公开了一种制作录像集锦的技术,该方案以棒球比赛作为例子,通过对现场噪音进行滤除,获得某些有效的现场语音信息,即声音能量超过一门限值的现场语音信息,例如,解说员的语音信息,主持人的语音信息和观众的语音信息,将这些语音信息与系统中的关键语音信息相比较,如果符合则将该段视频内容作为集锦的一部分,例如运动员掷球阶段,运动员挥棒击打阶段,击打后的阶段等等。但是该方案没有给用户提供任何检索手段,如果用户想要观看某个段落的节目,还是要通过传统的按时间或者逐帧的检索才能实现。
发明内容
本发明为了解决以上现有技术中的不足,提供一种语音点播方法,使用户可以根据自己语音,方便的查找感兴趣的录音录像节目,减少用户在检索录音录像内容时的不便。
本发明还提供了一种语音点播装置,以执行相应方法。
一种语音点播方法,包括步骤1,利用语音识别模块对媒体文件的音频信息进行语音识别,并生成与所述音频信息对应的语言字符串;还包括,
步骤2,生成至少一个关键词列表,其具有一个或一个以上关键词,同一个列表内的各个关键词具有相同或近似的含义;
步骤3,利用标签模块将所述字符串与所述关键词列表中的关键词相比较,如果所述字符串与某一关键词列表中的关键词字符串相同,则记录下该媒体中出现所述关键词时的播放参数,将所述关键词所在的列表与播放参数作为一个标签存储起来,如果没有相同的关键词则不进行记录;
步骤4,当用户进行语音检索时,利用所述语音识别模块对用户的语音查询指令进行识别,并生成与所述语音查询指令对应的查询字符串;
步骤5,利用检索模块检索所有所述标签的关键词列表中是否存与查询字符串相同的关键词字符串,如果存在,则调取该关键词所在的标签的播放参数,并指令播放装置按照该播放参数对所述媒体文件进行播放;如果没有检索到与查询字符串相同的关键词字符串,则提示用户没有找到与查询指令相符合的媒体内容。
根据本发明方法的一个进一步的方面,在所述步骤2中还包括配置步骤,针对于媒体的内容设置用于语音识别的语言资料库的范围和用于比较的关键词列表的范围。
根据本发明方法的再一个进一步的方面,在所述步骤2中还包括用户编辑关键词列表的步骤,在所述关键词列表中加入或者删除关键词。
根据本发明方法的另一个进一步的方面,在录制媒体文件同时,或者对已经录制好的媒体文件进行解码后,对该媒体的音频信息进行步骤1-步骤5。
根据本发明方法的另一个进一步的方面,在所述步骤1中,只对所述媒体音频信息中能量超过一预定门限值的音频信息进行语音识别。
根据本发明方法的另一个进一步的方面,所述播放参数包括媒体播放中的时间和/或存储媒体的存储器物理地址。
根据本发明方法的另一个进一步的方面,所述媒体文件包括视频媒体文件和/或音频媒体文件。
根据本发明方法的另一个进一步的方面,在所述步骤3中所述用户通过网络输入语音查询信息,并通过网络获得所述媒体信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西门子(中国)有限公司,未经西门子(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710111291.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:缝纫裁剪台
- 下一篇:空心壳体内装电光源构成的星星形装饰物