[发明专利]处理语音文本的方法及装置有效
申请号: | 201310554808.X | 申请日: | 2013-11-07 |
公开(公告)号: | CN104636323B | 公开(公告)日: | 2018-04-03 |
发明(设计)人: | 王飞;徐浩;褚攀;韩贵平;廖玲 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京三高永信知识产权代理有限责任公司11138 | 代理人: | 罗振安 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理 语音 文本 方法 装置 | ||
技术领域
本发明涉及信息处理技术领域,特别涉及一种处理语音文本的方法及装置。
背景技术
随着信息处理技术的不断发展,以自然语言进行人机交互成为现实。实现人机交互的关键是要准确理解用户发出的自然语言指令并进行相应的操作。用户在发出自然语言指令后,该指令被转换为语音文本,如何处理语音文本,成为人们关注的问题。
现有技术有两种处理语音文本的方式,第一种方式:对语音文本进行词汇映射,得到映射结果;通过规则卡位提取映射结果中的位置参数,得到卡位提取结果;将卡位提取结果和预设规则进行匹配,得到一个匹配规则;根据得到的一个匹配规则对语音文本进行处理。其中,规则卡位是根据正则规则获得的指定位置。第二种方式:对语音文本进行命名实体映射,得到第一映射结果;对命名实体映射的结果进行词汇映射,得到第二映射结果;将第二映射结果和预设规则进行匹配,得到一个匹配规则;根据得到的一个匹配规则对语音文本进行处理。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
正则规则不够灵活,不适用于实际的语言环境。命名实体规则对于比较固定的语言环境以及不适宜建立实体命名库的场景,不能充分发挥作用。因此,现有技术提供的两种处理语音文本的方式均具有一定的局限性,导致语音文本的处理方式不够优化。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种处理语音文本的方法及装置。所述技术方案如下:
第一方面,提供了一种处理语音文本的方法,所述方法包括:
对语音文本进行命名实体映射,得到第一映射结果;
对所述第一映射结果进行词汇映射,得到第二映射结果;
将所述第二映射结果与包括正则规则的预设规则进行匹配,如果得到一个匹配规则,则根据得到的一个匹配规则对所述语音文本进行处理。
第二方面,提供了一种处理语音文本的装置,所述装置包括:
第一映射模块,用于对语音文本进行命名实体映射,得到第一映射结果;
第二映射模块,用于对所述第一映射结果进行词汇映射,得到第二映射结果;
匹配模块,用于将所述第二映射结果与包括正则规则的预设规则进行匹配;
第一处理模块,用于当得到一个匹配规则时,根据得到的一个匹配规则对所述语音文本进行处理。
第三方面,提供了一种终端,所述终端包括处理器和存储器,所述存储器中存储有一个或者一个以上的程序,所述一个或者一个以上的程序由所述处理器加载并执行以实现第一方面所提供的处理语音文本的方法。
第四方面,提供了一种计算机可读存储介质,所述存储介质中存储有一个或者一个以上的程序,所述一个或者一个以上的程序由处理器加载并执行以实现第一方面所提供的处理语音文本的方法。
本发明实施例提供的技术方案带来的有益效果是:
通过对语音文本进行命名实体映射,得到第一映射结果;对第一映射结果进行词汇映射,得到第二映射结果;之后将第二映射结果与包括正则规则的预设规则进行匹配,并根据得到的一个匹配规则对语音文本进行处理,从而将正则规则和命名实体规则的配置格式统一,使处理语音文本技术既适用于实际的语言环境,又适用于固定的语言环境,扩大了处理语音文本技术的适用范围,从而使语音文本的处理方式得到了优化。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的处理语音文本的方法流程图;
图2是本发明实施例二提供的处理语音文本的方法流程图;
图3是本发明实施例三提供的第一种处理语音文本的装置结构示意图;
图4是本发明实施例三提供的第二种处理语音文本的装置结构示意图;
图5是本发明实施例三提供的第三种处理语音文本的装置结构示意图;
图6是本发明实施例四提供的处理语音文本的终端结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例一
本发明实施例提供了一种处理语音文本的方法,参见图1,方法流程包括如下步骤:
101:对语音文本进行命名实体映射,得到第一映射结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310554808.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:显示面板及包含该显示面板的显示装置
- 下一篇:烟草加工业的机器的抽吸带