[发明专利]一种收音机语音操控指令解析方法及系统有效
申请号: | 201510026115.2 | 申请日: | 2015-01-19 |
公开(公告)号: | CN104575501B | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 赵奇猛;刘升平 | 申请(专利权)人: | 北京云知声信息技术有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/30 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙)11371 | 代理人: | 王术兰 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 收音机 语音 操控 指令 解析 方法 系统 | ||
1.收音机语音操控指令解析方法,其特征在于,包括:
将用户发送的用于操控收音机动作的语音数据转换为文本数据;
对所述文本数据进行实体识别;
对所述实体识别后的文本数据进行语义解析,得到结构化字段;
根据所述结构化字段及用户数据,从数据库中获取相应的动作数据进行收音机动作响应;
其中,所述对所述文本数据进行实体识别,包括:
利用预先训练好的条件随机场模型对所述文本数据进行分词及标注;
其中,所述对所述实体识别后的文本数据进行语义解析,得到结构化字段,包括:
将所述实体识别后的文本数据与预设的规则模板进行匹配,得到所述结构化字段;其中所述规则模板包括:完全字面模板、包含变量模板及包含通配符模板;所述结构化字段包括:电台、频道、频道类别、单位和/或频率。
2.根据权利要求1所述的方法,其特征在于,所述将用户发送的用于操控收音机动作的语音数据转换为文本数据,包括:
调用语音云开放平台,利用所述语音云开放平台将所述语音数据转换为文本数据。
3.根据权利要求1所述的方法,其特征在于,该方法中对所述训练得到所述条件随机场模型,包括:
对待训练的文本数据按照电台、频道和/或频率进行分词及标注,得到标注语料;
利用条件随机场对所述标注语料进行训练,得到所述条件随机场模型。
4.根据权利要求1所述的方法,其特征在于,所述将所述实体识别后的文本数据与预设的规则模板进行匹配之前,还包括:
对所述文本数据进行标准化和冗余消除,其中包括对所述文本数据中的局部文字进行置信度高的局部替换以及去除所述文本数据中的噪音字符。
5.根据权利要求1所述的方法,其特征在于,所述根据所述结构化字段及用户数据,从数据库中获取相应的动作数据进行收音机动作响应,包括:
当所述文本数据中包含频率字段时,通过索引从数据库中获取所有满足所述频率字段的第一候选数据;根据用户的位置信息对所述第一候选数据进行排序;依据所述排序的结果选取相应的广播数据进行播放;
当所述文本数据中仅包含电台和/或频道字段时,通过索引从数据库中获取所有满足所述电台或频道字段的第二候选数据;根据用户的位置信息对所述第二候选数据进行排序,依据所述排序的结果选取相应的广播数据进行播放。
6.根据权利要求5所述的方法,其特征在于,当所述用户数据中仅包含所述位置信息时,所述数据库为通用数据库;
当所述用户数据包含所述位置信息及电台数据时,所述数据库为包含所述电台数据的用户数据库。
7.收音机语音操控指令解析系统,其特征在于,包括:
语音识别模块,用于将用户发送的用于操控收音机动作的语音数据转换为文本数据;
实体识别模块,用于从模型库中调取条件随机场模型对文本数据进行分词及标注;
语义解析模块,用于从规则库中调取预先设定的规则模板对实体识别后的文本数据进行语义解析,得到结构化字段;其中所述规则模板包括:完全字面模板、包含变量模板及包含通配符模板;所述结构化字段包括:电台、频道、频道类别、单位和/或频率;
数据获取模块,用于根据所述结构化字段及用户数据,从数据库中获取相应的动作数据进行收音机动作响应。
8.根据权利要求7所述的系统,其特征在于,该系统还包括:冗余消除模块,用于将所述实体识别后的文本数据与预设的规则模板进行匹配之前,对所述文本数据进行标准化和冗余消除,其中包括对所述文本数据中的局部文字进行置信度高的局部替换以及去除所述文本数据中的噪音字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云知声信息技术有限公司,未经北京云知声信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510026115.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于音标的语音编码方法
- 下一篇:一种语音信号的处理方法及装置