[发明专利]语义解析方法和装置在审
申请号: | 201510452108.9 | 申请日: | 2015-07-28 |
公开(公告)号: | CN105095186A | 公开(公告)日: | 2015-11-25 |
发明(设计)人: | 时培轩 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 解析 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,尤其涉及一种语义解析方法和装置。
背景技术
口语语义解析是语音交互中必不可少的一个环节,主要通过分析用户输入的意图,提取能够表达该意图的知识,并转换成机器能够理解的结构化数据格式。
目前,主要使用预设的规则串与语音转换后的文本串进行字符串匹配的方法来对语义进行解析。具体地,可将关键词组合编译成正则表达式,将提取出的功能参数表示成通配符,并将该正则表达式与相应的服务建立映射关系,从而实现语义的解析。例如,关键词组合为“(给)(.+)(发/回)(信息/短信)”,功能参数设置为第二个关键词。当用户输入的文本为“给刘德华发短信”时,则经过匹配可得知功能参数为“刘德华”,对应的服务为“发短信”。
但是,使用通配符的方式提取功能参数,容易误纳噪音,例如:“给我亲爱的刘德华发信息”,正确的功能参数应该为“刘德华”,而提取的功能参数为“我亲爱的刘德华”,则会对给后续处理造成影响,进而影响整体的解析效果。另外,当输入的文本含有多个功能参数时,无法解析出每个参数代表的意思,例如“查询某天某地的天气”,该文本会被转换为“(查询)(.+)(的)?(.+)(天气)”,这样很难分辨出哪个参数表示的是时间,哪个参数表示的是地名,导致解析成功率低。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的在于提出一种语义解析方法,可降低噪声对语义解析的影响,准确地获取文本数据中的实体信息及其对应的实体类型标签,从而提高解析准确率。
此外,本发明还需要提供一种语义解析装置。
为了实现上述目的,本发明第一方面实施例提出了一种语义解析方法,包括:S1、获取输入的语音数据,并对所述语音数据进行文本转换以生成文本数据;S2、对所述文本数据进行实体识别以获取所述文本数据中的实体类型标签;S3、根据所述文本数据中的实体信息及对应的实体类型标签将所述文本数据转换为具有实体类型标签的文本数据;以及S4、根据所述具有实体类型标签的文本数据与数据库进行匹配,以生成语义解析结果。
本发明实施例的语义解析方法,通过获取输入的语音数据,并对语音数据进行文本转换以生成文本数据,并对文本数据进行实体识别以获取文本数据中的实体类型标签,以及根据文本数据中的实体信息及对应的实体类型标签将文本数据转换为具有实体类型标签的文本数据,并根据具有实体类型标签的文本数据与数据库进行匹配,以生成语义解析结果,可降低噪声对语义解析的影响,准确地获取文本数据中的实体信息及其对应的实体类型标签,从而提高解析准确率。
本发明第二方面实施例提供了一种语义解析装置,包括:第一转换模块,用于获取输入的语音数据,并对所述语音数据进行文本转换以生成文本数据;识别模块,用于对所述文本数据进行实体识别以获取所述文本数据中的实体类型标签;第二转换模块,用于根据所述文本数据中的实体信息及对应的实体类型标签将所述文本数据转换为具有实体类型标签的文本数据;以及匹配模块,用于根据所述具有实体类型标签的文本数据与数据库进行匹配,以生成语义解析结果。
本发明实施例的语义解析装置,通过获取输入的语音数据,并对语音数据进行文本转换以生成文本数据,并对文本数据进行实体识别以获取文本数据中的实体类型标签,以及根据文本数据中的实体信息及对应的实体类型标签将文本数据转换为具有实体类型标签的文本数据,并根据具有实体类型标签的文本数据与数据库进行匹配,以生成语义解析结果,可降低噪声对语义解析的影响,准确地获取文本数据中的实体信息及其对应的实体类型标签,从而提高解析准确率。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
图1是根据本发明一个实施例的语义解析方法的流程图。
图2是根据本发明一个具体实施例的语义解析方法的流程图。
图3是根据本发明一个实施例的语义解析装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的语义解析方法和装置。
图1是根据本发明一个实施例的语义解析方法的流程图,如图1所示,该方法包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510452108.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:以瀑布流方式显示图片的方法和设备
- 下一篇:一种中文人名播报方法及装置