[发明专利]一种语义解析方法和装置在审
申请号: | 202010815893.0 | 申请日: | 2020-08-14 |
公开(公告)号: | CN112347772A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 孙孝雄 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/295;G06F40/30 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 杜志敏;宋志强 |
地址: | 100083 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语义 解析 方法 装置 | ||
本申请提供了一种语义解析方法和装置,所述方法包括:获取话术;识别所述话术中的关键词;使用识别出的关键词匹配语义模板的模板索引;将匹配到的模板索引对应的语义模板作为候选模板;在所述候选模板中对所述话术进行模板匹配,并根据匹配到的语义模板输出语义解析结果;其中,所述模板索引为加载所述语义模板时根据所述语义模板的组成单元信息生成的。该方法能够大大节省解析时间,以及解析资源。
技术领域
本发明涉及计算机技术领域,特别涉及一种语义解析方法和装置。
背景技术
规则语义解析引擎,通过书写规则模板的方式,实现自然语言处理任务中的语义解析任务,如斯坦福大学的开源项目corenlp。在语义解析过程中,需要将输入话术,依次与所有书写的模板进行匹配,直到找到匹配的模板,输出语义解析结果。
目前实现话术的语义解析时,需要将输入话术,依次与所有语义模板进行匹配,直到找到匹配的模板,进行语义解析。
在实现本申请的过程中,发明人发现当模板量比较大时,耗时会非常长;且如果需要获取多候选的结果时,需要全量匹配模板,耗时更长,且浪费资源。
发明内容
有鉴于此,本申请提供一种语义解析方法和装置,能够大大节省解析时间,以及解析资源。
为解决上述技术问题,本申请的技术方案是这样实现的:
在一个实施例中,提供了一种语义解析方法,所述方法包括:
获取话术;
识别所述话术中的关键词;
使用识别出的关键词匹配语义模板的模板索引;
将匹配到的模板索引对应的语义模板作为候选模板;
在所述候选模板中对所述话术进行模板匹配,并根据匹配到的语义模板输出语义解析结果;
其中,所述模板索引为加载所述语义模板时根据所述语义模板的组成单元信息生成的。
在另一个实施例中,提供了一种义解析装置,所述装置包括:建立单元、获取单元、识别单元、第一匹配单元、第二匹配单元和输出单元;
所述建立单元,用于加载语义模板时根据所述语义模板的组成单元信息生成所述语义模板的模板索引;
所述获取单元,用于获取话术;
所述识别单元,用于识别所述获取单元获取的话术中的关键词;
所述第一匹配单元,用于使用所述识别单元识别出的关键词匹配所述建立单元建立的语义模板的模板索引;将匹配到的模板索引对应的语义模板作为候选模板。
所述第二匹配单元,用于在所述第一匹配单元匹配到的候选模板中对所述话术进行模板匹配;
所述输出单元,用于根据所述第二匹配单元匹配到的语义模板输出语义解析结果。
在另一个实施例中,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现语义解析方法的步骤。
在另一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现语义解析方法的步骤。
由上面的技术方案可见,上述实施例中在进行模板匹配时,先提取话术中的关键词,匹配语义模的模板索引,将匹配到的模板索引对应的语义模板作为候选模板;在所述候选模板中对所述话术进行模板匹配,并根据匹配到的语义模板输出语义解析结果。该方案先从大量语义模板中通过索引匹配筛选出候选模板,再对候选的语义模板进行匹配,用于进行语义解析,能够大大节省解析时间,以及解析资源。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010815893.0/2.html,转载请声明来源钻瓜专利网。