[发明专利]词库扩充方法、装置、设备及存储介质有效
申请号: | 201911086956.7 | 申请日: | 2019-11-08 |
公开(公告)号: | CN110825840B | 公开(公告)日: | 2023-02-17 |
发明(设计)人: | 高志伟;陈孝良;苏少炜;常乐 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/35 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 滕一斌 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 词库 扩充 方法 装置 设备 存储 介质 | ||
本申请公开了一种词库扩充方法、装置、设备及存储介质,属于智能语音技术领域。所述方法包括:获取待添加的至少一个词语和所述至少一个词语的词语类别;将所述至少一个词语与意图词库进行比对,确定所述至少一个词语中未包含在所述意图词库中的目标词语,所述意图词库用于根据词语类别存储用于表达意图的词语;将所述目标词语添加到所述意图词库中,与所述目标词语的词语类别对应存储。本申请通过在获取到待添加的词语和词语类别后,根据词语类别,将未包含在意图词库中的目标词语添加到意图词库中。上述技术方案提供了添加词语到意图词库的功能,使得用户可以根据自己的需求,自动添加词语到意图词库,实现对意图词库的扩充。
技术领域
本申请涉及智能语音技术领域,尤其涉及一种词库扩充方法、装置、设备及存储介质。
背景技术
随着智能语音技术的发展,智能语音交互逐渐成为人机交互的热门方法,智能语音识别系统通过自动语音识别过程识别用户输入的语音,再通过自然语言处理过程解析用户的意图,但是由于中文语句的复杂性,智能语音识别系统的厂商一般会建立专门的意图词库进行意图解析。
目前,用户在使用智能语音识别系统时,输入语音后,智能语音识别系统先对用户的语音进行语音识别,再根据语音识别到的词语在意图词库中查询对应的意图词语,根据查询到的意图词语确定用户的意图。然而中文拥有大量的词语,随着时代的发展逐渐会出现一些新的词语,厂商在建立意图词库时,不能做到将所有词语都覆盖到意图词库中,导致如果用户说出意图词库中没有的词语时,智能语音识别系统无法根据用户的语音,确定用户的意图,因此,亟需一种词库扩充方法,对意图词库进行扩充。
发明内容
本申请实施例提供了一种词库扩充方法、装置、设备及存储介质,可以对意图词库进行扩充。所述技术方案如下:
第一方面,提供一种词库扩充方法,包括:
获取待添加的至少一个词语和所述至少一个词语的词语类别;
将所述至少一个词语与意图词库进行比对,确定所述至少一个词语中未包含在所述意图词库中的目标词语,所述意图词库用于根据词语类别存储用于表达意图的词语;
将所述目标词语添加到所述意图词库中,与所述目标词语的词语类别对应存储。
在一种可能实现方式中,所述获取待添加的至少一个词语和所述至少一个词语的词语类别,包括:
接收第一用户对第一接口的访问指令,获取所述意图词库中的词语类别;
显示所述意图词库中的词语类别;
获取所述至少一个词语以及从所述意图词库中的词语类别中选取的所述至少一个词语的词语类别。
在一种可能实现方式中,所述获取所述至少一个词语以及从所述意图词库中的词语类别中选取的所述至少一个词语的词语类别,包括:
通过第二接口获取至少一个目标文件,所述至少一个目标文件根据所述至少一个词语以及所述至少一个词语的词语类别生成,同一目标文件中包括同一词语类别的词语。
在一种可能实现方式中,所述将所述至少一个词语与所述意图词库进行比对,确定所述至少一个词语中未包含在所述意图词库中的目标词语,包括:
对于所述至少一个词语中每个词语类别的词语,将所述词语类别的词语与所述意图词库中同一词语类别的词语进行比对,从所述词语类别的词语中,去除所述意图词库中已有的词语,将剩余的词语确定为所述目标词语。
在一种可能实现方式中,所述将所述词语类别的词语与所述意图词库中同一词语类别的词语进行比对,包括:
在所述词语类别的词语中进行去重处理;
将去重处理后的词语与所述意图词库中同一词语类别的词语进行比对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911086956.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有加湿功能的高效型空气净化器
- 下一篇:一种隔膜泵用曲轴箱