[发明专利]一种自然语言处理方法、装置、计算机设备和存储介质在审
申请号: | 202010170324.5 | 申请日: | 2020-03-12 |
公开(公告)号: | CN111400340A | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 操玉琴;徐金梦 | 申请(专利权)人: | 杭州城市大数据运营有限公司;湖州市大数据运营有限公司;杭州中云数据科技有限公司 |
主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F40/284 |
代理公司: | 长沙新裕知识产权代理有限公司 43210 | 代理人: | 黄勇 |
地址: | 310000 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自然语言 处理 方法 装置 计算机 设备 存储 介质 | ||
1.一种自然语言处理方法,其特征在于,包括:
获取用户输入的自然语言信息;
对所述自然语言信息进行识别并确定用户意图信息;
对所述用户意图信息进行关键词提取;
在知识库中确定与所述关键词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出。
2.根据权利要求1所述的自然语言处理方法,其特征在于,所述对所述自然语言信息进行识别并确定用户意图信息的步骤,具体包括:
对所述自然语言信息进行识别并生成语义表示;
根据所述语义表示确定文本分类;
根据所述语义表示以及文本分类,确定用户意图信息。
3.根据权利要求2所述的自然语言处理方法,其特征在于,所述根据所述语义表示以及文本分类,确定用户意图信息的步骤,具体包括:
基于所述文本分类,将所述语义表示转换为语义向量;
根据所述语义向量以及预设训练模型,确定用户意图的概率分布信息,并输出;
将概率分布阈值最大的用户意图确定为用户意图信息。
4.根据权利要求1所述的自然语言处理方法,其特征在于,所述在知识库中确定与所述关键词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出的步骤,具体包括:
判断知识库中的标签与所述关键词的匹配度是否超过预设匹配阈值;
当知识库中的标签与所述关键词的匹配度超过预设匹配阈值时,则获取与所述关键词精确匹配的标签对应的匹配答案,并向用户输出;
当知识库中的标签与所述关键词的匹配度没有超过预设匹配阈值时,则获取与所述关键词模糊匹配的至少一个标签对应的匹配答案,对所述匹配答案进行计算处理,并将处理后的匹配答案向用户输出。
5.根据权利要求1所述的自然语言处理方法,其特征在于,所述在知识库中确定与所述关键词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出的步骤,具体包括:
对所述关键词进行分析处理,获取与所述关键词词义相同的关联词;
在知识库中确定与所述关联词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出。
6.根据权利要求1所述的自然语言处理方法,其特征在于,还包括:
当判断用户对所述匹配答案不满意时,则输出手动添加提醒,并将接收的正确的匹配答案作为训练集;
当判断用户对所述匹配答案满意时,则将所述匹配答案作为验证集;
根据所述训练集以及验证集,按照预设的优化周期对所述预设训练模型进行优化处理。
7.根据权利要求6所述的自然语言处理方法,其特征在于,还包括:
根据所述训练集以及验证集,对所述知识库及其标签进行更新处理。
8.一种自然语言处理装置,其特征在于,包括:
获取单元,用于获取用户的自然语言信息;
意图确定单元,用于对所述自然语言信息进行识别并确定用户意图信息;
关键词提取单元,用于对所述用户意图信息进行关键词提取;以及
输出单元,用于在知识库中确定与所述关键词匹配的标签,并获取确定的标签对应的匹配答案,向用户输出。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1至7中任一项权利要求所述自然语言处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1至7中任一项权利要求所述自然语言处理方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州城市大数据运营有限公司;湖州市大数据运营有限公司;杭州中云数据科技有限公司,未经杭州城市大数据运营有限公司;湖州市大数据运营有限公司;杭州中云数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010170324.5/1.html,转载请声明来源钻瓜专利网。