[发明专利]一种意图分析方法及系统在审
申请号: | 202011180059.5 | 申请日: | 2020-10-29 |
公开(公告)号: | CN112487802A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 石忠民;林剑周;钟力 | 申请(专利权)人: | 广州索答信息科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/117;G06F40/211;G06K9/62;G10L15/26 |
代理公司: | 广州市越秀区哲力专利商标事务所(普通合伙) 44288 | 代理人: | 曾令军 |
地址: | 510530 广东省广州市高新技术*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 意图 分析 方法 系统 | ||
本发明公开了一种意图分析方法及系统,其词性标注模型根据领域词训练得到的,可将新的相关词更新至参考词句数据库并与相关的领域词关联,使词性标注模型能够快速适应新词汇,快速响应服务需求;还可根据不同领域的领域词训练得到若干领域的词性标注模型,对不同领域的领域表达句式和参考表达句式分别进行比对,得到匹配度最高的参考表达句式作为意图判定结果,从而有效避免了歧义词导致的意图误识别,提高意图判断准确率。
技术领域
本发明属于意图识别技术领域,尤其涉及一种意图分析方法及系统。
背景技术
人工智能正在逐步深入人们的日常生活,自然语言处理在这其中更是扮演着举足轻重的角色。如何快速理解用户的意图并提供对应的产品服务对企业发展至关重要。
目前,为了提高对用户意图的理解效率,需不断地训练大量庞大而复杂的模型,面对生活中变化多样的词汇,模型需要重新学习新词汇,导致模型的训练时间长且维护成本高;同时,用户的语言表达中难免会出现歧义词,这容易导致意图识别错误。
发明内容
为了克服现有技术的不足,本发明的目的在于提供一种意图分析方法及系统,以解决目前的意图识别模型无法快速适应新词汇且对于歧义词容易误识别的问题。
本发明的目的采用如下技术方案实现:
一种意图分析方法,包括:
建立参考词句数据库,所述参考词句数据库包括领域词、与所述领域词相关联的相关词以及具有意图标记的参考表达句式;
根据所述领域词训练得到其所属领域的词性标注模型;
获取用户输入的语言信息,对所述语言信息进行分词,并基于若干个所述词性标注模型分别标注所述语言信息中的所述领域词,得到若干个领域表达句式;
将每个所述领域表达句式与其同一领域的所述参考表达句式进行比对,比对匹配度最高的所述参考表达句式作为意图判定结果,并基于所述意图判定结果的所述参考表达句式得到所述意图标记。
进一步地,所述建立参考词句数据库的步骤包括:
获取所述领域词,根据所述领域词获取与其关联的所述相关词。
进一步地,所述建立参考词句数据库的步骤还包括:
在若干领域获取对应的领域表达句型;
将所述领域表达句型中出现的所述相关词替换为与所述相关词关联的所述领域词,得到所述参考表达句式。
进一步地,在所述将所述领域表达句型中出现的所述相关词替换为与所述相关词关联的所述领域词,得到所述参考表达句式步骤之后,还包括:
根据所述参考表达句式所需提供的服务,对所述参考表达句式添加所述意图标记。
进一步地,所述根据领域词训练得到其所属领域的词性标注模型步骤还包括:
根据所述领域词和所述领域表达句型生成基础语料,利用所述基础语料训练得到所述词性标注模型。
进一步地,所述基于所述词性标注模型标注所述语言信息中的所述领域词步骤还包括:
所述词性标注模型识别其所属领域的相关词并标注为对应的所述领域词。
进一步地,所述基于所述词性标注模型标注所述语言信息中的所述领域词步骤还包括:
将新的所述相关词关联至与其相关的所述领域词,所述词性标注模型对所述语言信息中出现的新的所述相关词进行识别并标注为所述领域词。
进一步地,筛选出与所述领域表达句式处于同一领域且匹配度最高的所述参考表达句式,并基于所述参考表达句式得到所述意图标记步骤之后,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州索答信息科技有限公司,未经广州索答信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011180059.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防药液晃荡的无人机药箱
- 下一篇:一种新生儿科用奶瓶清洗装置