[发明专利]一种基于语言学规则生成的对话意图自动识别系统在审
申请号: | 202011625429.1 | 申请日: | 2020-12-30 |
公开(公告)号: | CN112632259A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 冷月 | 申请(专利权)人: | 中通天鸿(北京)通信科技股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/289;G06F40/30 |
代理公司: | 北京知呱呱知识产权代理有限公司 11577 | 代理人: | 杜立军 |
地址: | 101199 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语言学 规则 生成 对话 意图 自动识别 系统 | ||
1.一种基于语言学规则生成的对话意图自动识别系统,其特征在于,所述系统包括:分词模块、语言学规则生成模块、意图模型组生成模块和模型相似度计算模块,所述分词模块将句子进行划分词语,所述语言学规则生成模块将词语标记上各自的句法和语义信息,所述意图模型组生成模块已意图为单位进行去重与合并,每个意图生成一个语义模型组,所述模型相似度计算模块计算两个模型之间的相似度。
2.如权利要求1所述的一种基于语言学规则生成的对话意图自动识别系统,其特征在于,所述分词模块将将完整的句子进行切分,按照常用的词汇和断句,将句子切分为多个词语。
3.如权利要求1所述的一种基于语言学规则生成的对话意图自动识别系统,其特征在于,所述语言学规则生成模块根据词句的常见释义,将每个词语标记上各自的句法和语义信息,有助于对句子进行理解。
4.如权利要求1所述的一种基于语言学规则生成的对话意图自动识别系统,其特征在于,所述意图模型组生成模块将语言学规则生成模块生成的一个或多个带有句法和语义信息的模型,以意图为单位进行去重与合并,每个意图生成一个语义模型组。
5.如权利要求1所述的一种基于语言学规则生成的对话意图自动识别系统,其特征在于,所述系统首先进行模型训练,使确定意图的语句生成对应的唯一语义模型组,训练完成后,输入文本,确定相应的带有句法和语义信息的模型,将带有句法和语义信息的模型与语义模型组进行比对,匹配最佳相似度,输出识别理解结果。
6.如权利要求5所述的一种基于语言学规则生成的对话意图自动识别系统,其特征在于,所述模型训练过程中,将不同意图的训练语句输入系统,利用分词模块将训练语句拆分为词语,同时根据系统内的语言学规则生成模块,将语句中的词语标记上相应句法和语义信息,每句训练数据分别生成为带有句法和语义信息的模型。
7.如权利要求6所述的一种基于语言学规则生成的对话意图自动识别系统,其特征在于,所述不同的意图训练语句中,将同一意图的中已生成的多个训练数据的模型进行去重、合并处理,每个意图生成一个语义模型组。
8.如权利要求5所述的一种基于语言学规则生成的对话意图自动识别系统,其特征在于,所述输入文本利用分词模块进行切分,切分为多个词语,切分标准由按照系统预置的通用领域词表以及可以自由配置的自定义领域词表来确定。
9.如权利要求8所述的一种基于语言学规则生成的对话意图自动识别系统,其特征在于,所述输入文本切分为词语后,利用语言学规则生成模块自动将分词生成带有句法和语义信息的模型。
10.如权利要求9所述的一种基于语言学规则生成的对话意图自动识别系统,其特征在于,所述带有句法和语义信息的模型与多个确定意图的语义模型组进行相似度计算,直至计算出带有句法和语义信息的模型和所有的语义模型组之间的相似度,选择相似度最高的意图结果并且输出识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中通天鸿(北京)通信科技股份有限公司,未经中通天鸿(北京)通信科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011625429.1/1.html,转载请声明来源钻瓜专利网。