[发明专利]一种问句模板自动生成方法及装置有效

专利信息
申请号: 201711436114.0 申请日: 2017-12-26
公开(公告)号: CN108038234B 公开(公告)日: 2021-06-15
发明(设计)人: 邹辉 申请(专利权)人: 众安信息技术服务有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F16/33;G06F16/36;G06F16/35
代理公司: 北京市万慧达律师事务所 11111 代理人: 张慧娟
地址: 518000 广东省深圳市前海深港合作区前*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 问句 模板 自动 生成 方法 装置
【说明书】:

本发明公开了一种问句模板自动生成方法及装置,属于智能问答技术领域。所述方法包括:准备问句日志语料;对所述日志语料进行分词和词性标注;进行命名实体识别和替换;进行语义替换;进行频繁项集挖掘,生成问句模板。本方法及装置不仅提高了问句模板生成的效率,大量节约了人工资源,而且能对生成的问句模板进行评估,自主的持续扩展问句模板库,提升智能问答系统知识库的质量。

技术领域

本发明涉及智能问答技术领域,特别涉及一种问句模板自动生成方法及装置。

背景技术

目前,越来越多的企业会承担大量用户售后服务或售前咨询工作。由于用户数量的指数增长,完全采用人工的方式对所有用户咨询进行回答会耗费大量的人工资源,而且很多知识点相对集中,人工回复往往包含大量重复劳动,从而智能问答系统应运而生,智能问答系统能针对用户输入的问题进行自动回答,效率得到了大幅度提高。

智能问答系统的技术原理有基于问句模板匹配、知识库检索等方式。其中,问句模板匹配技术是使用最广泛的技术之一,问句模板指的是通过对问句进行识别替换之后形成的特定的符号标签序列,对问句模板问题增加相应的答案,在遇到与模板相同或者相似度很高的问题时,模板匹配技术会对该问题进行匹配回答。问句模板匹配技术的难点在于如何高效并可持续的生成问句模板。传统的问句模板的生成,需要人工针对特定句式进行模板设置,不仅繁琐而且可覆盖性差;在知识库更新的时候,也需要人工对模板库中不能涵盖的问句模板进行新模板的设置与评估,可维护性和自我学习性差。在目前公开的相关专利,还未发现针对以上技术问题作出相应改进的技术方案,例如发明申请201611076382.1(《一种自动问答模板匹配的方法及装置》),通过确定待解答问题对应各分词的模板问题集合的子集,得到待解答问题的匹配问题,提高了自动问答系统的模板匹配效率和准确度,但并未涉及模板自动生成以及生成模板质量评估问题。

发明内容

为了解决现有技术的问题,本发明实施例提供了一种问句模板自动生成方法及装置。所述技术方案如下:

第一方面,提供了一种问句模板自动生成方法,所述方法包括:

准备问句日志语料;对所述日志语料进行分词和词性标注;进行命名实体识别和替换;进行语义替换;进行频繁项集挖掘,生成问句模板。

结合第一方面,在第一种可能实现方式中,准备问句日志语料,包括:

获取问句日志语料,并对问句日志语料进行预处理,包括标点符号去除、非法符号去除、单词大小写转换。

结合第一方面,在第二种可能实现方式中,对所述日志语料进行分词和词性标注,包括:

结合行业词典的分词方法对所述日志语料进行分词。

结合第一方面,在第三种可能实现方式中,进行命名实体识别和替换,包括:

对问句日志语料中出现的包括时间、数字和/或地名的通用实体进行命名实体识别,并将所述通用实体替换成对应的实体标签。

结合第一方面,在第四种可能实现方式中,进行语义替换,包括:

将问句日志语料中问句分词后的词通过语义网搜索,根据词的释义将相同或相似释义的词抽象统一为标签,并进行相应替换,生成由命名实体和语义替换后的语义概念构成的符号标签序列。

结合第一方面的第四种可能实现方式,在第五种可能实现方式中,进行频繁项集挖掘,生成问句模板,包括:

通过设定阈值范围,从问句语料日志的候选项集中获得频繁项集,生成问句模板。

结合第一方面的第五种可能实现方式,在第六种可能实现方式中,进行频繁项集挖掘,生成问句模板,包括:

根据预设频次阈值范围和预设项集长度阈值范围,利用预定关联规则算法从所述符号标签序列中筛选频繁项集,按照项的默认顺序形成的序列以生成问句模板。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于众安信息技术服务有限公司,未经众安信息技术服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711436114.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top