[发明专利]一种基于深度学习辅助生成相似问句的方法有效
申请号: | 202010302501.0 | 申请日: | 2020-04-17 |
公开(公告)号: | CN111209404B | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 王磊 | 申请(专利权)人: | 浙江百应科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/332 |
代理公司: | 杭州浙言专利代理事务所(普通合伙) 33370 | 代理人: | 易朝晖 |
地址: | 311121 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 辅助 生成 相似 问句 方法 | ||
一种基于深度学习辅助生成相似问句的方法,包括以下步骤:S1:在客服系统中进行知识库建表,根据客服系统中的历史问法,对问句进行分词、倒排索引后,存入到开源软件中;S2:对初始问句并进行预处理,并在开源软件中进行搜索,生成拓展问句;S3:对拓展问句进行特征提取,并输入到第一深度学习模型中进行处理;S4:采用第一深度学习模型来判断拓展问句属于哪类标准问题,最后根据结果进行打标;S5:将所述拓展问句作为初始问句来重复步骤S2~S4,将生成的扩展问句的信息传入到第二深度学习模型中以判断拓展问句是否和相似问句属于同一类标准问题。本发明相较于现有技术能够避免人工添加相似问题带来的时间成本,利用多模型融合使得准确率获得提高。
技术领域
涉及数据处理领域,具体涉及一种基于深度学习辅助生成相似问句的方法。
背景技术
虽然网络搜索引擎在如今众多的互联网应用中己经取得了巨大的成就,但其作为人们获取信息的主要手段或多或少还存在着一些不足,具体包括以下几点:(1)通常搜索引擎返回的是与用户查询最相关的若干个网页,用户需要从上到下一个接一个地浏览搜索引擎返回的结果列表,并且看完网页的大部分内容,才能从中归纳总结出真正需要的内容和信息。这样往往会耗费用户大量的时间,并且容易使得用户因为其过于繁琐而产生厌烦;(2)搜索引擎对于关键词查询的处理会使得不熟悉使用搜索引擎的用户,多次提交不同的查询给搜索引擎以期望得到想要的信息,但是这样也会得到很多不需要的信息,给用户在有效地利用搜索引擎帮助其检索信息时带来诸多的不便;(3)目前的搜索引擎大都基于关键词查询,对于用户的输入要先经过分词处理,这样通常会丢失输入的语义信息,导致搜索引擎返回的结果不够准确。
为了解决上面的问题,问答系统应运而生。首先,问答的查询方式为完整而口语化的问句,帮助用户节省精心构造查询条件的时间,并充分利用问句的语义信息;其次,问答系统的返回为高精准度网页结果或明确的答案字串,避免用户花费较多的时间从整个网页中归纳总结出需要的内容信息。由于机器学习在计算机视觉,自然语言处理领域的成功应用,人工智能在近些年得到了快速的发展。而问答系统作为自然语言处理领域的一个重要任务,也得到了越来越多的关注。目前市面上也涌现出了许多领域性的智能问答系统,比如智能客服。通过对客户的问题进行回答,智能客服可以大大减少企业的人力成本。
在现有的智能客服中,首先需要构建知识库,为每个标准问题收集大量的相似问句。当用户提问时,判断哪组的相似问最接近,则将这组标准问题的faq作为当前用户问句的回复。所以知识库中相似问题的积累是整个智能客服的关键。然而单靠客服同学设计相似问题,不仅繁琐,而且会错过最佳时机,采用人工标注的方式需要耗费较长的时间。
例如专利公开布号为CN106599215A(公布日:2017.04.26)的专利公开了一种基于深度学习的问句生成方法和问句生成系统,所述问句生成方法包括:获取种子问句;对所述种子问句进行分词;对经过所述分词的种子问句进行语义词扩展;对经过所述扩展的语义词进行重组生成候选问句;通过预设的语义分类模型对所述候选问句进行语义检测,获取语义正确的候选问句。实施本发明实施例,不仅节省人工,而且提高了生成的问句的准确性。
上述专利提供的方法虽然能够节省人工,但生成的相似问句多样性较为有限,且在准确性上不能满足现有的需求。
发明内容
为了解决上述问题,本发明提供一种基于深度学习辅助生成相似问句的方法,能够避免人工添加相似问题带来的时间成本,拥有更加多样化的相似问句,利用多模型融合是的结果准确率更高。
本发明的技术方案如下所示:
一种基于深度学习辅助生成相似问句的方法,包括以下步骤:
S1:在客服系统中进行知识库建表,根据客服系统中的历史问法,对问句进行分词、倒排索引后,存入到开源软件中;
S2:对初始问句并进行预处理,并在开源软件中进行搜索,返回topN的历史问法,生成拓展问句;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江百应科技有限公司,未经浙江百应科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010302501.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种火箭整流罩分离试验装置
- 下一篇:一种窄带通信系统物理层同步方法及系统