[发明专利]人机对话方法、装置、电子设备及计算机存储介质在审
申请号: | 202011241431.9 | 申请日: | 2020-11-09 |
公开(公告)号: | CN114462358A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 王博;周铭吉;李博;韩屹 | 申请(专利权)人: | 中移(上海)信息通信科技有限公司;中移智行网络科技有限公司;中国移动通信集团有限公司 |
主分类号: | G06F40/151 | 分类号: | G06F40/151;G06F40/295;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 彭琼 |
地址: | 201260 上海市浦东新区中国(*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人机对话 方法 装置 电子设备 计算机 存储 介质 | ||
本申请提供了一种人机对话方法、装置、电子设备及计算机存储介质。该基于金融垂直数据知识图谱的人机对话方法,包括:获取用户输入的文本;将文本输入预设的命名实体识别模型,输出第一问句模板;其中,命名实体识别模型包括CRF层和Bi‑LSTM层,CRF层用于对文本进行序列标注,Bi‑LSTM层用于提取文本的语义特征,CRF层和Bi‑LSTM层的权重系数不同;基于第一问句模板,确定预设的问句库中与第一问句模板对应的目标问句模板;基于预设的金融垂直数据知识图谱,生成目标问句模板对应的答案文本。根据本发明的技术方案,能够更加准确地识别文本,进而实现更加准确的人机对话。
技术领域
本申请属于数据业务领域,尤其涉及一种基于金融垂直数据知识图谱的人机对话方法、装置、电子设备及计算机存储介质。
背景技术
传统的人机对话方法,实体识别算法采用特征模板作为CRF的训练输入,其对构成复杂、长度较长的地名和组织机构名无法进行准确识别,导致无法实现准确的人机对话。
因此,如何更加准确地识别文本,进而实现更加准确的人机对话是本领域技术人员亟需解决的技术问题。
发明内容
本申请实施例提供一种基于金融垂直数据知识图谱的人机对话方法、装置、电子设备及计算机存储介质,能够更加准确地识别文本,进而实现更加准确的人机对话。
第一方面,本申请实施例提供一种基于金融垂直数据知识图谱的人机对话方法,包括:
获取用户输入的文本;
将文本输入预设的命名实体识别模型,输出第一问句模板;其中,命名实体识别模型包括CRF层和Bi-LSTM层,CRF层用于对文本进行序列标注,Bi-LSTM层用于提取文本的语义特征,CRF层和Bi-LSTM层的权重系数不同;
基于第一问句模板,确定预设的问句库中与第一问句模板对应的目标问句模板;
基于预设的金融垂直数据知识图谱,生成目标问句模板对应的答案文本。
可选的,将文本输入预设的命名实体识别模型,输出第一问句模板,包括:
对文本进行预处理;
将预处理后的文本输入命名实体识别模型,输出第一问句模板。
可选的,对文本进行预处理,包括:
对文本进行文本格式转换。
可选的,基于第一问句模板,确定预设的问句库中与第一问句模板对应的目标问句模板,包括:
基于相似度算法,确定问句库中第二问句模板和第一问句模板之间的相似度;
判断相似度是否大于预设相似度阈值;
若相似度大于预设相似度阈值,则将第二问句模板确定为目标问句模板。
可选的,方法还包括:
若相似度不大于预设相似度阈值,则对第一问句模板中的非标签词语进行同义词的替换;
基于相似度算法,匹配同义词替换后的第一问句模板的目标问句模板。
可选的,在将文本输入预设的命名实体识别模型,输出第一问句模板之前,方法还包括:
利用训练样本集进行模型训练,得到命名实体识别模型。
可选的,在基于预设的金融垂直数据知识图谱,生成目标问句模板对应的答案文本之前,方法还包括:
构建金融垂直数据知识图谱。
第二方面,本申请实施例提供了一种基于金融垂直数据知识图谱的人机对话装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(上海)信息通信科技有限公司;中移智行网络科技有限公司;中国移动通信集团有限公司,未经中移(上海)信息通信科技有限公司;中移智行网络科技有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011241431.9/2.html,转载请声明来源钻瓜专利网。