[发明专利]基于自然语言处理的银行智能问答系统及其使用方法在审
申请号: | 202011375898.2 | 申请日: | 2020-11-30 |
公开(公告)号: | CN112528652A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 励建科;陈再蝶;朱晓秋;周杰 | 申请(专利权)人: | 浙江康旭科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216;G06F16/35;G06F16/332;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310000 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 自然语言 处理 银行 智能 问答 系统 及其 使用方法 | ||
1.基于自然语言处理的银行智能问答系统的使用方法,其特征在于,包括以下步骤:
S1、数据信息采集:
S11、利用数据采集模块采集业务场景内容信息,业务场景内容信息包括业务问题和与业务问题匹配的答案;
S12、利用数据采集模块采集非业务场景内容信息,非业务场景内容信息的类别分为百科知识类和日常交流类,非业务场景内容信息包括非业务问题和与非业务问题匹配的答案;
S2、数据信息导入:将收集到的业务场景内容信息和非业务场景内容信息进行编码并导入数据库模块,数据库模块存储信息;
S3、业务场景内容与非业务场景内容判定:利用专家规则匹配模块判定客户的问题是否属于业务场景内容,若客户问题属于业务场景内容,则执行以下S3a步骤:
S3a、客户问题属于业务场景内容:
数据库模块匹配出属于业务场景内容问题相应的答案并告知客户;
若客户问题属于非业务场景内容,则执行以下S3b步骤:
S3b、客户问题属于非业务场景内容:
S3b1:利用算法模块匹配出属于非业务场景内容问题相应的答案并告知客户;
S3b11、将数据库模块中非业务场景内容信息整合起来得到语料库,通过Jieba分词器,将整合后的语料库内容中的每个问题进行中文分词;
S3b12、构建TFIDF词向量转换模型得出非业务场景内容信息语料库中每个问题的词向量表达,形成非业务场景内容信息语料库词向量数据集;
S3b13、通过构建朴素贝叶斯分类器模型,将客户的问题进行分类,判断该问题是属于百科知识类还是日常交流类;
S3b14、将该问题的词向量和所属分类的语料库词向量数据集分别利用余弦相似度模型计算,选出相似度值最接近于1的问题,再匹配出相应的回答并回复给客户。
2.根据权利要求1所述的基于自然语言处理的银行智能问答系统的使用方法,其特征在于,在步骤S11中,所述业务场景内容信息包括产品名称、投资类型、投资风格、涨幅、份额净值、基金公司、基金经理、认购费率、追加申购\认购额、首次申购\认购下限、申购费率、最低赎回份额、赎回费率、托管费率、管理费率、投资目标、投资标的、注册资本、管理基金总规模、合作基金数量、法人代表、公司网站、电话号码、公司简介和办公地址。
3.根据权利要求1所述的基于自然语言处理的银行智能问答系统的使用方法,其特征在于,在步骤S11中,所述数据采集模块利用网页抓取方式获取业务场景内容信息。
4.根据权利要求1所述的基于自然语言处理的银行智能问答系统的使用方法,其特征在于,在步骤S12中,所述数据采集模块利用网页抓取方式获取百科知识类内容信息,通过记录整理的方式获取日常交流类内容信息。
5.根据权利要求1所述的基于自然语言处理的银行智能问答系统的使用方法,其特征在于,在步骤S2中,对数据库模块中的数据进行数据缺失值处理,对于业务场景内容信息数据库,统一采取了“资料尚缺”的回复处理,对于非业务场景内容信息的数据库中缺乏回答的问题,采取了删除的方式。
6.根据权利要求1所述的基于自然语言处理的银行智能问答系统的使用方法,其特征在于,在步骤S2中,针对业务场景内容信息,利用专家规则匹配模块对业务场景内容信息中的信息词进行的同义词扩充。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江康旭科技有限公司,未经浙江康旭科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011375898.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种麻鸡保种选育设备
- 下一篇:一种能防止接触不良的智能行程开关