[发明专利]面向税务咨询业务的智能问答系统有效
申请号: | 201610990193.9 | 申请日: | 2016-11-10 |
公开(公告)号: | CN106649561B | 公开(公告)日: | 2020-05-26 |
发明(设计)人: | 张文强;高恩强;张尚彤;郑骁庆;路红;张睿;陈辰;王洪荣;张超;薛向阳 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F16/9032 | 分类号: | G06F16/9032;G06Q40/00 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 税务 咨询 业务 智能 问答 系统 | ||
本发明属于人工智能技术领域,具体为一种面向税务咨询业务的智能问答系统。该系统包括:一台安装Android操作系统终端设备,一台计算机;所述终端安装有应用软件程序,该应用软件包括语音转化模块、问题返回模块;所述计算机上安装有服务软件系统,该服务软件系统包括问题理解模块、问题检索模块;系统工作时语音转化模块将用户输出的语音数据转化为文本数据,通过问题理解模块进行语义理解,使用问题检索模块检索答案并通过问题返回模块将处理结果传输给终端用户;本发明综合使用语音识别、文本分类、相似度计算等技术,形成在专业领域不完备数据集上进行文本相似匹配的方法,可对纳税人提出问题进行深层次的语义分析,同时应对海量的用户,提供不间断的准确咨询服务,以满足税务咨询的实际需要。
技术领域
本发明属于人工智能技术领域,具体涉及面向税务咨询业务的智能问答系统。
背景技术
随着12366服务热线十多年的快速发展,税务咨询已成为纳税人了解税法和表达诉求的重要方式,但是当前纳税人咨询总量高速增长,问题复杂程度不断加深,热点问题相对集中,仅依靠原有的咨询方式已不能满足纳税人的需求。
税务智能咨询作为问答系统的一种应用,能为海量纳税人提供不间断地在线服务,已逐渐成为未来咨询服务的一种模式。它能够满足政府深化改革、改变角色、提升服务质量的需求,是一种提高回答准确度与用户满意度、提升税务咨询效率、降低税收成本的有效手段。目前税务智能咨询主要采用关键词匹配,缺乏对问题语义的理解,不能满足用户的需求。
发明内容
为克服目前传统方法存在的问题,本发明提出了一种税务咨询业务的智能问答系统。
本发明提出的税务咨询业务的智能问答系统,采用在通用数据库上进行文本相似度匹配的方法,解决了传统模型在不完备数据库上泛化能力过差和专用数据库体量过大的问题。
本发明使用了一个词语移动距离(Word Mover’s Distance,WMD)模型,可以通过计算两个文本之间的距离来计算相似度,有效的提高了对问题语义的理解。本发明使用了一个长短时神经网络(Long-Short Term Memory,LSTM)模型,先对问题分类再计算相似度的方法,这样可以在提高相似度计算准确率的同时,有效缩短计算时间。另外对WMD模型和LSTM网络也进行算法的优化,大大降低了算法的时间复杂度。
本发明提供的税务咨询业务的智能问答系统,包括:
一台安装Android操作系统终端设备,用于采集用户语音问题,并将语音数据实时转化为文本数据传入计算机;还用于将最终匹配的答案返回给用户进行展示;
一台计算机,用于对实时传入的文本问题进行理解检索;
所述终端设备安装有应用软件程序,该应用软件包括语音转化模块1、问题返回模块4,用于采集用户语音数据、为用户提供精准的问题答案、为用户提供友好的界面;
所述计算机上安装有服务软件系统,该处理软件系统包括问题理解模块2、问题检索模块3,用于进行语义分析,以便理解问题,用于检索相似度最高问题;
系统工作时语音转化模块1将用户输出的语音数据转化为文本数据,通过问题理解模块2进行语义理解,使用问题检索模块3检索答案,并通过问题返回模块4将处理结果传输给终端用户。
所述的语音转化模块1,用于完成用户语音信号转化为对应文本的信息的功能,包括通过对用户语音的采集,对语音信息进行特征提取,形成待识别模型,并与参考模型进行匹配,寻找相似度最高的模型并最终输出识别结果;其输入的是语音信息,输出为文本信息。
所述的问题理解模块2,用于完成对文本信息的处理,包括对输入文本进行分词、对文本进行分类、删除文本中包含的停用词等;其输入的是问题文本,输出为特征词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610990193.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种网页正文抽取方法及装置
- 下一篇:一种信息搜索方法及终端