[发明专利]一种基于对话机器人的招生自动问答方法及系统在审
申请号: | 201610001347.7 | 申请日: | 2016-01-05 |
公开(公告)号: | CN105677822A | 公开(公告)日: | 2016-06-15 |
发明(设计)人: | 周建设;李清隐;吕学强 | 申请(专利权)人: | 首都师范大学;北京信息科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100048 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对话 机器人 招生 自动 问答 方法 系统 | ||
技术领域
本发明属于中文自然语言信息处理技术领域,具体涉及一种基于对话机器人的招 生自动问答方法及系统。
背景技术
自动问答系统的研究已有50多年的历史,并成为自然语言处理和信息检索的一个 重要分支和研究热点,自动问答系统已经在各个领域得到了广泛的应用。例如,随着高校生 源的不断增加,考生通常利用高校的招生咨询平台来更全面的了解学校的资源配置,招生 计划,报考要求等信息。高校亦可以全方位的展示学校实力与水平,让考生、家长和社会更 多的了解学校,从而争取到更多更好的生源。然而传统的招生咨询工作面临着许多问题,例 如大部分考生或家长咨询的问题都类似,客服人员重复性的工作浪费了许多人力、财力和 时间资源。随着自然语言处理技术的深入发展与研究,招生问答领域的自动问答机器人应 运而生。
目前用于招生问答的对话机器人,其处理问题的基本流程是:获取用户问题、对用 户问题进行分析并获取用户意图、从语料库中选择相应的问题答案。然而当前的问答机器 人的模式是一问一答,结构单一;而且通常由于语料规模的限制以及对用户查询意图的推 测不准确等问题,并不能对所有的问题给出回答结果,也没有给出相关联的推荐内容。
ALICE(ArtificialLinguisticInternetComputerEntity)是由美国宾西法尼 亚州Lehigh大学的RichardS.Wallace博士开发的一个基于经验的人工智能聊天机器人。 最初版本的ALICE支持英语、德语、法语等语言,却不支持中文。在对ALICE源码进行分析时 发现,其预处理时的筛选机制把汉字排除在外。
发明内容
针对上述现有技术中存在的问题,本发明的目的在于提供一种可避免出现上述技 术缺陷的基于对话机器人的招生自动问答方法及系统。
为了实现上述发明目的,本发明提供的技术方案如下:
一种基于对话机器人的招生自动问答方法,包括以下步骤:
步骤1)获取用户输入的文字;
步骤2)对所述用户输入的文字进行文字处理;
步骤3)根据进行文字处理后的文字,利用模糊匹配方法和内部推理机制从知识库 中选择最佳答案;
步骤4)将所述最佳答案发送给用户。
进一步地,所述知识库为对问答领域的知识内容进行组织并按照AIML语言的规范 构建的知识库。
进一步地,所述步骤2)具体为:利用中文分词解析器对用户输入的文字进行中文 分词处理,并利用哈工大停用词表去除用户输入的文字中的停用词,然后对处理后的文字 进行有效词提取,得到有效词列表。
进一步地,所述中文分词解析器为ICTCLAS分词器。
进一步地,所述步骤3)替换为:根据进行中文分词处理和去除停用词后的文字,利 用模糊匹配的方法以及内部推理机制从所述知识库中选择最佳答案,同时进行本体查询, 从附加知识库中获取所述有效词的上下位信息,其中,所述附加知识库为利用领域本体构 建的领域本体库。
进一步地,所述步骤4)替换为:将所述最佳答案和所述上下位信息发送给用户。
进一步地,进行本体查询,从所述领域本体库中获取所述有效词的上下位信息,该 步骤具体为:将有效词按照权重值从大到小排列,作为本体查询的候选词,从所述领域本体 库中获取所述有效词的上下位信息;其中,所述有效词的所述权重值的计算公式为
公式中,n表示用户输入的文字中的名词,v表示用户输入的文字中的动词,o表示 用户输入的文字中的其他词,i表示用户输入的文字中词的数目,系数α=0.5,β=0.3,γ= 0.2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于首都师范大学;北京信息科技大学,未经首都师范大学;北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610001347.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:展示信息的方法和装置
- 下一篇:PaaS系统中文件的操作处理方法及装置