[发明专利]一种基于云平台的人机交互智能问答方法和系统在审
申请号: | 201810434607.9 | 申请日: | 2018-05-09 |
公开(公告)号: | CN108595696A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 李方敏;尤梦杰;梁小宇;彭小兵;栾悉道;阳超;周舟 | 申请(专利权)人: | 长沙学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G10L15/22;G10L15/08;G10L15/26 |
代理公司: | 武汉臻诚专利代理事务所(普通合伙) 42233 | 代理人: | 宋业斌 |
地址: | 410003 湖南省长*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键词扩展 关键词提取 人机交互 分类结果 文字信息 语音信息 云平台 自然语言处理 分词处理 模糊匹配 使用机器 文字转换 问答系统 学习算法 智能 可扩展 相似度 准确率 分词 算法 抽取 数据库 取出 语音 答案 分类 | ||
1.一种基于云平台的人机交互智能问答方法,其特征在于,包括以下步骤:
(1)获取用户输入的语音信息,对该语音信息执行语音-文字转换,以得到文字信息,对该文字信息进行分词处理,以得到关键词提取结果;
(2)使用机器学习算法对步骤(1)得到的关键词提取结果进行分类,以得到分类结果;
(3)使用自然语言处理算法对步骤(1)得到的关键词提取结果中的动词和名词分别进行关键词扩展,并从动词和名词中每一个的关键词扩展的结果中取出相似度最大的结果,所有结果形成关键词扩展序列;
(4)根据步骤(2)得到的分类结果、以及步骤(3)得到的关键词可扩展序列在本地数据库中进行模糊匹配,并判断是否可以得到至少一个候选问题和答案,如果可以则进入步骤(5),否则进入步骤(6);
(5)先后使用TF-IDF算法和WMD算法对得到的候选问题进行相似度计算,并判断相似度计算结果是否大于预设阈值,如果大于则转入步骤(8),否则转入步骤(6);
(6)在网络搜索引擎中爬取步骤(3)中得到的关键词可扩展序列所对应的多个问题,并根据步骤(2)中得到的分类结果对多个问题进行筛选,以得到对应的候选问题和答案;
(7)先后使用TF-IDF算法和WMD算法对得到的候选问题进行相似度计算;
(8)将得到的计算结果进行降序排列,并向用户输出最大值对应的候选问题所对应的答案,过程结束。
2.根据权利要求1所述的人机交互智能问答方法,其特征在于,对文字信息进行分词处理具体为,在分词工具(例如Jieba分词工具、NLPIR、Ansj、THULAC等)中导入用户词典,对文字信息进行关键词提取,以得到关键词提取结果。
3.根据权利要求1或2所述的人机交互智能问答方法,其特征在于,用户词典是基于TF-IDF算法在数据库中抽取专业词汇得到的,数据库是使用的MySQL数据库,专业词汇是医学美容类相关词汇。
4.根据权利要求1至3中任意一项所述的人机交互智能问答方法,其特征在于,深度学习算法是朴素贝叶斯模型、最大熵模型、支持向量机模型、或决策树模型。
5.根据权利要求1至4中任意一项所述的人机交互智能问答方法,其特征在于,自然语言处理算法是Word2vec模型、GloVe模型、或知网HowNet工具。
6.根据权利要求1至5中任意一项所述的人机交互智能问答方法,其特征在于,本地数据库是通过网络爬虫的方式建立,其每一行包括ID号、对应的类别、对应的关键词序列、对应的候选问题、对应的答案。
7.一种基于云平台的人机交互智能问答系统,其特征在于,包括:
第一模块,用于获取用户输入的语音信息,对该语音信息执行语音-文字转换,以得到文字信息,对该文字信息进行分词处理,以得到关键词提取结果;
第二模块,用于使用机器学习算法对第一模块得到的关键词提取结果进行分类,以得到分类结果;
第三模块,用于使用自然语言处理算法对第一模块得到的关键词提取结果中的动词和名词分别进行关键词扩展,并从动词和名词中每一个的关键词扩展的结果中取出相似度最大的结果,所有结果形成关键词扩展序列;
第四模块,用于根据第二模块得到的分类结果、以及第三模块得到的关键词可扩展序列在本地数据库中进行模糊匹配,并判断是否可以得到至少一个候选问题和答案,如果可以则进入第五模块,否则进入第六模块;
第五模块,用于先后使用TF-IDF算法和WMD算法对得到的候选问题进行相似度计算,并判断相似度计算结果是否大于预设阈值,如果大于则转入第八模块,否则转入第六模块;
第六模块,用于在网络搜索引擎中爬取第三模块中得到的关键词可扩展序列所对应的多个问题,并根据第二模块中得到的分类结果对多个问题进行筛选,以得到对应的候选问题和答案;
第七模块,用于先后使用TF-IDF算法和WMD算法对得到的候选问题进行相似度计算;
第八模块,用于将得到的计算结果进行降序排列,并向用户输出最大值对应的候选问题所对应的答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙学院,未经长沙学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810434607.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法、装置、计算机设备和存储介质
- 下一篇:网页集成方法、装置及系统