[发明专利]基于语义网和意图识别的人机交互方法、设备及介质在审
申请号: | 202010756664.6 | 申请日: | 2020-07-31 |
公开(公告)号: | CN112069298A | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 嵇望;钱艳;王伟凯;梁青;安毫亿;朱鹏飞;陈默 | 申请(专利权)人: | 杭州远传新业科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F40/211;G06F40/242;G06F40/289;G06F40/35 |
代理公司: | 杭州创智卓英知识产权代理事务所(普通合伙) 33324 | 代理人: | 唐超文 |
地址: | 310051 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语义 意图 识别 人机交互 方法 设备 介质 | ||
1.一种基于语义网和意图识别的人机交互方法,其特征在于,包括以下步骤:
获取行业内的常见问题解答作为交互数据源;
对所述常见问题解答中的标准问题进行语义标注,构建行业语义网络;
获取训练语料,所述训练语料包括所述标准问题、所述标准问题的相似问题及所述标准问题对应的意图标签;
通过所述训练语料训练机器学习模型,得到意图识别分类模型;
接收用户问题,通过所述意图识别分类模型对所述用户问题进行意图识别,得到意图候选集,其中所述意图候选集包括若干意图类别下的标准问题;
基于所述意图候选集,通过所述行业语义网络进行多轮人机交互,确定与所述用户问题意图匹配的标准问题,从所述交互数据源中查询与所述用户问题意图匹配的标准问题的答案,输出所述答案。
2.如权利要求1所述的基于语义网和意图识别的人机交互方法,其特征在于,对所述常见问题解答中的标准问题进行语义标注,构建行业语义网络,包括以下步骤:
根据预先构建的分词词典,对所述标准问题进行分词、词性标注和句法分析,得到所述标准问题中的各分词之间的依存句法关系;
根据语义标注规则,提取所述标准问题中各分词的语义属性,其中所述语义属性包括个体、状语、动作属性、定语和数据属性;
根据所述语义属性,标注所述标准问题中的各分词,得到所述标准问题中的各分词的语义标注结果;
根据所述语义标注结果,按以下查询顺序构建语义网络:查询所述标准问题中的个体,将所述个体作为所述语义网络的节点;查询所述个体对应的动作属性,将所述动作属性作为所述个体的分支节点;查询所述动作属性对应的数据属性和状语,将查询到的数据属性和状语分别作为所述动作属性的分支节点;查询数据属性对应的定语,将查询到的定语作为所述数据属性的分支节点。
3.如权利要求2所述的基于语义网和意图识别的人机交互方法,其特征在于,所述语义标注规则,包括:
动作属性确定规则:若核心词是所述标准问题中的第一个动词,则标记为动作属性;若核心词是非动词时,则查找与所述核心词距离最近的动词标记为动作属性;若核心词不是第一个动词,则查找与所述核心词有直接关系的动词标记为动作属性;
个体确定规则:当所述标准问题的分词数量小于3时,将第一个未被标记的分词标记为个体;当两个未被标记的分词不相连且距离最近时,将第一个未被标记的分词标记为个体;当两个未被标记的分词相连且有修饰关系时,则合并所述两个未被标记且相连的分词并标记为个体;
分词合并规则:当需要合并的分词相连并均未被标记为所述语义属性,且均不为形容词和副词时,将所述标准问题的定中关系和状中关系与被修饰词合并;将与核心词并列的分词与宾语合并;将所述标准问题中的并列宾语合并;当所述标准问题中的动作属性不是核心词时,将核心词和所述核心词的宾语合并;
数据属性确定规则;将所述标准问题的动作属性的宾语标记为数据属性;将所述标准问题中与动作属性有主谓关系的分词标记为数据属性;
定语状语确定规则;将所述标准问题中修饰动作属性的形容词或副词及其他名词修饰语标记为状语;将所述标准问题中修饰数据属性的形容词或副词及其他名词修饰语标记为定语。
4.如权利要求1所述的基于语义网和意图识别的人机交互方法,其特征在于,获取训练语料,包括:
获取所述标准问题以及所述标准问题对应的意图标签;
构建所述标准问题的相似问题,包括以下步骤:
对所述标准问题进行分词和词性标注,提取所述标准问题的名词、动词和个体词;
在通用同义词词典中检索所述名词和所述动词的同义词,通过检索到的同义词依次循环替换对应的所述名词和对应的所述动词,得到若干新语句;
通过语言模型对所述若干新语句进行评分;
将评分排序前N位的新语句中的个体词依次替换成个体同义词词典中的同义词,得到所述标准问题的若干相似问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州远传新业科技有限公司,未经杭州远传新业科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010756664.6/1.html,转载请声明来源钻瓜专利网。