[发明专利]基于依存句法分析和汉语语法的多轮语义分析方法有效

专利信息
申请号: 202010934684.8 申请日: 2020-09-08
公开(公告)号: CN111984778B 公开(公告)日: 2022-06-03
发明(设计)人: 周红;刘楚雄 申请(专利权)人: 四川长虹电器股份有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F40/30;G06F40/211;G06F40/295;G06F16/36;G06F16/33
代理公司: 四川省成都市天策商标专利事务所(有限合伙) 51213 代理人: 张秀敏
地址: 621000 四*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 依存 句法 分析 汉语 语法 语义 方法
【说明书】:

发明公开了一种基于依存句法分析和汉语语法的多轮语义分析方法,其特征在于,包括:定义知识图谱实体数据,构成实体库;对文本进行分词得到的词语在不同领域、不同意图下出现的总次数,构成准实时词库;在不同领域、不同意图下分别采用依存句法分析将准实时词库的词语形成一个个短语,并将短语出现的次数按照记忆曲线的规律变化,形成短语的频次;统计同一短语在不同领域下的频次,得到短语在不同领域下的关联程度,得到短语意图搜索库;对用户输入进行多轮语义解析,得到用户意图。本发明利用句法树和汉语言语法重组和重排多轮语句,进而判断领域意图,能够识别多轮任务型对话意图。

技术领域

本发明涉及自然语言处理技术领域,具体的说,是一种基于依存句法分析和汉语语法的多轮语义分析方法。

背景技术

随着人工智能的兴起,自然语言处理作为人工智能领域的一个重要方向,其中多轮的语义解析贯穿整个自然语言理解。目前多轮的语义解析多采用算法生成多轮回复的方式,这种方式更适用于闲聊等非任务型多轮回复,不适用任务型定制多轮回复以及不适用于能够输出中间变量的闲聊。任务型多轮回复,旨在通过与用户的自然语言进行多次交互,得到所需要的信息或解答。任务型对话的意图就是用户想要达到的目标。采用算法生成多轮回复的多轮语义解析方法很难识别任务型对话的意图。

发明内容

本发明的目的在于提供一种基于依存句法分析和汉语语法的多轮语义分析方法,用于解决现有技术中无法识别多轮任务型对话意图的问题。

本发明通过下述技术方案解决上述问题:

一种基于依存句法分析和汉语语法的多轮语义分析方法,包括:

步骤S100:定义知识图谱实体数据,构成实体库,知识图谱实体数据包括标签和标签类别下的词语;

步骤S200:获取每日用户日志数据,每日用户日志数据包含领域、意图、文本和出现的时刻,对文本进行分词并分别统计分词后得到的词语在不同领域、不同意图下出现的总次数,该总次数按照记忆曲线的规律变化,衰减后的总次数加上再次出现的次数作为当前该词语的词频,构成准实时词库;

步骤S300:在不同领域、不同意图下分别采用依存句法分析将准实时词库的词语形成一个个短语,并将短语出现的次数按照记忆曲线的规律变化,形成短语的频次;统计同一短语在不同领域下的频次,得到短语在不同领域下的关联程度,得到短语意图搜索库;

步骤S400:对用户输入进行多轮语义解析,得到用户意图,具体为:

步骤S410:将用户本轮输入和用户上N轮输入均利用依存句法分析方法获得词性和句法关系,将句法关系封装成句法树;

步骤S420:遍历句法树中每个节点,在实体库中查找对应的实体数据;

步骤S430:语句标准化处理;

步骤S440:语句整理,并重新拼接新的句法树:

步骤S450:意图判断,根据语句整理后的拼接的新的句法树,如果主谓宾关系存在,那么匹配成功并且返回当前领域意图及其每个节点的实体参数;如果不存在,判定核心词及其每个节点的关系在该领域意图下是否存在,如果存在,匹配成功,如果有任一节点不存在,匹配下一个领域意图。

所述步骤S430具体包括将把字句、被字句转换为动宾关系并删除介词;以及将否定句、疑问句转化为肯定句,并在返回结果中标识句型。

所述步骤S440包括:

步骤S441语句整理:

用户输入为名词+的:当缺失定语关系的主词时,优先去意图短语库中根据名词或者实体标签+定语关系搜索前N轮的句法树中是否存在主词,若存在,将名词及其子树迁移到主词之下作为其左孩子;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010934684.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top