[发明专利]多轮对话系统的指代消解方法有效
申请号: | 202011042444.3 | 申请日: | 2020-09-28 |
公开(公告)号: | CN112183060B | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 张会焱;敖文刚;刘宗敏 | 申请(专利权)人: | 重庆工商大学 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/216;G06F40/284;G06F40/295;G06F40/30;G06F16/35;G06N3/04;G06N3/08;G10L15/22 |
代理公司: | 北京海虹嘉诚知识产权代理有限公司 11129 | 代理人: | 吕小琴 |
地址: | 400067 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 轮对 系统 指代 消解 方法 | ||
本发明提供的一种多轮对话系统的指代消解方法,包括以下步骤:S1.对多轮对话系统所接收到的语句进行检测,判断语句是否需要进行指代消解,如是,则进入到步骤S2中;S2.对确定为需要进行指代消解的语句进行判断,区分语句的指代类型,并从区分出指代类型的语句中筛选出候选实体;语句的指代类型包括回指语句和共指语句;S3.确定候选实体与语句中指代词的距离,并将距离最小的候选实体作为指代链接词;S4.将指代词更新为指代链接词;通过上述方法,能够对输入多轮对话系统的语句的指代进行准确的识别,并进行准确的指代消解,能有效提高多轮交互系统的顺畅性,提升用户体验。
技术领域
本发明涉及人机对话语言处理领域,尤其涉及一种多轮对话系统的指代消解方法。
背景技术
指代是一种常见的语言现象。在多轮对话系统中,指代和省略影响人机对话系统的流畅度和用户体验。人脑具有知识背景和记忆能力,能够很好的重现对话历史的关键信息,自动补全或者替换对方当前轮的代词,来理解对话的真正含义。同样,人机对话系统中需要指代消解模块,来理解用户输入的真正语义。
指代消解方法分为基于管道的方法和基于端到端的方法。基于管道的方法是先进行指代检测,然后再进行指代消解。基于端到端的方法,对输入层编码,通过中间层的计算,输出指代消解结果,常见的基于端到端的方法有基于联合训练的方法、基于序列标注的方法、基于指针网络的方法。基于端到端的方法通常采用深度学习模型,但是需要大量带标签的标注数据,在面对领域数据缺乏时模型构建成本较高,尤其在初期是多轮指代消解标注数据缺乏,且在实际应用中遇到问题,模型修改迭代不满足线上系统的及时性。
因此,为了解决上述技术问题,亟需提出一种新的技术手段加以解决。
发明内容
有鉴于此,本发明的目的是提供一种多轮对话系统的指代消解方法,能够对输入多轮对话系统的语句的指代进行准确的识别,并进行准确的指代消解,能有效提高多轮交互系统的顺畅性,提升用户体验。
本发明提供的一种多轮对话系统的指代消解方法,包括以下步骤:
S1.对多轮对话系统所接收到的语句进行检测,判断语句是否需要进行指代消解,如是,则进入到步骤S2中;
S2.对确定为需要进行指代消解的语句进行判断,区分语句的指代类型,并从区分出指代类型的语句中筛选出候选实体;
S3.确定候选实体与语句中指代词的距离,并将距离最小的候选实体作为指代链接词;
S4.将指代词更新为指代链接词。
进一步,步骤S3中,根据如下方法确定候选实体与语句中指代词的距离:
D=α*(w1*D1+w2*D2);其中,D为候选实体与语句中指代词的距离,α为实体类型与待消解语句的类型匹配度,w1为实体与语句话题关联度系数,w2为实体替换后的句子概率系数,D1为待指代消解的语句的句向量和候选实体之间的语义距离,D2为候选实体与待指代消解语句之间的距离。
进一步,根据如下方法计算类型匹配度α:
其中,PL为指代词的指代类型的预测概率,Pm为候选实体内第m个字的字标签属性概率,k为候选实体中字的个数。
进一步,根据如下方法计算实体与语句话题关联度系数w1:
w1=Pt;其中,Pt为当前语句的话题的前一个话题转移到当前语句的话题的概率。
进一步,所述实体替换后的句子概率系数w2计算方法为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆工商大学,未经重庆工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011042444.3/2.html,转载请声明来源钻瓜专利网。